The English encyclopedia Allmultimedia.org will be launched in two phases.
The final launch of the Allmultimedia.org will take place on February 24, 2026
(shortly after the 2026 Winter Olympics).

Analýza hlavních komponent

Z Multimediaexpo.cz

Analýza hlavních komponent (Principal Component Analysis, PCA) je v teorii signálu transformace sloužící k dekorelaci dat. Často se používá ke snížení dimenze dat s co nejmenší ztrátou informace.[1] PCA je možno najít také jako Karhunen-Loèveho transformaci, Hotellingovu transformaci, nebo jako singulární rozklad (SVD; v lineární algebře).

Z následujícího vzorce je vidět, že PCA je jen přepsáním vstupu do jiné souřadné soustavy:

\(Y = X P\)

kde X je centrovaná matice n x d se vstupními d-rozměrnými daty v n řádcích, Y obdobná matice výstupních dat, P je d x d matice vlastních vektorů kovarianční matice \(C_X\) splňující vztah \(C_X = P \Lambda P^T\), kde \(\Lambda\) je diagonální matice obsahující na diagonále vlastní čísla \(C_X\) a matice vlastních vektorů \(P\) je ortonormální, tj. \(P^T P = I_d\), kde \(I_d\) je jednotková matice dimenze \(d\).

Vlastní vektory (sloupce matice P) tvoří onu novou souřadnou soustavu. Centrování matice X dosáhneme odečtením příslušného výběrového průměru od každého sloupce.

Obsah

Odvození

Matice Y je zřejmě také centrovaná, tj. aritmetický průměr každého jejího sloupce je 0.[2]

Spočítáme, jak musí vypadat kovarianční matice nových dat Y:

\(C_Y = E(Y^T Y) = E[(X P)^T (XP)] = E (P^T X^T X P) = P^T E(X^T X) P = P^T C_X P = P^T P \Lambda P^T P = \Lambda.\)

Vzhledem k tomu, že matice \(\Lambda\) je diagonální,

\(C_Y = \Lambda = \left ( \begin{matrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_d \\ \end{matrix}\right ), \)

vidíme, že sloupce matice Y jsou nekorelované a výběrový rozptyl každého sloupce se rovná příslušnému vlastnímu číslu.

Použití

Seřadíme-li vlastní vektory v P podle velikosti vlastních čísel \(\lambda_i\), budeme dostávat složky v Y setříděné podle rozptylu. Pokud chceme snížit dimenzi dat, stačí z Y vzít jen tolik prvních složek kolik uznáme za vhodné. Vybírání komponenty s největším rozptylem nemusí být vždy nejlepší. Například pokud máme rozpoznávat třídy, které se liší právě ve složkách s malým rozptylem, které tímto postupem zahodíme.

Rozpoznávání

V rozpoznávání slouží PCA jako jedna z tzv. Feature Extraction metod (extrakce rysů). Používají ji například kriminalisté pro rozpoznávání obličejů.

Komprese

Jednoduchá komprese barevného nebo multispektrálního obrazu. Využívá vysoké korelace mezi jednotlivými spektrálními kanály a převede obrázek pomocí PCA na jednu nebo několik málo složek s většinou informace.

Související články

Reference

  1. Martin Sebera - FSpS MU - Vícerozměrné statistické metody. www.fsps.muni.cz [online].  [cit. 2022-01-17]. Dostupné online.  
  2. Archivovaná kopie.  [cit. 2022-01-17]. Dostupné online.
     
  3. dimensionality reduction - Relationship between SVD and PCA. How to use SVD to perform PCA?. Cross Validated [online].  [cit. 2022-01-17]. Dostupné online.  

Externí odkazy


Commons nabízí fotografie, obrázky a videa k tématu
Analýza hlavních komponent