Innholdsfortegnelse:
- Definisjon - Hva betyr PCA (Componental Component Analysis)?
- Techopedia forklarer Principal Component Analysis (PCA)
Definisjon - Hva betyr PCA (Componental Component Analysis)?
Principal component analysis (PCA) er en teknikk som brukes for å identifisere et mindre antall ukorrelerte variabler kjent som hovedkomponenter fra et større datasett. Teknikken er mye brukt for å fremheve variasjon og fange sterke mønstre i et datasett. Oppfunnet av Karl Pearson i 1901, er hovedkomponentanalyse et verktøy som brukes i prediktive modeller og utforskende dataanalyse. Hovedkomponentanalyse blir betraktet som en nyttig statistisk metode og brukt innen felt som bildekompresjon, ansiktsgjenkjenning, nevrovitenskap og datagrafikk.
Techopedia forklarer Principal Component Analysis (PCA)
Hovedkomponentanalyse er med på å gjøre data enklere å utforske og visualisere. Det er en enkel ikke-parametrisk teknikk for å trekke ut informasjon fra komplekse og forvirrende datasett. Hovedkomponentanalyse er fokusert på maksimal variansmengde med færrest antall hovedkomponenter. En av de distinkte fordelene forbundet med hovedkomponentanalysen er at når mønstre først er funnet i de aktuelle dataene, støttes også komprimering av data. Man benytter seg av hovedkomponentanalyse for å eliminere antall variabler eller når det er for mange prediktorer sammenlignet med antall observasjoner eller for å unngå multikollinearitet. Det er nært relatert til kanonisk korrelasjonsanalyse og benytter seg av ortogonal transformasjon for å konvertere settet med observasjoner som inneholder korrelerte variabler til et sett med verdier kjent som hovedkomponenter. Antall hovedkomponenter som brukes i analyse av hovedkomponenter er mindre enn eller lik det færre antall observasjoner. Hovedkomponentanalyse er følsom for relativ skalering av de opprinnelig brukte variablene.
Hovedkomponentanalyse er mye brukt på mange områder som markedsundersøkelser, samfunnsfag og i bransjer der store datasett brukes. Teknikken kan også hjelpe med å gi et lavere dimensjonalt bilde av originaldataene. Bare minimal innsats er nødvendig i tilfelle av hovedkomponentanalyse for å redusere et komplekst og forvirrende datasett til et forenklet nyttig informasjonssett.