Innholdsfortegnelse:
Definisjon - Hva betyr kryssvalidering?
Kryssvalidering er en teknikk som brukes for vurdering av hvordan resultatene fra statistisk analyse generaliseres til et uavhengig datasett. Kryssvalidering brukes i stor grad i innstillinger der målet er prediksjon, og det er nødvendig å estimere nøyaktigheten til ytelsen til en prediktiv modell. Den viktigste grunnen til bruk av kryssvalidering snarere enn konvensjonell validering er at det ikke er nok data tilgjengelig for å dele dem inn i separate trenings- og testsett (som i konvensjonell validering). Dette resulterer i et tap av test- og modelleringsevne.
Kryssvalidering er også kjent som rotasjonsestimering.
Techopedia forklarer Cross-Validation
For et prediksjonsproblem er en modell vanligvis forsynt med et datasett med kjente data, kalt treningsdatasettet, og et sett med ukjente data som modellen testes mot, kjent som testdatasettet. Målet er å ha et datasett for testing av modellen i treningsfasen og deretter gi innsikt i hvordan den spesifikke modellen tilpasser seg et uavhengig datasett. En runde med kryssvalidering omfatter deling av data i komplementære undergrupper, og deretter utføre analyse på ett underett. Etter dette blir analysen validert på andre undergrupper (testsett). For å redusere variabiliteten utføres mange runder med kryssvalidering ved bruk av mange forskjellige partisjoner og deretter blir et gjennomsnitt av resultatene tatt. Kryssvalidering er en kraftig teknikk for estimering av modellytelsesteknikk.
