Innholdsfortegnelse:
Definisjon - Hva betyr testsett?
Et testsett i maskinlæring er et sekundært (eller tertiært) datasett som brukes til å teste et maskinlæringsprogram etter at det har blitt opplært i et opplæringsdatasett. Tanken er at prediktive modeller alltid har en slags ukjent kapasitet som må testes ut, i motsetning til analysert fra et programmeringsperspektiv.
Et testsett er også kjent som et testdatasett eller testdata.
Techopedia forklarer Test Set
Mange eksperter vil si at en god praksis er å ha et testdatasett som er "sekvestert" eller holdt til slutten av prosessen. Ingeniører ser etter overmontering av modellen og andre problemer i treningsprosessen. Ideelt sett er det et tredje sett, et valideringsdatasett, som tester klassifiseringsparametrene. Deretter, og bare da, kan testsettet tas frem for å se hvor godt programmet ble trent og om dets prediktive modell er nøyaktig på nye data. Selv om noen modeller kan unngå å lage et partisjonert testsett helt, blir dette ofte sett på som kortsiktig, fordi mangel på praktisk testing kan forlate et program utsatt for unøyaktighet.