Hjem Utvikling Hvorfor er maskinskjevhet et problem i maskinlæring?

Hvorfor er maskinskjevhet et problem i maskinlæring?

Anonim

Q:

Hvorfor er maskinskjevhet et problem i maskinlæring?

EN:

Dette spørsmålet kan besvares på to forskjellige måter. For det første, hvorfor er maskinskjevhet problem, som i, hvorfor eksisterer det i maskinlæringsprosesser?

Maskinlæring, selv om den er sofistikert og kompleks, er i en grad begrenset basert på datasettene den bruker. Konstruksjonen av datasettene innebærer iboende skjevhet. Akkurat som i media, der utelatelser og bevisste inkluderingsvalg kan vise en spesiell skjevhet, i maskinlæring, må datasettene som brukes, undersøkes for å bestemme hva slags skjevhet som finnes.

Gratis nedlasting: Machine Learning og Why It Matters

For eksempel er det et vanlig problem for teknologitesting og designprosesser å vise preferanser for en type brukere fremfor en annen. Et stort eksempel er kjønnsforskjellen i teknologiverdenen.

Hvorfor gjør dette en forskjell, og hvorfor gjelder det maskinlæring?

Fordi mangel på eksisterende kvinner i et testmiljø kan føre til en produsert teknologi som er mindre brukervennlig for et kvinnelig publikum. Slik noen eksperter beskriver dette, er at uten eksisterende kvinnelige tester, kan det hende at sluttproduktet ikke anerkjenner innspillet fra kvinnelige brukere - det har kanskje ikke verktøyene til å gjenkjenne kvinnelige identiteter eller til å håndtere innspill fra kvinner på tilstrekkelig måte.

Det samme gjelder for ulike etnisiteter, mennesker av forskjellige religioner eller andre typer demografiske. Uten riktig data vil maskinens læringsalgoritmer ikke fungere riktig for et gitt brukersett, slik at inkluderingsdata bevisst må legges inn i teknologien. I stedet for bare å ta primære datasett og forsterke iboende skjevhet, må menneskelige håndterere virkelig se på problemet.

Et annet eksempel er en maskinlæringsmotor som tar inn informasjon om jobb og lønn og spytter ut resultater. Hvis det iboende datasettet ikke blir analysert, vil maskinen forsterke skjevheten. Hvis den oppfatter at menn besitter det store flertallet av utøvende jobber, og maskinlæringsprosessen innebærer å filtrere gjennom det rå datasettet og returnere tilsvarende resultater, kommer det til å returnere resultater som viser en mannlig skjevhet.

Den andre delen av spørsmålet innebærer hvorfor denne skjevheten er så skadelig. Uten tilstrekkelig tilsyn og testing, kan nye teknologier skade, ikke hjelpe, vår følelse av inkludering og likhet. Hvis et nytt teknisk produkt rulles ut som gjenkjenner ansikter med lysere hud, men ikke mørkere hud, kan det føre til eskalerte etniske spenninger og følelsen av at det aktuelle selskapet ikke er følsomt for mangfold. Hvis en maskinlæringsalgoritme gjengir og øker skjevheten i datasettene, vil den kunstige intelligensen legge stemmen til menneskets stemmene og menneskelige tendenser som allerede eksisterer i det sosiale systemet som favoriserer en gruppe mennesker fremfor en annen.

Den beste måten å håndtere dette på er å se nøye på de underliggende datasettene, bruke valg av funksjoner, legge til variabel input og manipulere de rå datasettene selv, og forbedre den virkelige kraften til maskinlæring med bevisst menneskelig utforming av data, for å få en resultat som gir stor analytisk kraft, men også noe av den menneskelige innsikten som datamaskiner ennå ikke kan kopiere.

Hvorfor er maskinskjevhet et problem i maskinlæring?