Hjem Audio Hvorfor kan noen maskinlæringsprosjekter kreve enormt mange skuespillere?

Hvorfor kan noen maskinlæringsprosjekter kreve enormt mange skuespillere?

Anonim

Q:

Hvorfor kan noen maskinlæringsprosjekter kreve enormt mange skuespillere?

EN:

Når du tenker på maskinlæring, har du en tendens til å tenke på dyktige dataforskere som jobber med tastaturer i datarom. Det er ekstremt vektlagt på kvantitativ analyse og algoritmer. Mange av disse programmene har ikke mye umiddelbar kontekst i verden - i det minste er det hva mange vil tro.

Imidlertid bruker noen av dagens mest banebrytende maskinlæringsprogrammer veritable hærer av menneskelige skuespillere ute på gaten, i butikker og hvor som helst som de kan modellere grunnleggende menneskelige aktiviteter som å gå, jobbe eller shoppe.

Gratis nedlasting: Machine Learning og Why It Matters

En kablet artikkel av Tom Simonite illustrerer dette veldig godt med den treffende tittelen "To Make AI Smarter, Humans Perform Oddball Low-Paid Tasks."

Ved å bruke eksemplet på korte videoer tatt i en dagligvarebutikk Whole Foods, trekker Simonite frem hva slags arbeid som vil bidra til å bygge ut noe av den neste fasen av maskinlæring.

Dette fører til spørsmålet om hvorfor alle disse menneskene er engasjert i å filme seg selv i korte og enkle videoer som dokumenterer handlinger som rudimentære som å bevege en arm eller et bein.

Svaret kaster litt lys over hvor maskinlæring er og hvor den skal.

"Forskere og gründere ønsker å se AI forstå og opptre i den fysiske verdenen, " skriver Simonite og forklarer hvorfor han og andre kjemper med kameraer. "Derfor behovet for at arbeidere skal utføre scener i supermarkeder og hjem. De genererer instruksjonsmateriell for å lære algoritmer om verden og menneskene i den. ”

Som mange eksperter vil påpeke, involverer noen av de største grensene for maskinlæring bildebehandling og naturlig språkbehandling. Dette er ekstremt kvantitative prosedyrer - med andre ord, det er ikke et bredt spekter av innspill som det er i "performante" miljøer i den virkelige verden. I stedet bruker maskinlæringsprogrammene visuelle og lyddata på veldig spesifikke måter for å bygge modeller. Med bildebehandling er det å velge funksjoner fra et (begrenset) synsfelt. For NLP er det montering av fonemer.

Å gå utover disse spesifikke inputkategoriene innebærer noe du kan kalle "bilde- og talegap" - når du går utover ting som bildebehandling og talegjenkjenning, flytter du til områder der datamaskiner må være analytiske på forskjellige måter. Treningssettene vil være grunnleggende forskjellige.

Gå inn i hæren av videografer. I noen av disse nye maskinlæringsprosjektene er de minste ideene om menneskelige aktiviteter opplæringssettene. I stedet for å bli opplært til å se etter funksjoner og kanter og piksler som utgjør i klassifiseringsoppgaver, bruker datamaskiner i stedet treningsvideoer for å vurdere hvordan forskjellige typer handlinger ser ut.

Det viktigste er hva ingeniører kan gjøre med disse dataene når de er samlet og lastet, og når datamaskinen er trent på dem. Du vil snart se resultatene i forskjellige felt - for eksempel vil dette gjøre overvåkingen ekstremt effektiv. Datamaskiner vil være i stand til å "se" i det visuelle feltet hva folk gjør, og anvende det på felt som markedsføring og salg, eller kanskje, i noen tilfeller, myndighetsarbeid eller strafferettspleie.

Avgrensningene legger også litt lys på debatten mellom spørsmål om maksimal nytte og personvern. Mye av bruken av disse videoene vil bygge maskinlæringsmodeller som fungerer for overvåking - men hva med folk som ikke vil bli overvåket? Når disse nye maskinlæringsprogrammene blir distribuert i det offentlige rom, hva er rettighetene til den enkelte, og hvor trekkes den linjen?

I alle fall bruker selskaper disse slags menneskelige og videoressurser for å virkelig grave seg inn i noen neste runder med maskinlæring, som faktisk vil gjøre det mulig for datamaskiner å gjenkjenne hva som skjer rundt dem, i stedet for bare å klassifisere bilder eller jobbe med fonemene til tale. Dette er en ekstremt interessant og kontroversiell utvikling innen kunstig intelligens, og en som fortjener sin andel av oppmerksomhet i tech media og utover.

Hvorfor kan noen maskinlæringsprosjekter kreve enormt mange skuespillere?