Hjem Audio Hvordan kan nye maskinlæringsfunksjoner muliggjøre utvinning av aksjedokumenter for økonomiske data?

Hvordan kan nye maskinlæringsfunksjoner muliggjøre utvinning av aksjedokumenter for økonomiske data?

Anonim

Q:

Hvordan kan nye maskinlæringsfunksjoner muliggjøre utvinning av aksjedokumenter for økonomiske data?

EN:

En av de spennende nye grensene for maskinlæring og AI er at forskere og ingeniører legger ut på forskjellige måter å bruke helt nye typer ressurser på for å forutsi aksjebevegelse og investeringsresultater. Dette er en enorm spillbytter i finansverdenen, og vil revolusjonere investeringsstrategier på en veldig dyp måte.

En av grunnideene for å utvide denne typen aksjeforskning er beregningsspråkvitenskap, som involverer modellering av naturlig språk. Eksperter undersøker hvordan man bruker tekstdokumenter, fra SEC-innleveringer til aksjonærbrev til andre perifere tekstbaserte ressurser, for å utvide eller finjustere aksjeanalyse eller for å utvikle helt nye analyser.

Gratis nedlasting: Machine Learning og Why It Matters

Den viktige ansvarsfraskrivelsen er at alt dette bare gjøres mulig gjennom helt nye fremskritt innen nevrale nettverk, maskinlæring og naturlig språkanalyse. Før bruk av ML / AI brukte datateknologier mest lineær programmering for å "lese" innganger. Tekstdokumenter var for sterkt ustrukturerte til å være nyttige. Men med fremdriften i analysen av naturlige språk i løpet av de siste årene, opplever forskere at det er mulig å "gruve" naturlig språk for kvantifiserbare resultater, eller med andre ord resultater som kan beregnes på noen måte.

Noen av de beste bevisene og mest nyttige eksemplene på dette kommer fra forskjellige avhandlinger og doktorgradsarbeid som er tilgjengelig på nettet. I en artikkel, "Applications of Machine Learning and Computational Linguistics in Financial Economics", publisert april 2016, forklarer Lili Gao kapabelt relevante prosesser som er spesifikke for gruvedrift av SEC-innleveringer, aksjonærsamtaler og meldinger på sosiale medier.

"Å trekke ut meningsfulle signaler fra ustrukturerte og høydimensjonale tekstdata er ikke en lett oppgave, " skriver Gao. "Imidlertid, med utviklingen av maskinlæring og beregningsspråklige teknikker, kan prosessering og statistisk analyse av tekstdokumentoppgaver oppnås, og mange anvendelser av statistisk tekstanalyse i samfunnsfag har vist seg å være vellykkede." Fra Gaos diskusjon om modellering og kalibrering i abstrakt, viser hele det utviklede dokumentet hvordan noen av denne typen analyser fungerer i detalj.

Andre kilder for aktive prosjekter inkluderer sider som dette GitHub-prosjektkortet, og denne IEEE-ressursen som snakker spesifikt om å få verdifull økonomisk informasjon fra "Twitter sentimentanalyse."

Hovedpoenget er at bruken av disse nye NLP-modellene driver rask innovasjon i å bruke alle slags tekstdokumenter, ikke bare for økonomisk analyse, men for andre typer nyskapende funn, som gjør den tradisjonelle etablerte linjen mellom "språk" og "data."

Hvordan kan nye maskinlæringsfunksjoner muliggjøre utvinning av aksjedokumenter for økonomiske data?