Hjem Audio Hva er gruvedrift av tekstdata? - definisjon fra techopedia

Hva er gruvedrift av tekstdata? - definisjon fra techopedia

Innholdsfortegnelse:

Anonim

Definisjon - Hva betyr Text Data Mining?

Mining av tekstdata innebærer å kombinere gjennom et tekstdokument eller en ressurs for å få verdifull strukturert informasjon. Dette krever sofistikerte analyseverktøy som behandler tekst for å skaffe bestemte nøkkelord eller viktige datapunkter fra det som anses som relativt rått eller ustrukturert format.

Tekstdatainnvinning er også kjent som tekstbryting eller tekstanalyse.

Techopedia forklarer Text Data Mining

I gruvedrift av tekstdata bruker konstruerte systemer ting som taksonomier og leksikalsk analyse for å bestemme hvilke deler av et tekstdokument som er verdifulle som utvunnet data. Statistiske modeller er ofte nyttige, og systemer kan også bruke heuristikker, eller algoritmiske gjetninger, for å prøve å bestemme hvilke deler av en tekst som er viktig. Andre kontrollsystemer inkluderer tagging og nøkkelordanalyse, der verktøy ser etter spesifikke riktige substantiv eller andre tagger og nøkkelord for å finne ut hva det blir skrevet om.

En annen unik komponent i tekstbryting kalles ofte sentimentanalyse. I sentimentanalyse, som generelt er mye vanskeligere enn statistisk analyse, prøver analyseverktøy å finne ut stemningen eller stemningen bak den skrevne teksten og andre aspekter av det den tar opp på et veldig subjektivt og intuitivt nivå. Med fremveksten av kunstig intelligensverktøy, har det blitt gjort mye avansement i sentimentanalyse, slik at moderne tekstdatautvikling er mer enn bare å samle inn kvantitative referanser og innebærer å bringe konseptuelle modeller på høyt nivå til tekstbryting for å finne ut nye og unike måter for å samle verdifulle data.

Hva er gruvedrift av tekstdata? - definisjon fra techopedia