Hjem Audio Hvordan kan selskaper bruke tilfeldige skogsmodeller for spådommer?

Hvordan kan selskaper bruke tilfeldige skogsmodeller for spådommer?

Anonim

Q:

Hvordan kan selskaper bruke tilfeldige skogsmodeller for spådommer?

EN:

Bedrifter bruker ofte tilfeldige skogsmodeller for å komme med spådommer med maskinlæringsprosesser. Den tilfeldige skogen bruker flere beslutnings-trær for å lage en mer helhetlig analyse av et gitt datasett.

Et enkelt beslutnings-tre fungerer på grunnlag av å skille en bestemt variabel eller variabler i henhold til en binær prosess. For eksempel ved vurdering av datasett relatert til et sett med biler eller kjøretøyer, kunne et enkelt beslutnings tre sortere og klassifisere hvert enkelt kjøretøy etter vekt, skille dem i tunge eller lette kjøretøyer.

Den tilfeldige skogen bygger på beslutnings-tre-modellen, og gjør den mer sofistikert. Eksperter snakker om tilfeldige skoger som representerer "stokastisk diskriminering" eller "stokastisk gjetting" -metode på data brukt på flerdimensjonale rom. Stokastisk diskriminering har en tendens til å være en måte å forbedre analysen av datamodeller utover hva et enkelt beslutnings tre kan gjøre.

I utgangspunktet skaper en tilfeldig skog mange individuelle beslutningstrær som jobber med viktige variabler med et bestemt datasett brukt. En nøkkelfaktor er at i en tilfeldig skog vil datasettet og variabel analyse av hvert beslutnings tre typisk overlappe hverandre. Det er viktig for modellen, fordi den tilfeldige skogsmodellen tar de gjennomsnittlige resultatene for hvert beslutnings tre, og vurderer dem til en vektet beslutning. I hovedsak tar analysen alle stemmene fra forskjellige beslutnings-trær og bygger en enighet for å gi produktive og logiske resultater.

Et eksempel på bruk av en tilfeldig skogalgoritme produktivt er tilgjengelig på R-blogger-nettstedet, der forfatter Teja Kodali tar eksemplet med å bestemme vinkvalitet gjennom faktorer som surhet, sukker, svoveldioksidnivåer, pH-verdi og alkoholinnhold. Kodali forklarer hvordan en tilfeldig skogalgoritme bruker en liten tilfeldig undergruppe av funksjoner for hvert enkelt tre, og deretter bruker resulterende gjennomsnitt.

Med dette i bakhodet, vil foretak som ønsker å bruke tilfeldige skogsmaskinlæringsalgoritmer for prediktiv modellering, først isolere prediktive data som må kokes ned i et sett produksjoner, og deretter anvende det på den tilfeldige skogsmodellen ved å bruke et visst treningssett data. Maskinlæringsalgoritmer tar de treningsdataene og jobber med dem for å utvikle seg utover begrensningene i den opprinnelige programmeringen. Når det gjelder tilfeldige skogsmodeller, lærer teknologien å danne mer sofistikerte prediktive resultater ved å bruke de individuelle beslutnings-trærne for å bygge sin tilfeldige skogkonsensus.

En måte dette kan brukes på virksomheten, er å ta forskjellige produktegenskapsvariabler og bruke en tilfeldig skog for å indikere potensiell kundeinteresse. For eksempel, hvis det er kjente faktorer for kundeinteresser som farge, størrelse, holdbarhet, portabilitet eller noe annet som kundene har indikert interesse for, kan disse attributtene mates inn i datasettene og analyseres på grunnlag av deres egen unike innvirkning for multifaktor analyse.

Hvordan kan selskaper bruke tilfeldige skogsmodeller for spådommer?