Q:
Hvorfor er skalerbar maskinlæring viktig?
EN:Skalerbar maskinlæring er et stort buzzword i maskinlæringsbransjen, blant annet fordi å få maskinlæringsprosesser til skala er et viktig og utfordrende aspekt ved mange maskinlæringsprosjekter.
For eksempel kan det hende at noen mindre maskinlæringsprosjekter ikke trenger å skalere så mye, men når ingeniører overveier ulike typer produktiv modellering, prøver å drive analyse av gigantiske datasett eller prøve å bruke maskinlæring i forskjellige maskinvaremiljøer, kan skalerbarhet betyr alt.
Gratis nedlasting: Machine Learning og Why It Matters |
Skalerbar maskinlæring er viktig når det er tydelig at omfanget av prosjektet vil overgå det opprinnelige oppsettet. Ulike algoritmetilnærminger kan være nødvendig for å hjelpe maskinlæringsprosesser med å matche andre dataanalyseprosesser. Læring av maskiner kan kreve mer ressurser for det samme datasettet.
Når det gjelder verktøyene som brukes, blir Apache Hadoop ofte brukt til ekstremt store datasett, for eksempel omtrent 5 TB. Under dette merket er det andre verktøy på mellomnivå som kan gjøre jobben godt, for eksempel Pandas, Matlab og R. IT-fagpersoner vil matche verktøyene til det nødvendige skalerbarhetsnivået. De vil forstå hvor mye arbeidslæringsprogrammer som må gjøres, og hvordan de må utstyres for å nå disse målene.
Sammen med muligheten til å skalere til mye større sett med data i størrelsesorden flere terabyte, er en annen utfordring med skalerbar maskinlæring å utvikle et system som kan fungere på tvers av flere noder. Noen grunnleggende maskinlæringssystemer er kanskje bare satt opp til å kjøres på en individuell datamaskin- eller maskinvarekomponent. Men når maskinlæringsprosesser må samhandle med flere noder, vil det kreve en annen tilnærming. Å få maskinlæring til å jobbe i en distribuert arkitektur er en annen viktig del av skalerbar maskinlæring. Vurder en situasjon der maskinlæringsalgoritmer må få tilgang til data fra dusinvis eller til og med hundrevis av servere - dette kommer til å kreve betydelig skalerbarhet og allsidighet.
En annen driver for skalerbar maskinlæring er prosessen med dyp læring, der ingeniører og interessenter kan få flere resultater fra å gå dypere i datasett og manipulere dem på mer dyptgående måter. Prosjekter med dyp læring er et utmerket eksempel på hvordan selskaper kan trenge å ta i bruk skalerbar maskinlæringsstrategi for å oppnå den evnen de trenger. Når dyp læring fortsetter å utvikle seg, vil det legge press på maskinlæringssystemer for å skalere mer effektivt.