Hjem trender Hva er bedre, en plattform eller bringe din egen maskinlæringsalgoritme på aws?

Hva er bedre, en plattform eller bringe din egen maskinlæringsalgoritme på aws?

Anonim

Q:

Hva er bedre, en plattform eller bringe din egen maskinlæringsalgoritme på AWS?

EN:

I disse dager integrerer mange selskaper maskinlæringsløsninger i sitt analytiske verktøysett for å forbedre merkevareadministrasjonen, forbedre kundeopplevelsen og øke driftseffektiviteten. Maskinlæringsmodeller er kjernen i komponentene for maskinlæring. Modeller trenes ved bruk av matematiske algoritmer og store datasett for å lage pålitelige prediksjoner. To vanlige eksempler på spådommer er (1) å bestemme om et sett med økonomiske transaksjoner indikerer svindel eller (2) å vurdere forbrukersentiment rundt et produkt, basert på innspill samlet inn fra sosiale medier.

Amazon SageMaker er en fullstendig administrert tjeneste som lar utviklere og dataforskere bygge, trene og distribuere maskinlæringsmodeller. I SageMaker kan du bruke ut-av-boksen-algoritmer eller gå med din egen vei for en mer tilpasset løsning. Begge valgene er gyldige og fungerer like godt som grunnlaget for en vellykket løsning for maskinlæring.

(Redaktørens merknad: Du kan se andre alternativer til SageMaker her.)

SageMakers ut-av-boksen-algoritmer inkluderer populære, svært optimaliserte eksempler for bildeklassifisering, naturlig språkbehandling, etc. Den komplette listen finner du her .

  • Fordeler utenfor boksen: Disse algoritmene er forhåndsoptimalisert (og gjennomgår kontinuerlig forbedring). Du kan være oppe, løpe og distribuere raskt. I tillegg er AWS automatisk hyperparameterinnstilling tilgjengelig.
  • Hensyn utenom boksen: De kontinuerlige forbedringene som er nevnt over, gir kanskje ikke resultater så forutsigbart som om du hadde full kontroll over implementeringen av algoritmene dine.

Hvis disse algoritmene ikke er egnet for prosjektet ditt, har du tre andre valg: (1) Amazons Apache Spark Library, (2) tilpasset Python-kode (som bruker TensorFLow eller Apache MXNet) eller (3) “ta med din egen” der du er i det vesentlige ubegrensede, men må lage et Docker-bilde for å trene og tjene modellen (du kan gjøre det ved å bruke instruksjonene her ).

Ta med din egen tilnærming gir deg full frihet. Dette kan vise seg å være attraktivt for dataforskere som allerede har bygget opp et bibliotek med tilpasset og / eller proprietær algoritmisk kode som kanskje ikke er representert i det nåværende settet utenfor boksen.

  • Bring-Your-Own Fordeler: Gjør det mulig å kontrollere hele datavitenskapens rørledning sammen med bruk av proprietær IP.
  • Ta med dine egne hensyn: Dockerization er nødvendig for å trene og tjene den resulterende modellen. Å inkludere algoritmiske forbedringer er ditt ansvar.

Uansett hvilket algoritmevalg du er, er SageMaker på AWS en tilnærming verdt å vurdere, gitt hvor mye fokus som er lagt på brukervennlighet fra et datavitenskapelig perspektiv. Hvis du noen gang har forsøkt å migrere et maskinlæringsprosjekt fra ditt nærmiljø til et vertskap, vil du bli overrasket over hvor sømløs SageMaker gjør det. Og hvis du begynner fra bunnen av, er du allerede flere trinn nærmere målet ditt, gitt hvor mye som allerede er innen fingertuppene.

Hva er bedre, en plattform eller bringe din egen maskinlæringsalgoritme på aws?