Hjem databaser Hva er parallell dataanalyse? - definisjon fra techopedia

Hva er parallell dataanalyse? - definisjon fra techopedia

Innholdsfortegnelse:

Anonim

Definisjon - Hva betyr parallell dataanalyse?

Parallell dataanalyse er en metode for å analysere data ved hjelp av parallelle prosesser som kjøres samtidig på flere datamaskiner.

Prosessen brukes i analysen av store datasett som store telefonsamtaleoppføringer, nettverkslogger og nettdatabaser for tekstdokumenter som kan være for store til å bli plassert i en enkelt relasjonsdatabase. Metoden brukes ofte i Big Data Analytics og generell dataanalyse.

Techopedia forklarer Parallel Data Analyse

Det primære konseptet bak parallell dataanalyse er parallellisme, definert i databehandling som samtidig utførelse av prosesser.

Dette oppnås ofte ved å bruke flere prosessorer eller til og med flere datamaskiner og er en vanlig praksis innen distribuert databehandling. I den parallelle analysen av data, utfører forskjellige datamaskiner som utfører forskjellige aspekter av dataanalysen disse prosessene samtidig og konsoliderer senere resultatene til en stor rapport.

Årsaken til denne parallellen er hovedsakelig å gjøre analysene raskere, men det er også fordi noen datasett kan være for dynamiske, for store eller rett og slett for uhåndterlige til å bli plassert effektivt i en enkelt relasjonsdatabase. Resultatet vil være at disse datasettene er plassert i forskjellige databaser optimalisert for den typen data og i forskjellige maskiner, så lineær analyse vil ganske enkelt ikke være et effektivt alternativ.

Hva er parallell dataanalyse? - definisjon fra techopedia