Innholdsfortegnelse:
Definisjon - Hva betyr SQL på Hadoop?
SQL on Hadoop er en type analytisk applikasjonsverktøy - SQL-implementeringen på Hadoop-plattformen, som kombinerer standard SQL-stil spørring av strukturerte data med Hadoop-datarammen. Hadoop er en relativt ny plattform, i likhet med big data i seg selv, og ikke mange fagfolk er eksperter på det, men SQL på Hadoop forenkler tilgangen til Hadoop-rammen og gjør det enklere å implementere på nåværende bedriftssystemer.
Techopedia forklarer SQL på Hadoop
SQL på Hadoop viser til ulike implementeringer av SQL for Hadoop-plattformen. MapReduce, som er Hadoops clusterjobbkortfører og resultatarrangør, støtter SQL som et viktig bruksmål så vel som andre behandlingsmetoder. Derfor er det fornuftig å lage kraftige verktøy for å tillate SQL, som er et av de mest brukte språkene for databasesøk og -manipulering. Ettersom Hadoop får popularitet for bedriftsdataarkitektur, er SQL nøkkel for riktig adopsjon for både løst strukturerte data og strukturerte data som brukes i Hadoop.
SQL på Hadoop nøkkeldrivere inkluderer:
- Utnytte eksisterende SQL-ferdigheter som finnes i de fleste organisasjoner
- Gjenbruk av ekstrakttransformasjonsbelastning (ETL), business intelligence (BI) og investeringer i analytisk infrastruktur i Hadoop
Noen implementeringer av SQL på Hadoop inkluderer:
- Apache Spark SQL
- Apache Hive
- Apache Tajo
- Apache Drill
- HP Vertica på MapR
- ODBC-drivere
- Presto
- Hai
