Sqoop

Fra Wikipedia, den frie encyklopedi
Hopp til navigering Hopp til søk
Apache Sqoop
UtviklerApache Software Foundation
Nyeste versjon1.4.6 / 11. mai 2015; 4 år siden (2015-05-11)
TypeData management
LisensApache License 2.0
Nettstedsqoop.apache.org


Sqoop er en kommandolinje-grensesnitt-programvare for å overføre data mellom relasjonsdatabaser og Hadoop.[1] Det støtter inkrementell lasting av en enkelt tabell eller friforms SQL-spørring såvel som lagrede jobber som kan kjøres mange ganger for å importere oppdateringer gjort i databasen siden sist import. Importer kan også brukes til å populere tabeller i Hive eller HBase.[2] Eksporter kan brukes for å legge inn data fra Hadoop inn i relasjonsdatabaser. Sqoop ble et topp-nivå Apache-prosjekt i mars 2012.[3]

Microsoft bruker en Sqoop-basert forbindelse for å hjelpe til med å overføre data fra Microsoft SQL Server-databaser til Hadoop.[4] Couchbase, Inc. tilbyr også en Couchbase Server-Hadoop forbindelse ved hjelp av Sqoop.[5]

I 2015 beskrev Ralph Kimball Sqoop som følger under overskriften Fremtiden for ETL:[6]

SitatSeveral big changes must take place in the ETL environment. First, the data feeds from original sources must support huge bandwidths, at least gigabytes per second. Learn about Sqoop loading data into Hadoop. If these words mean nothing to you, you have some reading to do! Start with Wikipedia.Sitat

Se også[rediger | rediger kilde]

Referanser[rediger | rediger kilde]

  1. ^ «Hadoop: Apache Sqoop». Besøkt 8. august 2012. 
  2. ^ «Apache Sqoop - Overview». Besøkt 8. august 2012. 
  3. ^ «Apache Sqoop Graduates from Incubator». Besøkt 8. august 2012. 
  4. ^ «Microsoft SQL Server Connector for Apache Hadoop». Besøkt 8. august 2012. 
  5. ^ «Couchbase Hadoop Connector». Arkivert fra originalen 25. august 2012. Besøkt 8. august 2012. 
  6. ^ Kimball, Ralph (1. desember 2015). «Design Tip #180 The Future Is Bright». Kimball Group. Arkivert fra originalen 3. desember 2015. Besøkt 3. desember 2015. «Several big changes must take place in the ETL environment. First, the data feeds from original sources must support huge bandwidths, at least gigabytes per second. Learn about Sqoop loading data into Hadoop. If these words mean nothing to you, you have some reading to do! Start with Wikipedia.» 

Bibliografi[rediger | rediger kilde]

Eksterne lenker[rediger | rediger kilde]