Apache Hadoop

	Apache Hadoop
Fejlesztő	Apache Software Foundation
Legfrissebb stabil kiadás	2.6.2; (2015. október 28.)
Programozási nyelv	Java
Operációs rendszer	platform-független
Platform	Java virtuális gép
Kategória	szoftverkörnyezet
Licenc	Apache Licenc 2.0
	Az Apache Hadoop weboldala

Az Apache Hadoop egy nyílt forráskódú keretrendszer, amely adat-intenzív elosztott alkalmazásokat támogat. Nagy mennyiségű alacsony költségű, általánosan elérhető hardverből épített szerverfürtök építését teszi lehetővé. A Hadoop a Google MapReduce és a Google File System leírásaiból készült.

Történet

A Hadoop projektet Doug Cutting és Mike Cafarella^[1] hozta létre 2005-ben. Cutting, aki akkor a Yahoo!-nál dolgozott, fiának játék elefántjáról nevezte el a projektet.^[2] Eredeti céljuk a Nutch kereső elosztásának támogatása volt.

Architektúra

A Hadoop fő részei:

Hadoop Common, amely a fájlrendszerrel és a operációs rendszerrel kapcsolatos absztrakciókat tartalmazza, valamint azokat a szkripteket és programokat, amelyek a Hadoop rendszer indításához szükségesek
MapReduce rendszer
Hadoop Distributed File System (Hadoop elosztott fájlrendszer)

Fájlrendszerek

HDFS

A HDFS (Hadoop Distributed File System - Hadoop Elosztott Fájlrendszer) egy elosztott, skálázható és hordozható fájlrendszer, amelyet a Hadoop rendszerhez írtak Java nyelven.

Más fájlrendszerek

A Hadoop bármilyen elosztott fájlrendszerrel együtt tud működni, amely az adott operációs rendszeren csatlakoztatható. Ennek ugyanakkor megvan az ára: a hely információk elvesztése. A hálózati forgalom csökkentéséhez a Hadoopnak tudnia kell, melyik szerverek vannak az adathoz közel, ezt az információt tudják a Hadoop-specifikus adapterek megadni.

A támogatott fájlrendszerek között:

Amazon S3 fájlrendszer. Ez azoknak a fürtöknek lehet hasznos, amelyek az Amazon EC2 szolgáltatásán futnak. Ez a fájlrendszer nem veszi figyelembe a rack elhelyezést, mivel távoli eléréssel működik.
maprfs
CloudStore, amely figyelembe veszi a rack elhelyezést
FTP: minden adatot távolról hozzáférhető FTP szervereken tárol
HTTP/HTTPS: egy csak olvasható filerendszer, amely http szerverekről olvas

MapReduce implementáció

Bővebben: MapReduce

Közismert felhasználók

Yahoo!

A Yahoo! 2008 február 19-én indította el a Yahoo! Search Webmap szolgáltatását, amely állításaik szerint 10 000 CPU-maggal a legnagyobb Hadoop-ot futtató linux klaszter a világon. A rendszer által generált adatokat minden Yahoo! keresési eredmény felhasználja.

A Yahoo! több Hadoop fürtöt működtet és a HDFS fájlrendszereit valamint a MapReduce feladatait nem osztja el több adatközponton.

Facebook

2010-ben a Facebook állítása szerint övék volt a legnagyobb Hadoop fürt összesen 21 PB adatkapacitással.^[3] 2011 július 7-én bejelentették, hogy az adatmennyiség 30 PB-ra nőtt, majd 2012 június 13-án 100 PB-ra. A cég 2012 november 8-i bejelentése szerint a Hadoop fürt tárolókapacitása naponta nagyjából fél petabyte-tal nő.

Más felhasználók

Fordítás

Ez a szócikk részben vagy egészben az Apache Hadoop című angol Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

Jegyzetek

↑ Mike Cafarella szakmai életrajza
↑ Hadoop, a Free Software Program, Finds Uses Beyond Search
↑ hadoopblog: Facebook has the world's largest Hadoop cluster!, 2010. május 9. (Hozzáférés: 2015. április 9.)
↑ SAP unveils unified strategz for real-time data management to grow database market leadership Archiválva 2013. szeptember 25-i dátummal a Wayback Machine-ben - sap.com
↑ Building a terabyte-scale data cycle at LinkedIn with Hadoop and Project Voldemort - LinkedIn
↑ Steve Jobs embraces Google's bastard grid child - The Register

Informatikai portál • összefoglaló, színes tartalomajánló lap

Ez az informatikai tárgyú lap egyelőre csonk (erősen hiányos). Segíts te is, hogy igazi szócikk lehessen belőle!

[1] Mike Cafarella szakmai életrajza

[2] Hadoop, a Free Software Program, Finds Uses Beyond Search

[3] : Facebook has the world's largest Hadoop cluster!, 2010. május 9. (Hozzáférés: 2015. április 9.)

[4] SAP unveils unified strategz for real-time data management to grow database market leadership Archiválva 2013. szeptember 25-i dátummal a Wayback Machine-ben - sap.com

[5] Building a terabyte-scale data cycle at LinkedIn with Hadoop and Project Voldemort - LinkedIn

[6] Steve Jobs embraces Google's bastard grid child - The Register

[1]

[2]

[3]

[4]

[5]

[6]

Sablon:Apache m v sz Apache Software Foundation
Felső szintű projektek	Abdera · Accumulo · ActiveMQ · Ambari · Ant · Aries · Apache HTTP Server · APR · Avro · Axis · Axis2 · Bloodhound · Buildr · Camel · Cassandra · Cayenne · Chemistry · Click · CloudStack · Cocoon · Continuum · Cordova · CouchDB · cTAKES · CXF · Deltacloud · Derby · Directory · Empire-db · Felix · Flex · Forrest · Geronimo · Gora · Gump · Hadoop · Hama · HBase · Hive · HBase · Isis · Jackrabbit · James · JMeter · Karaf · Lenya · Mahout · Marmotta · Maven · MINA · mod_perl · MyFaces · ODE · OFBiz · OpenEJB · OpenJPA · OpenNLP · OpenOffice · PDFBox · Phoenix · POI · Pivot · Qpid · River · Roller · Samza · ServiceMix · Shindig · Shiro · Sling · Spark · Stanbol · Storm · SpamAssassin · Struts · Subversion · Sqoop · Tapestry · Tcl · Thrift · Tiles · Tomcat · Trafficserver · Turbine · Tuscany · UIMA · Velocity · Wave · Wicket · Wink · Xalan · Xerces · XMLBeans
Commons projektek	BCEL · BSF · Daemon · Jelly
Lucene projektek	Lucene Java · Lucene.Net · Nutch · Solr
Hadoop projektek	HDFS · HBase · Hive · Pig · Spark · ZooKeeper
Egyéb projektek	Chainsaw · Batik · FOP · Log4j · XAP · Log4Net · Ivy
Incubator projektek	ACE · Composer · JSPWiki · XAP
Nyugdíjazott projektek	AxKit · Beehive · Bluesky · Cactus · Excalibur · Jakarta · Harmony · HiveMind · Slide · Shale · stdcxx · iBATIS · Jakarta
Licenc sztenderdek	Apache Licenc
Apache weboldala · Kategória · Commons