About: MapReduce

MapReduce ist ein vom Unternehmen Google Inc. eingeführtes Programmiermodell für nebenläufige Berechnungen über (mehrere Petabyte) große Datenmengen auf Computerclustern. MapReduce ist auch der Name einer Implementierung des Programmiermodells in Form einer Software-Bibliothek.

Property	Value
dbo:abstract	MapReduce ist ein vom Unternehmen Google Inc. eingeführtes Programmiermodell für nebenläufige Berechnungen über (mehrere Petabyte) große Datenmengen auf Computerclustern. MapReduce ist auch der Name einer Implementierung des Programmiermodells in Form einer Software-Bibliothek. Beim MapReduce-Verfahren werden die Daten in drei Phasen verarbeitet (Map, Shuffle, Reduce) von denen zwei durch den Anwender spezifiziert werden (Map und Reduce). Dadurch lassen sich Berechnungen parallelisieren und auf mehrere Rechner verteilen. Bei sehr großen Datenmengen ist die Parallelisierung unter Umständen schon deshalb erforderlich, weil die Datenmengen für einen einzelnen Prozess (und das ausführende Rechnersystem) zu groß sind. Das Programmiermodell wurde durch die in der funktionalen Programmierung häufig verwendeten Funktionen map und reduce inspiriert, auch wenn die Arbeitsweise der Bibliothek davon abweicht. 2010 wurde für MapReduce ein US-Patent erteilt. Der wesentliche Beitrag von MapReduce ist jedoch das zu Grunde liegende System, das die Berechnungen stark parallelisiert, die Reorganisation der Daten im Shuffle-Schritt optimiert, und automatisch auf Fehler im Cluster reagieren kann, wie beispielsweise den Ausfall von kompletten Knoten. (de) MapReduce ist ein vom Unternehmen Google Inc. eingeführtes Programmiermodell für nebenläufige Berechnungen über (mehrere Petabyte) große Datenmengen auf Computerclustern. MapReduce ist auch der Name einer Implementierung des Programmiermodells in Form einer Software-Bibliothek. Beim MapReduce-Verfahren werden die Daten in drei Phasen verarbeitet (Map, Shuffle, Reduce) von denen zwei durch den Anwender spezifiziert werden (Map und Reduce). Dadurch lassen sich Berechnungen parallelisieren und auf mehrere Rechner verteilen. Bei sehr großen Datenmengen ist die Parallelisierung unter Umständen schon deshalb erforderlich, weil die Datenmengen für einen einzelnen Prozess (und das ausführende Rechnersystem) zu groß sind. Das Programmiermodell wurde durch die in der funktionalen Programmierung häufig verwendeten Funktionen map und reduce inspiriert, auch wenn die Arbeitsweise der Bibliothek davon abweicht. 2010 wurde für MapReduce ein US-Patent erteilt. Der wesentliche Beitrag von MapReduce ist jedoch das zu Grunde liegende System, das die Berechnungen stark parallelisiert, die Reorganisation der Daten im Shuffle-Schritt optimiert, und automatisch auf Fehler im Cluster reagieren kann, wie beispielsweise den Ausfall von kompletten Knoten. (de)
dbo:thumbnail	wiki-commons:Special:FilePath/MapReduce2.svg?width=300
dbo:wikiPageExternalLink	http://csl.stanford.edu/%7Echristos/publications/2007.cmp_mapreduce.hpca.pdf http://discoproject.org/ http://hadoop.apache.org/ http://projects.camlcity.org/projects/plasma.html http://skynet.rubyforge.org/ http://www.dbms2.com/2008/08/26/why-mapreduce-matters-to-sql-data-warehousing/ http://www.splunk.com/ http://www.stratosphere.eu/ http://citeseer.ist.psu.edu/546646.html http://citeseer.ist.psu.edu/647742.html http://pages.cs.wisc.edu/~dekruijf/docs/mapreduce-cell.pdf http://portal.acm.org/citation.cfm?doid=1247480.1247602 http://research.microsoft.com/en-us/projects/dryad/default.aspx http://research.microsoft.com/en-us/projects/dryadlinq/ http://www.mathworks.de/discovery/matlab-mapreduce-hadoop.html http://doc.qt.io/qt-5/qtconcurrentmap.html http://research.google.com/archive/mapreduce.html
dbo:wikiPageID	3832994 (xsd:integer)
dbo:wikiPageRevisionID	151619478 (xsd:integer)
dct:subject	category-de:Computercluster category-de:Parallelverarbeitung category-de:Softwarearchitektur category-de:Verteiltes_System category-de:Google
rdfs:comment	MapReduce ist ein vom Unternehmen Google Inc. eingeführtes Programmiermodell für nebenläufige Berechnungen über (mehrere Petabyte) große Datenmengen auf Computerclustern. MapReduce ist auch der Name einer Implementierung des Programmiermodells in Form einer Software-Bibliothek. (de) MapReduce ist ein vom Unternehmen Google Inc. eingeführtes Programmiermodell für nebenläufige Berechnungen über (mehrere Petabyte) große Datenmengen auf Computerclustern. MapReduce ist auch der Name einer Implementierung des Programmiermodells in Form einer Software-Bibliothek. (de)
rdfs:label	MapReduce (de) MapReduce (de)
owl:sameAs	freebase:MapReduce dbr:MapReduce wikidata:MapReduce dbpedia-cs:MapReduce dbpedia-es:MapReduce dbpedia-eu:MapReduce dbpedia-fr:MapReduce dbpedia-it:MapReduce dbpedia-ja:MapReduce dbpedia-ko:MapReduce dbpedia-nl:MapReduce dbpedia-pl:MapReduce dbpedia-pt:MapReduce dbpedia-wikidata:MapReduce
prov:wasDerivedFrom	wikipedia-de:MapReduce?oldid=151619478
foaf:depiction	wiki-commons:Special:FilePath/MapReduce2.svg
foaf:isPrimaryTopicOf	wikipedia-de:MapReduce
is dbo:wikiPageRedirects of	dbpedia-de:Map_Reduce
is foaf:primaryTopic of	wikipedia-de:MapReduce