Main Content

MapReduce

Programmiertechnik für die Analyse von Datensätzen, die nicht in den Speicher passen

mapreduce ist eine Programmiertechnik, di für die Analyse von großen Datensätzen ausgelegt ist, für die im Arbeitsspeicher nicht genügend Speicherplatz vorhanden ist. Über datastore können die Daten kleinweise bearbeitet werden. Diese Technik umfasst eine Map-Phase, in welcher die Daten formatiert oder vorläufig berechnet werden, und die sogenannte Reduce-Phase, bei der alle Ergebnisse der Map-Phase aggregiert werden. Weitere Informationen finden Sie unter Getting Started with MapReduce.

Informationen über die Verwendung weiterer Produkte mit mapreduce finden Sie unter Speed Up and Deploy MapReduce Using Other Products.

Funktionen

alle erweitern

mapreduceProgramming technique for analyzing data sets that do not fit in memory
datastoreCreate datastore for large collections of data
addAdd single key-value pair to KeyValueStore
addmultiAdd multiple key-value pairs to KeyValueStore
hasnextDetermine if ValueIterator has one or more values available
getnextGet next value from ValueIterator
mapreducerDefine execution environment for mapreduce or tall arrays
gcmrGet current mapreducer configuration

Objekte

KeyValueStoreStore key-value pairs for use with mapreduce
ValueIteratorAn iterator over intermediate values for use with mapreduce

Themen

Fehlersuche

Debug MapReduce Algorithms

This example shows how to debug mapreduce algorithms in MATLAB®. Debugging enables you to follow the movement of data between the different phases of mapreduce execution and inspect the state of all intermediate variables.