HBase和MapReduce

2018-03-30 13:59 更新

HBase和MapReduce

Apache MapReduce 是一個(gè)用于分析大量數(shù)據(jù)的軟件框架。它由 Apache Hadoop 提供。MapReduce 本身超出了本文檔的范圍。開始使用 MapReduce 的好地方是 https://hadoop.apache.org/docs/r2.6.0/hadoop-mapreduce-client/hadoop-mapreduce-client-core/MapReduceTutorial.html。MapReduce 版本2(MR2)現(xiàn)在是 YARN 的一部分。

本章討論在 HBase 中對(duì)數(shù)據(jù)使用 MapReduce 時(shí)需要采取的具體配置步驟。另外,它討論了 HBase 和 MapReduce 作業(yè)之間的其他交互和問題。最后,它討論了Cascading,MapReduce 的另一種 API。

mapred 和 mapreduce

HBase 中有兩個(gè) mapreduce 包,就像 MapReduce 本身一樣:org.apache.hadoop.hbase.mapred 和org.apache.hadoop.hbase.mapreduce。前者使用舊式 API,后者使用新模式。后者有更多的設(shè)施,盡管你通??梢栽谂f的包裝中找到相同的設(shè)備。選擇與MapReduce 部署配合使用的軟件包。如果有疑問或重新開始,請(qǐng)選擇org.apache.hadoop.hbase.mapreduce。在下面的注釋中,我們引用了oahhmapreduce,但是如果這是你正在使用的,則用 oahhmapred 替換。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)