[解決済み】Hadoop、HBase、Hive、Pigはいつ使う?
質問
を使うメリットは何ですか? Hadoop または HBase または ハイブ ?
私の理解では HBase は、Map-Reduceの使用を避け、HDFSの上にカラム指向のストレージを持っています。 ハイブ のSQLライクなインターフェースです。 Hadoop と HBase .
また、どのように ハイブ と比較すると ピッグ .
どのように解決するのですか?
MapReduceは単なる コンピューティングフレームワーク . HBaseは何の関係もない。とはいえ、MapReduceジョブを書けば、HBaseとの間で効率的にデータの出し入れをすることができます。あるいは、Javaなど他のHBase APIを使って逐次プログラムを書き、データを置いたり、取り出したりすることも可能です。しかし、私たちはHadoopやHBaseを使って膨大な量のデータを扱っているので、それではあまり意味がありません。通常のシーケンシャルなプログラムでは、データが巨大になると非常に効率が悪くなります。
質問の最初の部分に戻ると、Hadoopは基本的に次の2つのものです。 分散ファイルシステム(HDFS) + a 計算・処理フレームワーク(MapReduce) . 他のすべてのFSと同様に、HDFSもストレージを提供しますが、フォールトトレラントな方法で、高いスループットと低いデータ損失のリスク(レプリケーションがあるため)を提供します。しかし、FSであるHDFSには、次のような欠点があります。 ランダムな読み書きのアクセス . そこで登場するのがHBaseです。これは 分散型、スケーラブル、ビッグデータストア GoogleのBigTableをモデルにしている。データはキーとバリューのペアで保存されます。
Hiveに至っては。これは私たちにデータを提供します ウェアハウジング を既存のHadoopクラスタの上に置くことができます。それに加えて SQLライク このインターフェースは、あなたがSQLのバックグラウンドを持っている場合、あなたの仕事を容易にします。Hiveでテーブルを作成し、そこにデータを格納することができます。また、既存のHBaseのテーブルをHiveにマッピングして操作することも可能です。
Pigは基本的に データフロー言語 は、膨大な量のデータを非常に簡単かつ高速に処理することを可能にします。Pigは基本的に2つの部分から成ります: Pig インタープリタ と言語があります。 ピグラタン . PigスクリプトをPigLatinで書き、Pigインタプリタを使って処理します。MapReduceを書くのはいつも簡単ではありません。実際、場合によっては本当に苦痛になることもあります。
私が書いたのは Hadoopエコシステムの様々なツールの簡単な比較についての記事です。 少し前のことです。詳細な比較ではありませんが、それぞれのツールの簡単な紹介で、始める際の参考になると思います。 (私の回答に補足するもので、自己宣伝ではありません。)
HiveとPigのクエリは、どちらもフードの下でMapReduceジョブに変換されます。
HTH
関連
-
Hbase公式ドキュメント(中国語
-
HDFSソースコード解析 --- デコミッション
-
Hadoopデータディレクトリの移行
-
コンテナがゼロ以外の終了コード1で終了しました。エラーファイル: prelaunch.err.org.apache.hadoop.mapreduce.
-
Kerberosに関するFailed to find any Kerberos tgt問題を解決する。
-
[解決済み】Hadoop、HBase、Hive、Pigはいつ使う?
-
[解決済み] HDFSからローカルファイルシステムにファイルをコピーする方法
-
[解決済み] Hiveでテーブルをパーティショニングすることとバケット化することの違いは何ですか?
-
[解決済み] HBaseとHadoop/HDFSの違いについて
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Hbase公式ドキュメント(中国語
-
HDFSソースコード解析 --- デコミッション
-
Hadoopデータディレクトリの移行
-
コンテナがゼロ以外の終了コード1で終了しました。エラーファイル: prelaunch.err.org.apache.hadoop.mapreduce.
-
Kerberosに関するFailed to find any Kerberos tgt問題を解決する。
-
[解決済み】Hadoop、HBase、Hive、Pigはいつ使う?
-
[解決済み] HDFSからローカルファイルシステムにファイルをコピーする方法
-
[解決済み] Hiveでテーブルをパーティショニングすることとバケット化することの違いは何ですか?