HiveはHDFSのどこにファイルを保存するのですか?
質問
私は、Hiveテーブルと、それらが表す実際のHDFSファイル(というかディレクトリ)の間のマッピングを見つける方法を知りたいです。私はテーブルファイルに直接アクセスする必要があります。
HiveはHDFSのどこにファイルを保存するのでしょうか?
どのように解決するのですか?
HDFSのどこに保存されているかは、場所を知っていればかなり簡単に分かります :)
もしあなたが
http://NAMENODE_MACHINE_NAME:50070/
のあるページに移動します。
Browse the filesystem
のリンクが表示されます。
には
$HIVE_HOME/conf
ディレクトリに
hive-default.xml
および/または
hive-site.xml
を持つ
hive.metastore.warehouse.dir
プロパティがあります。をクリックした後に移動したいのは、この値です。
Browse the filesystem
のリンクをクリックした後に移動したい場所です。
私の場合、それは
/usr/hive/warehouse
. その場所に移動すると、テーブルの名前が表示されます。テーブル名(これは単なるフォルダですが)をクリックすると、テーブルのパーティションが表示されます。私の場合、現在、パーティションは
date
. このレベルのフォルダをクリックすると、ファイルが表示されます(パーティションが増えると、さらにレベルが上がります)。このファイルが、実際にHDFS上にデータが保存されている場所です。
私はこれらのファイルに直接アクセスしようとしたことはありませんが、それが可能であると仮定しています。編集しようと考えているのであれば、細心の注意を払ってください。)
私としては、ディスク上の Hive データに直接アクセスすることなく、必要なことを行う方法を考えたいと思います。生データにアクセスする必要がある場合は、Hiveクエリを使用して、その結果をファイルに出力することができます。この場合、ファイルは
HDFS
. 私はいつもこのようなクエリを実行し、CSVに変換しています。
クエリのデータをディスクに書き込む方法についてのセクションは https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML#LanguageManualDML-Writingdataintothefilesystemfromqueries
アップデイト
Hadoop 3.0.0 - Alpha 1以降、デフォルトのポート番号に変更があります。 NAMENODE_MACHINE_NAME:50070 は NAMENODE_MACHINE_NAME:9870 に変更されました。 Hadoop 3.xで動作させている場合は、後者を使用してください。 HDFS-9427
関連
-
[解決済み] コマンドプロンプトからHiveとHadoopのバージョンを知るには?
-
コンテナがゼロ以外の終了コード1で終了しました。エラーファイル: prelaunch.err.org.apache.hadoop.mapreduce.
-
[解決済み】Hadoop、HBase、Hive、Pigはいつ使う?
-
[解決済み] HBaseとHadoop/HDFSの違いについて
-
[解決済み] Hiveの内部テーブルと外部テーブルの違い?
-
[解決済み] HADOOP FS」シェルコマンドと「HDFS DFS」シェルコマンドの違いは何ですか?
-
[解決済み] HDFSディレクトリのサイズを確認する方法は?
-
[解決済み] apache sparkはhadoopなしで動きますか?
-
[解決済み] コンテナがメモリの制限を超えて動作している
-
[解決済み] ZooKeeperが起動しているかどうかをコマンドプロンプトから確認する方法は?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Hbase公式ドキュメント(中国語
-
HDFSソースコード解析 --- デコミッション
-
Hadoopデータディレクトリの移行
-
[解決済み】Hadoop、HBase、Hive、Pigはいつ使う?
-
[解決済み] HDFSからローカルファイルシステムにファイルをコピーする方法
-
[解決済み] Hiveでテーブルをパーティショニングすることとバケット化することの違いは何ですか?
-
[解決済み] HADOOP FS」シェルコマンドと「HDFS DFS」シェルコマンドの違いは何ですか?
-
[解決済み] HDFSディレクトリのサイズを確認する方法は?
-
[解決済み] ZooKeeperが起動しているかどうかをコマンドプロンプトから確認する方法は?
-
縮小後の出力ファイルのマージ