[解決済み] 単一ファイルをコピーする際にhadoop discpの問題が発生する
2022-02-08 17:08:36
質問
(注:並列化するためにdistcpを使用する必要があります。)
user/bhavesh フォルダに2つのファイルがあります。
user/bhavesh1 フォルダにファイルが1つあります。
user/bhavesh から /user/uday フォルダに2ファイルコピー (これは問題なく動作します)
user/uday フォルダが作成されます。
フォルダではなくファイルを作成する場合、/user/bhavesh1 から /user/uday1 フォルダに 1 ファイルをコピーする。
必要なのは、1つのファイルがある場合です。 /user/bhavesh1/emp1.csv を作成する必要があります。 /user/uday1/emp1.csv [uday1はディレクトリとして形成されるべきである]任意の提案やヘルプは非常に高く評価されます。
解決方法は?
unix システムでは、/user/uday1/ で終わるディレクトリ名をコピー先に指定すると、コピー先のディレクトリが作成されますが、hadoop fs -cp コマンドはコピー先のディレクトリがない場合、失敗します。
hdfsのdistcpでは、/で終わるファイル/ディレクトリ名は、単一ファイルであれば無視されます。回避策としては、distcpコマンドを実行する前に宛先ディレクトリを作成することです。-mkdirに-pオプションを追加すると、ディレクトリが既に存在するエラーを回避できます。
hadoop fs -mkdir -p /user/uday1 ; hadoop distcp /user/bhavesh1/emp*.csv /user/uday1/
これは、ソースディレクトリ内の単一ファイルでも複数ファイルでも機能します。
関連
-
[解決済み】なぜHiveのFetchタスクはMapのみのタスクより速く動作するのですか?
-
[解決済み] Apache Hive 小数点以下2桁に四捨五入する方法は?
-
[解決済み] Hadoop-Hiveからテーブルを削除/トランケートする方法は?
-
[解決済み] HbaseのcheckAndPutとcheckAndMutateの違いは何ですか?
-
[解決済み] HADOOPでワード数を値でソートする方法は?[重複している]。
-
[解決済み] HadoopでDatanodeのプロセスが実行されていない
-
[解決済み] ハイブがバケットにデータを挿入する際に作成した小さなファイルをマージする方法は?
-
[解決済み] Hive - Hiveサービスのクラスパスを印刷する方法
-
[解決済み] HiveのRANK OVER機能
-
[解決済み] Facebookのデータ分析ツール「HiPal」とは、どのようなものなのか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】なぜHiveのFetchタスクはMapのみのタスクより速く動作するのですか?
-
[解決済み] hadoop.tmp.dirはどうすればいいのでしょうか?
-
[解決済み] Apache Hive 小数点以下2桁に四捨五入する方法は?
-
[解決済み] コマンドプロンプトからHiveとHadoopのバージョンを知るには?
-
[解決済み] 単一ファイルをコピーする際にhadoop discpの問題が発生する
-
[解決済み] HADOOPでワード数を値でソートする方法は?[重複している]。
-
[解決済み] HDFSのHiveプロキシユーザーの最適なソリューションは何ですか?
-
[解決済み] Pig:FLATTENキーワード
-
[解決済み] curl で --negotiate を使用する場合、keytab ファイルは必要ですか?
-
[解決済み] Facebookのデータ分析ツール「HiPal」とは、どのようなものなのか?