[解決済み] Rによるzip圧縮されたデータファイルのダウンロード、抽出、データのインポート
2022-05-18 11:10:04
質問
Twitterで@EZGraphsが書いています。 オンラインのcsvの多くはzip圧縮されています。ダウンロードし、アーカイブを解凍し、R を使って data.frame にデータをロードする方法はありますか?#Rstats"
私も今日これを行おうとしていましたが、結局手動でzipファイルをダウンロードするだけでした。
のようなことをやってみました。
fileName <- "http://www.newcl.org/data/zipfiles/a1.zip"
con1 <- unz(fileName, filename="a1.dat", open = "r")
といった感じですが、まだまだ先のような気がしています。 何かご意見はありませんか?
どのように解決するのですか?
Zip アーカイブは、実際にはコンテンツのメタデータなどを含む 'ファイルシステム' と言えます。以下を参照してください。
help(unzip)
を参照してください。 ですから、上でスケッチしたことを行うには
-
一時ファイル名を作成します (例
tempfile()
) -
使用する
download.file()
を使用して、ファイルを一時ファイルに取り込みます。 -
使用する
unz()
で、temp.ファイルからターゲットファイルを取り出す。 -
を経由してtempファイルを削除します。
unlink()
これはコードでは (基本的な例をありがとう、でもこっちの方が簡単だよ) 次のようになります。
temp <- tempfile()
download.file("http://www.newcl.org/data/zipfiles/a1.zip",temp)
data <- read.table(unz(temp, "a1.dat"))
unlink(temp)
圧縮された (
.z
) または gzip された (
.gz
) または bzip2ed (
.bz2
) ファイルは
というファイルだけです。
で、これらは接続から直接読み込むことができます。 ですから、データプロバイダーが代わりにそれを使うようにしましょう :)
関連
-
8.2 カマグラ(No.31〜No.40)
-
R plot.new() のエラー : 図形の余白が大きすぎる
-
R - ユークリッド距離の計算を簡単にする方法
-
R言語ダウンロード機能 download.fileとダウンロード解析
-
[解決済み] Rの二乗偏差の総和の算出
-
[解決済み] xkcd風のグラフを作るには?
-
[解決済み] 情報を損なわずに因数を整数値に変換するには?
-
[解決済み] 不足しているパッケージをチェックし、インストールするためのエレガントな方法?
-
[解決済み】ZIPファイルを作成すると、ディレクトリ構造を無視するようになる
-
[解決済み] データフレームの列を$と文字値で動的に選択する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
ggplot2 からグリッドと背景色を削除する。
-
R read.table Error:埋め込まれたヌルが含まれているようです。
-
Rのexpand.grid()コマンド
-
[解決済み] 特定のサイズのプロットウィンドウを作成する
-
[解決済み] Rの再現性のある優れた例題の作り方
-
[解決済み] xkcd風のグラフを作るには?
-
[解決済み] リストをデータフレームに変換する
-
[解決済み] データフレームのリストを行単位で1つのデータフレームに結合する
-
[解決済み] ベクトル中のある要素のインデックスを求めるR関数はありますか?
-
[解決済み】安定したマッピングを持つggplot2のカテゴリ変数に色を割り当てるには?