[解決済み】Pandasのデータフレームをディスクに保存したり、ディスクから読み込んだりする可逆的な方法
2022-04-14 08:12:13
質問
今、私はかなり大きな
CSV
をデータフレームとしてスクリプトを実行するたびに作成します。スクリプトの実行を待つ時間をなくすために、実行の合間にデータフレームを常に利用できるようにする良い解決策はないでしょうか?
解決方法は?
最も簡単な方法は
ピックル
を使用しています。
to_pickle
:
df.to_pickle(file_name) # where to save it, usually as a .pkl
そして、それを使ってロードし直すことができます。
df = pd.read_pickle(file_name)
注意:0.11.1以前
save
と
load
が唯一の方法でした(現在では非推奨で
to_pickle
と
read_pickle
それぞれ)。
も人気です。 HDF5 ( パイテーブルズ を提供しています。 見る見るうちに 大規模なデータセットに対するアクセス時間
import pandas as pd
store = pd.HDFStore('store.h5')
store['df'] = df # save it
store['df'] # load it
より高度な戦略については 料理本 .
0.13以降では、次のようなものもあります。 メッセージパック これは、相互運用性、JSON の高速化、あるいは Python オブジェクトやテキストを多用するデータの場合などに適しています ( この質問 ).
関連
-
[解決済み】django インポートエラー - core.managementという名前のモジュールがない
-
[解決済み] PandasでDataFrameの行を反復処理する方法
-
[解決済み] 列の値に基づいてDataFrameから行を選択するにはどうすればよいですか?
-
[解決済み] Pandas DataFrameからカラムを削除する
-
[解決済み] Pandasのデータフレームで複数の列を選択する
-
[解決済み] Pandas DataFrameの行数を取得する方法は?
-
[解決済み] 一行ずつ追加してPandas Dataframeを作成する
-
[解決済み] Pandasのデータフレームから行を選択するために値のリストを使用する
-
[解決済み] Pandasシリーズ/DataFrame全体をプリティプリントする
-
[解決済み】Pandas DataFrameのカラムヘッダからリストを取得する。
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
python string splicing.join()とsplitting.split()の説明
-
Python カメの描画コマンドとその例
-
pythonサイクルタスクスケジューリングツール スケジュール詳解
-
Python 可視化 big_screen ライブラリ サンプル 詳細
-
[解決済み] データ型が理解できない
-
[解決済み】「SyntaxError.Syntax」は何ですか?Missing parentheses in call to 'print'」はPythonでどういう意味ですか?
-
[解決済み】Python elifの構文が無効です【終了しました
-
[解決済み】 AttributeError("'str' object has no attribute 'read'")
-
[解決済み】LogisticRegression: Pythonでsklearnを使用して、未知のラベルタイプ: '連続'を使用しています。
-
[解決済み] pandasを使った "大量データ "ワークフロー【終了しました