[解決済み] 大きなJSONファイルを読み込むためのメモリ効率的で高速な方法はありますか?
2023-06-26 03:09:20
質問
500MBのjsonファイルがあります。
もし私が"trivial"を使用した場合。
json.load()
を使用してその内容を一度に読み込むと、多くのメモリを消費します。
ファイルを部分的に読み込む方法はありますか?テキストで行区切りのファイルだったら、行を反復して読むことができると思うのですが。それに類するものを探しています。
どのように解決するのですか?
アップデート
他の回答を参照してアドバイスを受けてください。
2010年の回答(現在は古くなっています
短い答え:いいえ。
jsonファイルを適切に分割するには、jsonオブジェクトグラフの深い知識が必要です。
しかし、もしこの知識があれば、jsonファイルをラップし、適切なチャンクを吐き出すファイルのようなオブジェクトを実装することができます。
たとえば、jsonファイルがオブジェクトの単一の配列であることを知っている場合、jsonファイルをラップして配列のチャンクを返すジェネレータを作成することができます。
jsonファイルのチャンキングを正しくするために、いくつかの文字列コンテンツのパースを行う必要があります。
何があなたのjsonコンテンツを生成しているのかわかりません。可能であれば、1つの巨大なファイルではなく、いくつかの管理しやすいファイルを生成することを検討します。
関連
-
[解決済み] 大きなファイルを一行ずつ読むには?
-
[解決済み】リストの内容を取り出して、別のリストに追加する
-
[解決済み] 2つの線分が交差しているかどうかを確認するにはどうすればよいですか?
-
[解決済み] バブルソートの宿題
-
[解決済み] Python 2.7サポート終了?
-
[解決済み] 文字列から先頭と末尾のスペースを削除するには?
-
[解決済み] サブフォルダからのインポートモジュール
-
[解決済み] Flask でグローバル変数はスレッドセーフか?リクエスト間でデータを共有するには?
-
[解決済み] PySparkでデータフレームのカラムをString型からDouble型に変更する方法は?
-
[解決済み] 単純な文字列からtimedeltaオブジェクトを作成する方法
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] Flaskで1時間ごとに関数を実行するようにスケジュールするには?
-
[解決済み] タプルのリストを複数のリストに変換するには?
-
[解決済み] Pythonのインスタンス変数とクラス変数
-
[解決済み] Django Rest Framework ファイルアップロード
-
[解決済み] PyMongoで.sortを使用する
-
[解決済み] Cythonのコードを含むPythonパッケージはどのように構成すればよいのでしょうか?
-
[解決済み] Pythonの文字列の前にあるbという接頭辞は何を意味するのですか?
-
[解決済み] djangoのQueryDictをPythonのDictに変更するには?
-
[解決済み] Alembicアップグレードスクリプトでインサートやアップデートを実行するにはどうすればよいですか?
-
[解決済み] かなり大きなJSONファイルの読み込み [重複]。