[解決済み] Pandasのread_csv関数で、読み込み時に行をフィルタリングするには？

2022-08-25 07:54:52

質問

pandasを使用して、メモリにロードするCSVの行をフィルタリングするにはどうすればよいですか？このオプションは read_csv . 私は何かを見逃していますか？

例：タイムスタンプ列を持つCSVがあり、タイムスタンプがある定数より大きい行だけを読み込みたいのですが、どうすればいいですか？

どのように解決するのですか？

CSVファイルをpandasオブジェクトに読み込む前に、行をフィルタリングするオプションがありません。

ファイルを読み込んでから、フィルタリングを行うには df[df['field'] > constant] または、ファイルが非常に大きく、メモリ不足が心配な場合は、イテレータを使用して、ファイルのチャンクを連結する際にフィルタを適用します。

import pandas as pd
iter_csv = pd.read_csv('file.csv', iterator=True, chunksize=1000)
df = pd.concat([chunk[chunk['field'] > constant] for chunk in iter_csv])

を変化させることができます。 chunksize を利用可能なメモリに合わせて変更することができます。参照を参照してください。をご覧ください。

[解決済み] Pandasのread_csv関数で、読み込み時に行をフィルタリングするには？

質問

どのように解決するのですか？

関連

[解決済み] 関数デコレータを作成し、それらを連鎖させるには？

[解決済み] Pythonで辞書に新しいキーを追加するにはどうすればよいですか？

[解決済み] PandasでDataFrameの行を反復処理する方法

[解決済み] 割り当て後にリストが予期せず変更されました。その理由と防止策を教えてください。

[解決済み] Windowsにpipをインストールするにはどうしたらいいですか？

[解決済み] Pandas DataFrameの行数を取得する方法は？

[解決済み] pandasを使った "大量データ "ワークフロー【終了しました

[解決済み】ネストされたディレクトリを安全に作成するには？

[解決済み] SQLAlchemy: セッションの作成と再利用

[解決済み] スペースがないテキストを単語のリストに分割する方法

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

[解決済み] pandas: DataFrameの行をオペレータチェーンでフィルタリングする

[解決済み] Djangoで2つの日付の間を選択する

[解決済み] バブルソートの宿題

[解決済み] SQLAlchemy: 日付フィールドをフィルタリングする方法は？

[解決済み] データフレームをソートした後にインデックスを更新する

[解決済み] SQLAlchemy - テーブルのリストを取得する

[解決済み] 異なる順序で同じ要素を持つ2つのJSONオブジェクトを等しく比較するには？

[解決済み] Pythonの検索パスを他のソースに展開する

[解決済み] Pythonでランダムなファイル名を生成する最良の方法

[解決済み] djangoのQueryDictをPythonのDictに変更するには？