Pythonのリストフィルタリングデータの説明
2022-01-27 15:09:59
データを扱うとき、次の2つのリストのようなリストフィルタリングによく遭遇します。
上のリストのKEY1を元に、下のリストのデータ、つまり黄色く表示されているデータをフィルタリングします。件数が多くなければ、通常はトラバーサル比較で、単純なロジックで、数行のコードで修正できます。
しかし、リストが何万、何百万、何千万となると、トラバーサルの効率が悪くなる。
まずテスト用のリストを構築する。
order_products = pd.read_csv("order_products__prior.csv")
pandasによるトラバーサル、リストジェネレータ+フィルタ、マージの効率性を比較します。
products = pd.read_csv("products.csv")
orders = pd.read_csv("orders.csv")
直接探索生成とリスト生成+フィルタの効率を比較した結果、pandasのマージ効率が最も高いことがわかりました。大きなデータバッチに適しています。
上記コード
aisles = pd.read_csv("aisles.csv")
要約
この記事があなたのお役に立ち、Script Houseの他のコンテンツにもっと注目していただけることを願っています。
関連
-
[解決済み】python + NumPy / SciPyを使用してローリング/移動平均を計算する方法は?
-
Python3 で辞書を操作するとエラーが発生する:反復処理中に辞書のサイズが変更された
-
[解決済み] ビューは HttpResponse オブジェクトを返しませんでした。代わりに None を返しました。
-
[解決済み] pymysql.err.IntegrityError を修正する方法。(1048, "カラム 'ProTitre' cannot be null")" Pythonでエラーを修正するには?
-
[解決済み] numpyの'invalid value encountered in less_equal'の原因は何でしょう?
-
[解決済み] scikit-learnで独自のscorer関数を作成/カスタマイズする方法とは?
-
[解決済み] PyCharmで新しいスクラッチファイルを開くには?
-
[解決済み] shell=True で起動した python サブプロセスを終了させる方法
-
[解決済み] Flask がコンソールにプリントされない
-
import xlrd を実行すると、ModuleNotFoundError というエラーが発生します。xlrd'という名前のモジュールはありません。
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】pip install mysql-python は EnvironmentError: mysql_config not found で失敗します。
-
[解決済み】range使用時の「TypeError: 'float' object cannot be interpreted as integer」の意味とは?
-
python TypeError: Unicode オブジェクトはハッシュ化する前にエンコードする必要がある 解決策
-
[解決済み] Python sqlite3.OperationalError: そのようなテーブルがありません。
-
[解決済み] Tkinterのコールバックで奇妙な例外が発生する
-
[解決済み] Python 3でexecfileの代替?[重複]です。
-
[解決済み] error: option --single-version-externally-managed not recognized "は何を示しているのですか?
-
[解決済み] "IOError "です。[Errno 0] Error" Pythonのエラー
-
[解決済み] Pythonにおけるメソッドと属性の違い
-
Pythonのデータ解析。TypeError: 'float' object is not subscriptable 解決策!!!