2つのPandasデータフレームの共通行(交差点)を見つける
2023-07-30 20:18:39
質問
このような形式のデータフレームが2つあるとします(これらを
df1
と
df2
):
+------------------------+------------------------+--------+
| user_id | business_id | rating |
+------------------------+------------------------+--------+
| rLtl8ZkDX5vH5nAx9C3q5Q | eIxSLxzIlfExI6vgAbn2JA | 4 |
| C6IOtaaYdLIT5fWd7ZYIuA | eIxSLxzIlfExI6vgAbn2JA | 5 |
| mlBC3pN9GXlUUfQi1qBBZA | KoIRdcIfh3XWxiCeV1BDmA | 3 |
+------------------------+------------------------+--------+
を持つすべての行のデータフレームを取得したいのです。
user_id
で
df1
と
df2
. (すなわち、もし
user_id
が両方の
df1
と
df2
で、その2行を出力データフレームに含めます)
これにアプローチする方法はたくさんありますが、どれも不格好だと思います。例えば、すべての一意な
user_id
を見つけ、それぞれのセットを作成し、それらの交差を見つけ、結果のセットで 2 つのデータフレームをフィルタリングし、フィルタリングされた 2 つのデータフレームを連結することができます。
多分これが最良の方法だと思いますが、Pandasが賢いことは知っています。これを行うより簡単な方法はありますか?私が見たのは
merge
を見ましたが、私はそれが私が必要とするものだとは思いません。
どのように解決するのですか?
私の理解では、この質問に対する答えは このポスト .
しかし、簡単に言えば、この方法によるOPの答えは、簡単に言えば
s1 = pd.merge(df1, df2, how='inner', on=['user_id'])
user_idと、df1とdf2それぞれからの他の2つのカラムの合計5つのカラムを持つs1が得られます。
関連
-
[解決済み] PandasでDataFrameの行を反復処理する方法
-
[解決済み] Pandas DataFrameの特定の列の値がNaNである行を削除する方法
-
[解決済み] pandasを使った "大量データ "ワークフロー【終了しました
-
[解決済み] Pandasのデータフレームから行を選択するために値のリストを使用する
-
[解決済み] groupbyでグループ内の最大値を持つ行を取得する。
-
[解決済み】pandas DataFrameの最後のN行を取得する方法は?
-
[解決済み] SQLAlchemy: セッションの作成と再利用
-
[解決済み] 辞書のキーと値を交換するにはどうすればよいですか?
-
[解決済み] Pandasを使って、既存のExcelファイルに新しいシートを保存する方法は?
-
[解決済み] pandasで2つのデータフレームの行を連結する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] 2つの線分が交差しているかどうかを確認するにはどうすればよいですか?
-
[解決済み] Django のテストデータベースをメモリ上だけで動作させるには?
-
[解決済み] 古いバージョンのPythonにおける辞書のキーの並び順
-
[解決済み] オブジェクトのリストに特定の属性値を持つオブジェクトが含まれているかどうかをチェックする
-
[解決済み] Jupyter (IPython)ノートブックのセッションをpickleして保存する方法
-
[解決済み] Cythonのコードを含むPythonパッケージはどのように構成すればよいのでしょうか?
-
[解決済み] Pythonで、ウェブサイトが404か200かを確認するためにurllibをどのように使用しますか?
-
[解決済み] 単純な文字列からtimedeltaオブジェクトを作成する方法
-
[解決済み] あるメソッドが複数の引数のうち1つの引数で呼び出されたことを保証する
-
[解決済み] PythonのRequestsモジュールを使ってWebサイトに "ログイン "するには?