[解決済み] 凝縮された距離行列のしくみ (pdist)
2023-07-28 15:25:17
質問
scipy.spatial.distance.pdist
は凝縮された距離行列を返す。から
ドキュメント
:
凝縮された距離行列Yを返します。各and (where ) に対して、メトリック dist(u=X[i], v=X[j]) が計算され、エントリijに格納されます。
と思ったら
ij
というのは
i*j
. しかし、私は間違っているかもしれないと思う。考慮する
X = array([[1,2], [1,2], [3,4]])
dist_matrix = pdist(X)
とすると、ドキュメントには
dist(X[0], X[2])
は
dist_matrix[0*2]
. しかし
dist_matrix[0*2]
は0であり、本来あるべき2.8ではありません。
が与えられたとき、2つのベクトルの類似性にアクセスするために使うべき公式は何でしょうか。
i
と
j
?
どのように解決するのですか?
このように見ることができます。 仮に
x
がm×nであるとします。 の可能なペアは
m
の行は、一度に2つずつ選ばれて、次のようになります。
itertools.combinations(range(m), 2)
の場合、例えば
m=3
:
>>> import itertools
>>> list(combinations(range(3),2))
[(0, 1), (0, 2), (1, 2)]
ということは、もし
d = pdist(x)
は、その
k
のタプルは
combinations(range(m), 2))
の行の添字を与える。
x
に関連付けられた
d[k]
.
例です。
>>> x = array([[0,10],[10,10],[20,20]])
>>> pdist(x)
array([ 10. , 22.36067977, 14.14213562])
最初の要素は
dist(x[0], x[1])
であり、2つ目は
dist(x[0], x[2])
で、3番目は
dist(x[1], x[2])
.
あるいは、正方形の距離行列の上三角部分の要素を、1次元の配列につなぎ合わせたものと見ることもできます。
例
>>> squareform(pdist(x))
array([[ 0. , 10. , 22.361],
[ 10. , 0. , 14.142],
[ 22.361, 14.142, 0. ]])
>>> y = array([[0,10],[10,10],[20,20],[10,0]])
>>> squareform(pdist(y))
array([[ 0. , 10. , 22.361, 14.142],
[ 10. , 0. , 14.142, 10. ],
[ 22.361, 14.142, 0. , 22.361],
[ 14.142, 10. , 22.361, 0. ]])
>>> pdist(y)
array([ 10. , 22.361, 14.142, 14.142, 10. , 22.361])
関連
-
[解決済み] 割り当て後にリストが予期せず変更されました。その理由と防止策を教えてください。
-
[解決済み] Pythonでファイルやフォルダを削除する方法は?
-
[解決済み] Pythonの@propertyデコレーターはどのように機能するのでしょうか?
-
[解決済み] Pythonのsuper()は多重継承でどう動くのか?
-
[解決済み] collections.defaultdictはどのように機能するのですか?
-
[解決済み] NumPyでユークリッド距離はどのように計算できますか?
-
[解決済み】Pythonに三項条件演算子はありますか?
-
[解決済み] SQLAlchemy: セッションの作成と再利用
-
[解決済み] python-requests モジュールからのすべてのリクエストをログに記録します。
-
[解決済み] Pythonでリストが空かどうかをチェックする方法は?重複
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] DataFrameの文字列、dtypeがobjectの場合
-
[解決済み] PILからopenCVフォーマットへの変換
-
[解決済み] googletransがエラー 'NoneType' オブジェクトに 'group' 属性がない、と言って動かなくなった。
-
[解決済み] Flask でグローバル変数はスレッドセーフか?リクエスト間でデータを共有するには?
-
[解決済み] Pythonによる一対のクロスプロダクト [重複] (英語)
-
[解決済み] Pandasを使って、既存のExcelファイルに新しいシートを保存する方法は?
-
[解決済み] Pythonでファイルの読み込みと上書きをする
-
[解決済み] Django filter queryset __in for *every* item in list
-
[解決済み] 新しいpip backtrackingの実行時問題の解決
-
[解決済み] 認証プラグイン 'caching_sha2_password' はサポートされていません。