[解決済み】pandasを使用して相関行列をプロットする
2022-03-30 04:40:58
質問
膨大な数の特徴量を持つデータセットがあるため、相関行列の分析が非常に難しくなっています。以下のような相関行列をプロットしたい。
dataframe.corr()
という関数があります。この行列をプロットするためにpandasライブラリによって提供される組み込み関数はありますか?
どのように解決するのですか?
を使用することができます。
pyplot.matshow()
から
matplotlib
:
import matplotlib.pyplot as plt
plt.matshow(dataframe.corr())
plt.show()
編集する
コメントで、軸の目盛りのラベルを変更したいとの要望がありました。ここでは、より大きな図サイズに描かれ、データフレームにマッチした軸ラベルと、カラースケールを解釈するためのカラーバー凡例があるデラックス版を紹介します。
ラベルの大きさや回転を調整する方法を盛り込み、カラーバーとメインの図が同じ高さになるような図比にしています。
EDIT 2:
df.corr()メソッドが数値以外の列を無視するため。
.select_dtypes(['number'])
xとyのラベルを定義するときに、ラベルの不要なシフトを避けるために使用する必要があります(以下のコードに含まれています)。
f = plt.figure(figsize=(19, 15))
plt.matshow(df.corr(), fignum=f.number)
plt.xticks(range(df.select_dtypes(['number']).shape[1]), df.select_dtypes(['number']).columns, fontsize=14, rotation=45)
plt.yticks(range(df.select_dtypes(['number']).shape[1]), df.select_dtypes(['number']).columns, fontsize=14)
cb = plt.colorbar()
cb.ax.tick_params(labelsize=14)
plt.title('Correlation Matrix', fontsize=16);
関連
-
[解決済み] 関数内でグローバル変数を使用する
-
[解決済み] PandasでDataFrameの行を反復処理する方法
-
[解決済み] Pandasのカラム名のリネーム
-
[解決済み] Pandas DataFrameからカラムを削除する
-
[解決済み] Matplotlibでプロットを表示するのではなく、画像ファイルに保存する。
-
[解決済み] pandasを使った "大量データ "ワークフロー【終了しました
-
[解決済み] pandasのDataFrameをCSVファイルに書き出す
-
[解決済み】forループを使った辞書の反復処理
-
[解決済み】Pandas DataFrameのより多くの列を見るために出力表示を拡大する方法は?
-
[解決済み】Pandas DataframeのカラムでNaN値をゼロに置き換えるには?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
opencvとpillowを用いた顔認証システム(デモあり)
-
Pythonによるjieba分割ライブラリ
-
Pythonコードの可読性を向上させるツール「pycodestyle」の使い方を詳しく解説します
-
Evidentlyを用いたPythonデータマイニングによる機械学習モデルダッシュボードの作成
-
Python LeNetネットワークの説明とpytorchでの実装
-
[解決済み】ilocが「IndexError: single positional indexer is out-of-bounds」を出す。
-
[解決済み】csv.Error:イテレータはバイトではなく文字列を返すべき
-
[解決済み】Python Error: "ValueError: need more than 1 value to unpack" (バリューエラー:解凍に1つ以上の値が必要です
-
[解決済み】Flask ImportError: Flask という名前のモジュールがない
-
[解決済み] pandasのDataFrameからヒートマップを作成する