1. ホーム
  2. python

matplotlibの箱ひげ図。マーカと外れ値

2023-11-30 02:16:57

質問

についていくつか質問があります。 ボックスプロット について質問があります。

質問A . で囲んだマーカーは何を意味するのでしょうか? Q1 , Q2 そして Q3 を表しているのでしょうか?私は Q1 が最大で Q3 は外れ値ですが Q2 ?

質問B matplotlibはどのようにして 外れ値 ? (すなわち、どのようにして、それが真の maxmin の値ですか?)

どのように解決するのですか?

からボックスの構成要素を説明する図を示します。 stats.stackexchange の回答 . を与えない場合、k=1.5であることに注意してください。 whis キーワードを指定しない場合は k=1.5 となることに注意してください。

Pandasのboxplot関数のラッパーは matplotlib.pyplot.boxplot . この関数は matplotlib ドキュメント には、ボックスの構成要素が詳細に説明されています。

質問A

箱はデータの下位四分位値から上位四分位値まで伸びており、中央値で線が引かれている。

つまり、入力データの4分の1はボックスの下にあり、データの4分の1はボックスの各部分にあり、残りの4分の1はボックスの上にあることになります。

質問Bです。

whis : float, sequence, or string (デフォルト=1.5)

浮動小数点として、第1、第3四分位を超えるひげの範囲を決定します。 第1、第3四分位を超える範囲です。言い換えれば、IQRが 四分位範囲(Q3-Q1)である場合、上ひげはQ3 + whis*IQR)よりも小さい最後のデータまで拡張されます。 Q3 + whis*IQR)以下となる。同様に、下ひげは はQ1 - whis*IQRより大きい最初のデータまで伸びている。この を超えたデータは外れ値として扱われ、個々の点としてプロットされる。 点としてプロットされる。

Matplotlib(とPandas)は、このデフォルトのひげの定義を変更するための多くのオプションも提供しています。

ひげを強制的に表示させるために、この値を不当に高いものに設定します。 を表示するように強制します。または、パーセンタイルの昇順に設定します。 パーセンタイル(例:[5, 95])に設定すると、ひげをデータの特定の に設定することもできる。最後に、whis に文字列 'range' を指定すると、ひげを強制的に最小値に設定することができます。 を指定すると、ひげをデータの最小値と最大値に設定することができます。