1. ホーム
  2. r

[解決済み] ggplot2 の "stat_summary = mean_cl_boot" の解釈は?

2022-02-28 19:32:12

質問

素朴な疑問 Field's "Discovering Statistics Using R" の532ページにあるようなエラーグラフを作ろうとしたのですが、どうすればいいのでしょうか?

コードはここにあります。 http://www.sagepub.com/dsur/study/DSUR%20R%20Script%20Files/Chapter%2012%20DSUR%20GLM3.R :

line <- ggplot(gogglesData, aes(alcohol, attractiveness, colour = gender))
line + stat_summary(fun.y = mean, geom = "point") + 
stat_summary(fun.y = mean, geom = "line", aes(group= gender)) + 
stat_summary(fun.data = mean_cl_boot, geom = "errorbar", width = 0.2) + 
labs(x = "Alcohol Consumption", y = "Mean Attractiveness of Date (%)", colour = "Gender")  

同じグラフを作りましたが、Y軸の変数は4点しかなく(1-4の離散尺度です)、今はY軸に1.5、2、2.5の点があり、その中で線が変化しています。

そして問題は、これらの点とグラフは何を表しているのか、ということです。 重要なのは、次の部分だと思います。 stat_summary(fun.data = mean_cl_boot, geom = "errorbar", width = 0.2) は、そのグループとそのレベル(X軸)の観測回数なのか?それは度数ですか? それとも比率ですか?

こんなものがありました。 http://docs.ggplot2.org/0.9.3/stat_summary.html しかし、それは私の助けにはなりませんでした

ありがとうございました

解決方法は?

以下は、ggplot2 の 書籍 について、83ページで述べています。 mean_cl_boot()

Function          Hmisc original        Middle Range
mean_cl_boot() smean.cl.boot() Mean Standard error from bootstrap

であると思います。 smean.cl.boot() Hmisc パッケージから mean.cl.boot() ggplot2 では

ここで は、Hmisc パッケージのオリジナル関数の定義です。

smean.cl.boot は,正規性を仮定せずに母平均の信頼限界を得るための基本的なノンパラメトリックブートストラップの非常に高速な実装です。