[解決済み] 統計的最頻値の求め方は?
2022-03-22 18:36:10
質問
Rで。
mean()
と
median()
は標準的な関数で、期待通りの働きをします。
mode()
は、引数の中で最も多く出現する値ではなく、オブジェクトの内部記憶モードを教えてくれます。しかし、ベクトル(またはリスト)の統計モードを実装する標準ライブラリ関数はあるのでしょうか?
どのように解決するのですか?
もう一つの解決策は、数値と文字/因子の両方のデータに対して機能することです。
Mode <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
私の小さな小さなマシンでは、10Mの整数ベクトルのモードを約0.5秒で見つけることができるのです。
データセットが複数のモードを持つ可能性がある場合、上記の解決策は、以下のようなアプローチを取ります。
which.max
を返します。
最初に表示される
の値は、モードの集合の を返すには
すべて
モードは、このバリアント(コメント中の@digEmAllから)を使ってください。
Modes <- function(x) {
ux <- unique(x)
tab <- tabulate(match(x, ux))
ux[tab == max(tab)]
}
関連
-
[解決済み] Rの再現性のある優れた例題の作り方
-
[解決済み] データフレームを結合(マージ)する方法(内側、外側、左側、右側)
-
[解決済み] グループ化関数(tapply、by、aggregate)と*applyファミリ
-
[解決済み] Rの代入演算子"="と"<-"の違いは何ですか?
-
[解決済み] 情報を損なわずに因数を整数値に変換するには?
-
[解決済み] 関数のソースコードを見るにはどうしたらいいですか?
-
[解決済み] なぜ `[`] は `subset` よりも優れているのですか?
-
[解決済み] データフレーム内のランダムな行をサンプリングする
-
[解決済み】data.table vs dplyr:一方がうまくできない、またはうまくできないことを行うことができますか?
-
[解決済み】サブセットされたデータフレーム内の未使用の因子レベルを削除する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
R: エラー: $ 演算子は原子ベクトルに対して無効です。
-
[解決策】 plot.new() のエラー:図の余白が大きすぎる。
-
[解決済み] Rで複数行のコメントを持つことは可能ですか?[重複している]。
-
[解決済み] ggplot2 の軸ラベルを回転させ、間隔を空ける
-
[解決済み] リストをデータフレームに変換する
-
[解決済み] 非常に大きなテーブルをデータフレームとして高速に読み込む
-
[解決済み] ベクトル中のxの値を持つ要素の個数を数える
-
[解決済み】ggplot2で軸のタイトルやラベルの大きさを変更する。
-
[解決済み】data.frameのグループごとの平均値【重複】について
-
[解決済み] データフレームのカラムのデータ型を決定する