[解決済み】変数をグループ別に合計する方法
2022-03-24 12:03:32
質問
2つの列を持つデータフレームがあります。最初の列には、"First", "Second", "Third" などのカテゴリがあり、2番目の列には、"Category" から特定のグループを見た回数を表す数字が書かれています。
例えば
Category Frequency
First 10
First 15
First 5
Second 2
Third 14
Third 20
Second 3
データをCategoryでソートして、すべてのFrequenciesを合計したいのですが。
Category Frequency
First 30
Second 5
Third 34
Rでこれを行うにはどうしたらよいでしょうか?
どのように解決するのですか?
使用方法
aggregate
:
aggregate(x$Frequency, by=list(Category=x$Category), FUN=sum)
Category x
1 First 30
2 Second 5
3 Third 34
上記の例では、複数のディメンジョンを
list
. 同じデータ型の複数の集約されたメトリクスは、以下の方法で組み込むことができます。
cbind
:
aggregate(cbind(x$Frequency, x$Metric2, x$Metric3) ...
(@thelatemail のコメントを埋め込む)。
aggregate
は数式インターフェースも持っています
aggregate(Frequency ~ Category, x, sum)
また、複数のカラムを集計したい場合は
.
という記法があります(1列でも使えます)。
aggregate(. ~ Category, x, sum)
または
tapply
:
tapply(x$Frequency, x$Category, FUN=sum)
First Second Third
30 5 34
このデータを使って
x <- data.frame(Category=factor(c("First", "First", "First", "Second",
"Third", "Third", "Second")),
Frequency=c(10,15,5,2,14,20,3))
関連
-
[解決済み] PandasでDataFrameの行を反復処理する方法
-
[解決済み] 列の値に基づいてDataFrameから行を選択するにはどうすればよいですか?
-
[解決済み] Rの再現性のある優れた例題の作り方
-
[解決済み] データフレームを結合(マージ)する方法(内側、外側、左側、右側)
-
[解決済み] データフレームの行を複数の列でソート(並び替え)する。
-
[解決済み] 既存のDataFrameに新しい列を追加する方法は?
-
[解決済み] 複数の列でグループ化する
-
[解決済み] pandas GroupByを使ってグループごとの統計情報(カウント、平均値など)を取得する?
-
[解決済み] apply()関数を1つの列に対して使用するにはどうすればよいですか?
-
[解決済み] pandasのデータフレームを1つの列からソートする方法
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】基本 - T-検定 -> グループ化因子は正確に2水準でなければならない
-
[解決済み】 boxplotに色を追加する - "離散的なスケールに連続的な値が供給される "エラー
-
[解決済み】長いオブジェクトの長さは、短いオブジェクトの長さの倍数ではない?[重複]。
-
[解決済み】 if/while (条件) {: TRUE/FALSEが必要な場所に値がない場合のエラー
-
[解決済み】ggplot2でのプロット:「Error: カテゴリ軸のY軸に "Discrete value supplied to continuous scale "と表示される。
-
[解決済み】Rでmax.printの制限値を増やす方法
-
[解決済み】Rで相対的な頻度をプロットするためにhistをどのように使用しますか?
-
[解決済み】'NULL'型の非(リストまたはベクトル)に適用されるis.na()は何を意味するのか?
-
[解決済み】起動時にパーをデフォルト値にリセットする方法
-
[解決済み】Rで「中断されたプロミスの評価を再開する」という警告を回避する