[解決済み】Rでデータ列を標準化する
2022-04-03 13:54:09
質問
というデータセットがあります。
spam
58列、約3500行のスパムメッセージに関連するデータを含んでいます。
将来的にはこのデータセットに対して線形回帰を実行する予定ですが、事前にいくつかの前処理を行い、列の平均がゼロで分散が単位となるように標準化したいと思います。
Rを使うのが一番いいと言われましたので、お伺いします。 Rでどのように正規化を行うか ? 私はすでにデータを適切にロードしており、このタスクを実行するためのパッケージまたはメソッドを探しています。
どのように解決するのですか?
平均を0、標準偏差を1にしたいということだと思いますが、データがデータフレーム内にあり、すべての列が数値である場合、単純に
scale
関数を使用することで、必要な処理を行うことができます。
dat <- data.frame(x = rnorm(10, 30, .2), y = runif(10, 3, 5))
scaled.dat <- scale(dat)
# check that we get mean of 0 and sd of 1
colMeans(scaled.dat) # faster version of apply(scaled.dat, 2, mean)
apply(scaled.dat, 2, sd)
内蔵された関数を使うのは上品だ。 この猫みたいにね。
関連
-
[解決済み】エラー:私のコードで予期しないシンボル/入力/文字列定数/数値定数/SPECIALが発生した
-
[解決済み】エラー:ベクターメモリの枯渇(制限に達したか) R 3.5.0 macOS
-
[解決済み】長いオブジェクトの長さは、短いオブジェクトの長さの倍数ではない?[重複]。
-
[解決済み】Rでデータフレームのサブセットをプロットする方法は?
-
[解決済み] na.fail.defaultのエラー:オブジェクトの値が見つからない - しかし、値が見つからないことはありません。
-
[解決済み】.External.graphics Rでエラーが発生しました。
-
[解決済み】Rでmax.printの制限値を増やす方法
-
[解決済み] データフレームを結合(マージ)する方法(内側、外側、左側、右側)
-
[解決済み] データフレーム列の名前によるドロップ
-
[解決済み】データフレームから特定の列を抽出する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】model.frame.defaultでのエラー:変数の長さが異なる
-
[解決済み】reshape2 meltの警告メッセージ
-
[解決済み】エラー。Rの'break'の数が無効
-
[解決済み】x[[i]]でのエラー:レベル2で再帰的インデックス作成に失敗した
-
[解決済み】Rエラー。"新しい列は既存の列の後に穴を空ける"
-
[解決済み】R ggplot2 で scale_x_discrete を使用する。
-
[解決済み】RでKNN。trainとclassは長さが違う」?
-
[解決済み】 lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) のエラー : 'y' の NA/NaN/Inf, あらゆる方法を試したが解決しなかった。
-
[解決済み】rbind(deparse.level, ...)でエラー:引数の列の数がRにマッチしていない
-
[解決済み] ヒートマップ作成時のエラー - 外部関数呼び出しでNA/NaN/Inf (arg 11)