[解決済み] スプレッドシートデータを用いたRでの線形モデルの実行
2022-02-02 21:29:05
質問
年齢や性別など様々な変数を持つa型とb型の106人の個人からなるデータセットがあります。共変量に基づいて、各個人がタイプaかタイプbかを予測する線形モデルを実行したいのです。
各個人の年齢、性別、タイプラベルの値を読み込んでいます。
`data = read.xlsx("spreadsheet.xlsx",2, as.is = TRUE)`
age = data$age
gender = data$gender
type = data$type
ここで、それぞれは以下のような形式です。
age = [28, 30, 19, 23 etc]
gender = [male, male, female, male etc]
type = [a b b b]
そして、それを使ってモデルをセットアップしてみる。
model1 = lm(type ~ age + gender)
が、このようなエラーメッセージが表示されます。
Warning messages:
1: In model.response(mf, "numeric") :
using type="numeric" with a factor response will be ignored
2: In Ops.factor(y, z$residuals) : - not meaningful for factors
を使って、タイプ、年齢、性別の書式を変えてみました。
age = as.numeric(as.character(age))
gender = as.character(gender)
type = as.character(type)
しかし、これではうまくいきません
どうすればいいですか?
あなたがここで行おうとしているような、因子を応答変数とする線形回帰モデルは使用できません(typeが応答変数です)。回帰モデルには、数値の応答変数が必要です。代わりに、分類モデルを検討する必要があります。
ローランドが指摘するように、quot;type"変数を論理的な二項変数として再定義することから始めるとよいでしょう。2つのレベルquot;a"とquot;b"を持つ"type"という因子ではなく、新しい変数、TRUEまたはFALSEを含む"is.type.a"を作成するとよいかもしれません。
そして、二項分布に基づくロジスティック回帰を試すことができます。
model <- glm(is.type.a ~ age + gender,data=data,family="binomial")
関連
-
[解決済み] 不適合な配列のコードエラー
-
[解決済み] 変数の型(リスト)が無効です
-
[解決済み] テスト
-
[解決済み】Rでの関数の最適化(L-BFGS-Bでは'fn'に有限の値が必要)。
-
[解決済み】Rエラー。"新しい列は既存の列の後に穴を空ける"
-
[解決済み】R ggplot2 で scale_x_discrete を使用する。
-
[解決済み】 boxplotに色を追加する - "離散的なスケールに連続的な値が供給される "エラー
-
[解決済み】Rでデータフレームのサブセットをプロットする方法は?
-
[解決済み] データフレームを結合(マージ)する方法(内側、外側、左側、右側)
-
[解決済み] データフレーム列の名前によるドロップ
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】xtsオブジェクトでエラー: "antempt to set 'colnames' on the object with less than two dimension "を克服する方法
-
[解決済み】「arguments imply differing number of rows: x, y」というエラーは何を意味するのか?
-
[解決済み】scale_color_manual()が動作しない件
-
[解決済み】LMEモデルのレベル0、ブロック1でのバックソルブにおける特異性
-
[解決済み】RでのMLEエラー:'vmmin'の初期値が有限でない
-
[解決済み】ggplotのエラー。関数型オブジェクトのスケールを自動的に選択する方法がわかりません。
-
[解決済み】Rヒストグラムの範囲エラー:いくつかの'x'がカウントされない; 'break'が'x'の範囲に及ばないかもしれない
-
[解決済み】 if/while (条件) {: TRUE/FALSEが必要な場所に値がない場合のエラー
-
[解決済み】Rはプロットするが、アブラインを描画しない
-
[解決済み】Rで相対的な頻度をプロットするためにhistをどのように使用しますか?