[解決済み] C5.0モデルは要因の結果を必要とする
2022-02-17 01:49:32
質問事項
学習ツリーを構築するために、credit.csvを使用しています。
https://github.com/stedy/Machine-Learning-with-R-datasets/blob/master/credit.csv
を行い、以下のような手順を踏みました。
credit<-read.csv("credit.csv")
set.seed(12345)
credit_rand<-credit[order(runif(1000)),]
credit_train<-credit_rand[1:900,]
credit_test<-credit_rand[901:1000,]
library(C50)
credit_model<-C5.0(credit_train[-21],credit_train$default)
私が従っているガイドでは、defaultの値である最後のカラムを取り除けばよいようですが、次のようなエラーが発生しました。
Error en C5.0.default(credit_train[, -21], credit_train$default) :
C5.0 models require a factor outcome
最後の行を変更してみました。
credit_model<-C5.0(credit_train[,-21],credit_train$default)
が、全く成功しない。
何かお手伝いできることはありますか?
解決方法は?
あなたの問題は、次のとおりです。
C5.0 models require a factor outcome
. あなたは、結果を
credit_train$default
これは1/2の結果ですが、Rはこれを係数ではなく、数値として読み取ります。
str(credit_train$default)
int [1:900] 2 1 1 1 2 1 2 2 1 1 ...
そうすると、解決策は因数分解に変換することです。
credit_train$default<-as.factor(credit_train$default)
str(credit_train$default)
Factor w/ 2 levels "1","2": 2 1 1 1 2 1 2 2 1 1 ...
そして、トレーニングを実行します。
credit_model<-C5.0(credit_train[-21],credit_train$default)
関連
-
[解決済み】値を置き換えようとすると、"データフレームの添え字の割り当てで欠損値は許可されない"
-
[解決済み】RでKNN。trainとclassは長さが違う」?
-
[解決済み】Rヒストグラムの範囲エラー:いくつかの'x'がカウントされない; 'break'が'x'の範囲に及ばないかもしれない
-
[解決済み】Rでのデータ操作。'X'はアトミックでなければならない
-
[解決済み】Rで、Error: ggplot2 doesn't know how to handle of data of class numericに対処する。
-
[解決済み】 .subset2(x, i, exact = exact)のエラー:Rの添え字が範囲外である。
-
[解決済み】dplyr: "Error in n(): 関数は直接呼ばれるべきではありません"
-
[解決済み] 情報を損なわずに因数を整数値に変換するには?
-
[解決済み] require()とlibrary()の違いは何ですか?
-
[解決済み】サブセットされたデータフレーム内の未使用の因子レベルを削除する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】エラー。Rの次元数が正しくない
-
[解決済み】ggplotの線幅を変更するには?
-
[解決済み】scale_color_manual()が動作しない件
-
[解決済み】LMEモデルのレベル0、ブロック1でのバックソルブにおける特異性
-
[解決済み】lis[[i]]のエラー:1つ未満の要素を選択しようとした場合
-
[解決済み】Rでの関数の最適化(L-BFGS-Bでは'fn'に有限の値が必要)。
-
[解決済み】 lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) のエラー : 'y' の NA/NaN/Inf, あらゆる方法を試したが解決しなかった。
-
[解決済み】r Error dim(X) must have a positive length?
-
[解決済み】ggplot2でのプロット:「Error: カテゴリ軸のY軸に "Discrete value supplied to continuous scale "と表示される。
-
[解決済み】dplyr: "Error in n(): 関数は直接呼ばれるべきではありません"