1. ホーム
  2. r

[解決済み] ロジスティック回帰で「Error in weights * y : non-numeric argument to binary operator」が表示されるのはなぜですか?

2022-02-28 08:10:10

質問

私は自分のデータセットに対してロジスティック回帰を実行したいと思っています。私は以下を使用します。

glm.fit=glm(direccion~Profit, data=datos, family=binomial)

    Minute  ecopet  TASA10  direccion   Minute  cl1     Day         Profit  
1   571     2160     5       1          571    51.85    2015-02-20  -0.03   
2   572     2160     5       1          572    51.92    2015-02-20   0.04   
3   573     2160     5       1          573    51.84    2015-02-20  -0.04   
4   574     2160     5       1          574    51.77    2015-02-20  -0.11   
5   575     2160     10      1          575    51.69    2015-02-20  -0.19   
6   576     2165     5       1          576    51.69    2015-02-20  -0.16   
7   577     2165    -5       0          577    51.64    2015-02-20  -0.28   
8   578     2165    -10      0          578    51.47    2015-02-20  -0.37   
9   579     2165    -10      0          579    51.41    2015-02-20  -0.36   
10  580     2170    -15      0          580    51.44    2015-02-20  -0.25   
11  581     2170    -30      0          581    51.48    2015-02-20  -0.21   
12  582     2160    -20      0          582    51.52    2015-02-20  -0.12   
13  583     2155    -5       0          583    51.56    2015-02-20   0.09   
14  584     2155    -5       0          584    51.51    2015-02-20   0.10   
15  585     2155    -5       0          585    51.44    2015-02-20   0.00   
16  586     2140     10      1          586    51.30    2015-02-20  -0.18   
17  587     2140     10      1          587    51.31    2015-02-20  -0.21   
18  588     2150     0       0          588    51.31    2015-02-20  -0.25

ご覧のように、変数'direccion'はバイナリ変数で、私のロジスティック回帰の従属変数となります。変数'TASA10'が正であれば常に1であり、そうでなければ0です。問題は、私がコードを実行した後、私は得ることです。

'Error in weights * y : non-numeric argument to binary operator' (重みのエラー)。

なぜかわかりますか?

ありがとうございます!

解決方法は?

どうやら direccion カラムは数値ではなく文字カラムです。 を実行することで確認できます。 str(datos) のように表示されます。

'data.frame':   18 obs. of  8 variables:
 $ Minute   : int  571 572 573 574 575 576 577 578 579 580 ...
 $ ecopet   : int  2160 2160 2160 2160 2160 2165 2165 2165 2165 2170 ...
 $ TASA10   : int  5 5 5 5 10 5 -5 -10 -10 -15 ...
 $ direccion: chr  "1" "1" "1" "1" ...
 $ Minute.1 : int  571 572 573 574 575 576 577 578 579 580 ...
 $ cl1      : num  51.9 51.9 51.8 51.8 51.7 ...
 $ Day      : Factor w/ 1 level "2015-02-20": 1 1 1 1 1 1 1 1 1 1 ...
 $ Profit   : num  -0.03 0.04 -0.04 -0.11 -0.19 -0.16 -0.28 -0.37 -0.36 -0.25 ...

特に direccion カラムがあります。 これは、以下のように実行することで修正できます。

datos$direccion <- as.numeric(datos$direccion)

もしそれが要因であるならば、コーディングが失われないようにするために

datos$direccion <- as.numeric(as.character(datos$direccion))

さらに良いのは、パイプラインでこのデータフレームを生成するコードを振り返り、文字列としてではなく数値としてエンコードするように修正することです。