[解決済み】LogisticRegression: Pythonでsklearnを使用して、未知のラベルタイプ： '連続'を使用しています。

2022-01-12 18:38:51

Python ライブラリ sklearn の ML アルゴリズムをテストするとき。

import numpy as np
from sklearn                        import metrics, svm
from sklearn.linear_model           import LinearRegression
from sklearn.linear_model           import LogisticRegression
from sklearn.tree                   import DecisionTreeClassifier
from sklearn.neighbors              import KNeighborsClassifier
from sklearn.discriminant_analysis  import LinearDiscriminantAnalysis
from sklearn.naive_bayes            import GaussianNB
from sklearn.svm                    import SVC

trainingData    = np.array([ [2.3, 4.3, 2.5],  [1.3, 5.2, 5.2],  [3.3, 2.9, 0.8],  [3.1, 4.3, 4.0]  ])
trainingScores  = np.array( [3.4, 7.5, 4.5, 1.6] )
predictionData  = np.array([ [2.5, 2.4, 2.7],  [2.7, 3.2, 1.2] ])

clf = LinearRegression()
clf.fit(trainingData, trainingScores)
print("LinearRegression")
print(clf.predict(predictionData))

clf = svm.SVR()
clf.fit(trainingData, trainingScores)
print("SVR")
print(clf.predict(predictionData))

clf = LogisticRegression()
clf.fit(trainingData, trainingScores)
print("LogisticRegression")
print(clf.predict(predictionData))

clf = DecisionTreeClassifier()
clf.fit(trainingData, trainingScores)
print("DecisionTreeClassifier")
print(clf.predict(predictionData))

clf = KNeighborsClassifier()
clf.fit(trainingData, trainingScores)
print("KNeighborsClassifier")
print(clf.predict(predictionData))

clf = LinearDiscriminantAnalysis()
clf.fit(trainingData, trainingScores)
print("LinearDiscriminantAnalysis")
print(clf.predict(predictionData))

clf = GaussianNB()
clf.fit(trainingData, trainingScores)
print("GaussianNB")
print(clf.predict(predictionData))

clf = SVC()
clf.fit(trainingData, trainingScores)
print("SVC")
print(clf.predict(predictionData))

最初の2つは問題なく動作しますが、次の部分でエラーが発生しました。 LogisticRegression を呼び出します。

root@ubupc1:/home/ouhma# python stack.py 
LinearRegression
[ 15.72023529   6.46666667]
SVR
[ 3.95570063  4.23426243]
Traceback (most recent call last):
  File "stack.py", line 28, in <module>
    clf.fit(trainingData, trainingScores)
  File "/usr/local/lib/python2.7/dist-packages/sklearn/linear_model/logistic.py", line 1174, in fit
    check_classification_targets(y)
  File "/usr/local/lib/python2.7/dist-packages/sklearn/utils/multiclass.py", line 172, in check_classification_targets
    raise ValueError("Unknown label type: %r" % y_type)
ValueError: Unknown label type: 'continuous'

入力データは前の呼び出しと同じですが、ここで何が起こっているのでしょうか？

ところで、なぜ LinearRegression() と SVR() アルゴリズム (15.72 vs 3.95) ?

解決方法は？

カテゴリ値を期待する分類器に、浮動小数点数のベクトルを渡しています。これを int は入力として受け入れられるでしょう（それが正しい方法かどうかは疑問が残りますが）。

学習スコアを変換するには、scikitの labelEncoder という関数があります。

DecisionTreeとKNeighborsの修飾子も同じです。

from sklearn import preprocessing
from sklearn import utils

lab_enc = preprocessing.LabelEncoder()
encoded = lab_enc.fit_transform(trainingScores)
>>> array([1, 3, 2, 0], dtype=int64)

print(utils.multiclass.type_of_target(trainingScores))
>>> continuous

print(utils.multiclass.type_of_target(trainingScores.astype('int')))
>>> multiclass

print(utils.multiclass.type_of_target(encoded))
>>> multiclass

[解決済み】LogisticRegression: Pythonでsklearnを使用して、未知のラベルタイプ： '連続'を使用しています。

解決方法は？

関連

Pythonコードの可読性を向上させるツール「pycodestyle」の使い方を詳しく解説します

[解決済み】TypeError: unhashable type: 'numpy.ndarray'.

[解決済み】RuntimeWarning: 割り算で無効な値が発生しました。

[解決済み】numpy: true_divide で無効な値に遭遇

[解決済み】 AttributeError: モジュール 'matplotlib' には属性 'plot' がない。

[解決済み] builtins.TypeError: strでなければならない、bytesではない

[解決済み】 TypeError: += でサポートされていないオペランド型: 'int' および 'list' です。

[解決済み】 'numpy.float64' オブジェクトは反復可能ではない

[解決済み] Pythonで型をチェックする標準的な方法は何ですか？

[解決済み] Python 3をvirtualenvで使う

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

pythonを使ったオフィス自動化コード例

python call matlab メソッドの詳細

PicgoのイメージベッドツールをPythonで実装する

python implement mysql add delete check change サンプルコード

Python入門 openを使ったファイルの読み書きの方法

[解決済み] [Solved] sklearn error ValueError: 入力に NaN、infinity または dtype('float64') に対して大きすぎる値が含まれている。

[解決済み】RuntimeWarning: 割り算で無効な値が発生しました。

[解決済み】Pythonでgoogle APIのJSONコードを読み込むとエラーになる件

[解決済み】IndexError: invalid index to scalar variableを修正する方法

[解決済み】django インポートエラー - core.managementという名前のモジュールがない