[解決済み] scikit-learn .predict() デフォルトの閾値

2023-02-05 22:46:34

質問

クラスが偏っている（1が5％）分類問題に取り組んでいます。私は、確率ではなく、クラスを予測したいです。

2値分類の問題で、scikitの classifier.predict() を使って 0.5 をデフォルトで使うのですか？そうでない場合、デフォルトの方法は何ですか？もしそうなら、どのようにそれを変更しますか？

scikitでは、いくつかの分類器には class_weight='auto' オプションがありますが、すべてではありません。この場合 class_weight='auto' では .predict() は実際の人口比率を閾値として使用するのでしょうか？

のような分類器でこれを行うにはどうしたらよいでしょうか？ MultinomialNB をサポートしない class_weight ? を使用する以外に predict_proba() を使って、自分でクラスを計算することです。

どのように解決するのですか？

<ブロッククオート

はscikitの classifier.predict() はデフォルトで0.5を使っているのでしょうか？

確率的分類器では、そうです。他の人が説明したように、数学的な観点から唯一の賢明な閾値です。

<ブロッククオート

をサポートしないMultinomialNBのような分類器でこれを行うにはどうしたらよいでしょうか？ class_weight ?

を設定することができます。 class_prior であり、これは事前確率 P( y )であり、クラスごとの y . これにより，効果的に判定境界を移動させることができます．例

# minimal dataset
>>> X = [[1, 0], [1, 0], [0, 1]]
>>> y = [0, 0, 1]
# use empirical prior, learned from y
>>> MultinomialNB().fit(X,y).predict([1,1])
array([0])
# use custom prior to make 1 more likely
>>> MultinomialNB(class_prior=[.1, .9]).fit(X,y).predict([1,1])
array([1])

[解決済み] scikit-learn .predict() デフォルトの閾値

質問

どのように解決するのですか？

関連

[解決済み] 最小限の驚き」と「変更可能なデフォルトの引数

[解決済み】scikit-learnで分類器をディスクに保存する。

[解決済み] PythonでファイルのMD5チェックサムを計算するには？重複

[解決済み] Pythonの要素別タプル演算（sumなど

[解決済み] スペースがないテキストを単語のリストに分割する方法

[解決済み] PyQtアプリケーションのスレッド化。QtスレッドとPythonスレッドのどちらを使うか？

[解決済み] Pythonによる一対のクロスプロダクト [重複] (英語)

[解決済み] Pythonで、ウェブサイトが404か200かを確認するためにurllibをどのように使用しますか？

[解決済み] Python 言語を決定するには？

[解決済み] Pythonの文字列の前にあるbという接頭辞は何を意味するのですか？

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

[解決済み] PythonでSVGからPNGに変換する

[解決済み] Pythonの要素別タプル演算（sumなど

[解決済み] dict を txt ファイルに書き、それを読み取る？

[解決済み] Pythonのインスタンス変数とクラス変数

[解決済み] Django Rest Framework ファイルアップロード

[解決済み] virtualenv の `--no-site-packages` オプションを元に戻す。

[解決済み] Pythonで、ウェブサイトが404か200かを確認するためにurllibをどのように使用しますか？

[解決済み] pycharmがタブをスペースに自動変換する

[解決済み] Pythonでファイルの読み込みと上書きをする

[解決済み] Django filter queryset __in for every item in list