[解決済み] scikit-learn .predict() デフォルトの閾値
2023-02-05 22:46:34
質問
クラスが偏っている(1が5%)分類問題に取り組んでいます。私は、確率ではなく、クラスを予測したいです。
2値分類の問題で、scikitの
classifier.predict()
を使って
0.5
をデフォルトで使うのですか?
そうでない場合、デフォルトの方法は何ですか?もしそうなら、どのようにそれを変更しますか?
scikitでは、いくつかの分類器には
class_weight='auto'
オプションがありますが、すべてではありません。この場合
class_weight='auto'
では
.predict()
は実際の人口比率を閾値として使用するのでしょうか?
のような分類器でこれを行うにはどうしたらよいでしょうか?
MultinomialNB
をサポートしない
class_weight
? を使用する以外に
predict_proba()
を使って、自分でクラスを計算することです。
どのように解決するのですか?
<ブロッククオート
はscikitの
classifier.predict()
はデフォルトで0.5を使っているのでしょうか?
確率的分類器では、そうです。他の人が説明したように、数学的な観点から唯一の賢明な閾値です。
<ブロッククオート
をサポートしないMultinomialNBのような分類器でこれを行うにはどうしたらよいでしょうか?
class_weight
?
を設定することができます。
class_prior
であり、これは事前確率 P(
y
)であり、クラスごとの
y
. これにより,効果的に判定境界を移動させることができます.例
# minimal dataset
>>> X = [[1, 0], [1, 0], [0, 1]]
>>> y = [0, 0, 1]
# use empirical prior, learned from y
>>> MultinomialNB().fit(X,y).predict([1,1])
array([0])
# use custom prior to make 1 more likely
>>> MultinomialNB(class_prior=[.1, .9]).fit(X,y).predict([1,1])
array([1])
関連
-
[解決済み] 最小限の驚き」と「変更可能なデフォルトの引数
-
[解決済み】scikit-learnで分類器をディスクに保存する。
-
[解決済み] PythonでファイルのMD5チェックサムを計算するには?重複
-
[解決済み] Pythonの要素別タプル演算(sumなど
-
[解決済み] スペースがないテキストを単語のリストに分割する方法
-
[解決済み] PyQtアプリケーションのスレッド化。QtスレッドとPythonスレッドのどちらを使うか?
-
[解決済み] Pythonによる一対のクロスプロダクト [重複] (英語)
-
[解決済み] Pythonで、ウェブサイトが404か200かを確認するためにurllibをどのように使用しますか?
-
[解決済み] Python 言語を決定するには?
-
[解決済み] Pythonの文字列の前にあるbという接頭辞は何を意味するのですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] PythonでSVGからPNGに変換する
-
[解決済み] Pythonの要素別タプル演算(sumなど
-
[解決済み] dict を txt ファイルに書き、それを読み取る?
-
[解決済み] Pythonのインスタンス変数とクラス変数
-
[解決済み] Django Rest Framework ファイルアップロード
-
[解決済み] virtualenv の `--no-site-packages` オプションを元に戻す。
-
[解決済み] Pythonで、ウェブサイトが404か200かを確認するためにurllibをどのように使用しますか?
-
[解決済み] pycharmがタブをスペースに自動変換する
-
[解決済み] Pythonでファイルの読み込みと上書きをする
-
[解決済み] Django filter queryset __in for *every* item in list