1. ホーム
  2. パイソン

Xgboostのいくつかの落とし穴

2022-02-25 11:17:55
<パス

ここ数日、コンテストを行い、いくつかのことを行うためにXgboostをツールとして使用しました。
メインフレームワークはXgboostのpython拡張版です。
その後、工程はXgboostの様々なエラーの解決に多くの時間を費やしました。
問題のほとんどはこの関数にあります

dtrain = xgb.DMatrix('train.txt')
dtest = xgb.DMatrix('test.txt')

不可解なエラーがいろいろと出てくるのですが、私がいくつかの成果物についてチューニングしたのは、私の機能の1つが、実はこの関数に影響してエラーを報告しているということなのです。
でも、確認したところ書式の問題では全くないんです。
最後にもう一つ、まとめます。

  • SVMLib形式のファイルをデータ入力として使用しない方が良い

numpyやscipyなどの既存の変数を直接使用する。

不都合な点としては、計算された特徴データを保存するために必要だったファイルを、両方のファイル上で照合するために、xgboost だけで呼び出す必要があることでしょう。
代替案としては、numpyの変数を格納するためにpickleを使用することです。

小さな落とし穴は、まずこのカテゴリに書かれています。