1. ホーム
  2. python

[解決済み] モデルパラメータをフィットさせるためのfmin_l_bfgs_bの正しい使用法

2022-02-17 19:35:28

質問事項

いくつかの実験データ(y, x, t_exp, m_exp)があります。 制約付き多変量BFGS法 . パラメータEは0より大きくなければならないが、他は無制限である。

def func(x, A, B, C, D, E, *args):
    return A * (x ** E) * numpy.cos(t_exp) * (1 - numpy.exp((-2 * B * x) / numpy.cos(t_exp))) +  numpy.exp((-2 * B * x) / numpy.cos(t_exp)) * C + (D * m_exp)

initial_values = numpy.array([-10, 2, -20, 0.3, 0.25])
mybounds = [(None,None), (None,None), (None,None), (None,None), (0, None)]
x,f,d = scipy.optimize.fmin_l_bfgs_b(func, x0=initial_values, args=(m_exp, t_exp), bounds=mybounds)

少し質問です。

  1. モデルの定式化 func には、独立変数 x あるいは、実験データから提供されるべきか x_exp の一部として *args ?
  2. 上記のコードを実行すると、エラーが発生します。 func() takes at least 6 arguments (3 given) というのは、x と私の 2 つの *args のことだと思います。どのように定義すればよいのでしょうか? func ?

EDIT: @zephyrさんの回答のおかげで、実際の関数ではなく、残差の二乗和を最小化することが目的であることを理解しました。以下のような動くコードにたどり着きました。

def func(params, *args):
    l_exp = args[0]
    s_exp = args[1]
    m_exp = args[2]
    t_exp = args[3]
    A, B, C, D, E = params
    s_model = A * (l_exp ** E) * numpy.cos(t_exp) * (1 - numpy.exp((-2 * B * l_exp) / numpy.cos(t_exp))) +  numpy.exp((-2 * B * l_exp) / numpy.cos(theta_exp)) * C + (D * m_exp)
    residual = s_exp - s_model
    return numpy.sum(residual ** 2)

initial_values = numpy.array([-10, 2, -20, 0.3, 0.25])
mybounds = [(None,None), (None,None), (None,None), (None,None), (0,None)]

x, f, d = scipy.optimize.fmin_l_bfgs_b(func, x0=initial_values, args=(l_exp, s_exp, m_exp, t_exp), bounds=mybounds, approx_grad=True)

境界線が正しく機能しているかどうかわかりません。Eに(0, None)を指定すると、実行フラグ2、異常終了になります。(1e-6, None)にすると、正常に実行されますが、Eとして1e-6が選択されます。境界の指定は正しいですか?

解決方法は?

使っているモデルが何を表現しているのか把握するのは面倒なので、線にフィッティングする簡単な例を紹介します。

x_true = arange(0,10,0.1)
m_true = 2.5
b_true = 1.0
y_true = m_true*x_true + b_true

def func(params, *args):
    x = args[0].
    y = 引数[1]です。
    m, b = パラメータ
    y_model = m*x+b
    エラー = y-y_model
    return sum(error**2)

initial_values = numpy.array([1.0, 0.0])
mybounds = [(なし,2), (なし,なし)]です。

scipy.optimize.fmin_l_bfgs_b(func, x0=initial_values, args=(x_true,y_true), approx_grad=True)
scipy.optimize.fmin_l_bfgs_b(func, x0=initial_values, args=(x_true, y_true), bounds=mybounds, approx_grad=True)

最初のオプティマイズは境界がなく、正しい答えを出します。2番目のオプティマイズは境界を尊重し、正しいパラメータに到達するのを防ぎます。

重要なことは、ほとんどすべての最適化関数において、'x' と 'x0' は最適化対象のパラメータを指し、それ以外はすべて引数として渡される、ということです。また、フィット関数が正しいデータ型を返すことも重要です。ここでは単一の値を返しますが、ルーチンによってはエラーベクトルを期待するものもあります。また、解析的に勾配を計算し、それを提供したいのでなければ、 approx_grad=True のフラグも必要です。