[解決済み] TensorFlowで学習済みの単語埋め込み(word2vecやGlove)を利用する
質問
最近、興味深い実装をレビューしました。 畳み込みテキスト分類 . しかし、私がレビューしたすべてのTensorFlowコードは、以下のようなランダムな(事前学習されていない)埋め込みベクトルを使用しています。
with tf.device('/cpu:0'), tf.name_scope("embedding"):
W = tf.Variable(
tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0),
name="W")
self.embedded_chars = tf.nn.embedding_lookup(W, self.input_x)
self.embedded_chars_expanded = tf.expand_dims(self.embedded_chars, -1)
Word2vecやGloVeで学習した単語埋め込みの結果を、ランダムな単語埋め込みの代わりに利用する方法をご存知の方はいらっしゃいませんか?
どのように解決するのですか?
TensorFlowで事前に学習させたembeddingを使うには、いくつかの方法があります。例えば、エンベッディングをNumPyの配列で
embedding
というNumPyの配列に埋め込むとします。
vocab_size
の行と
embedding_dim
列からなるテンソル
W
への呼び出しで使用できるテンソルを作りたい。
tf.nn.embedding_lookup()
.
-
単に作成する
W
をtf.constant()
を取ることでembedding
を値として取ります。W = tf.constant(embedding, name="W")
これは最も簡単な方法ですが,メモリ効率は良くありません.
tf.constant()
の値はメモリ上に複数回保存されるからです。なぜならembedding
は非常に大きくなる可能性があるので、この方法はおもちゃのような例だけに使うようにしましょう。 -
作成
W
としてtf.Variable
として、NumPyの配列からそれを初期化するためにtf.placeholder()
:W = tf.Variable(tf.constant(0.0, shape=[vocab_size, embedding_dim]), trainable=False, name="W") embedding_placeholder = tf.placeholder(tf.float32, [vocab_size, embedding_dim]) embedding_init = W.assign(embedding_placeholder) # ... sess = tf.Session() sess.run(embedding_init, feed_dict={embedding_placeholder: embedding})
のコピーを保存することを避けます。
embedding
のコピーをグラフに保存することは避けられますが、一度に2つの行列のコピー(1つはNumPyの配列用、もう1つはtf.Variable
). なお、学習中は埋め込み行列を一定に保ちたいものと仮定していますので、その場合はW
と共に作成されます。trainable=False
. -
エンベッディングが他のTensorFlowモデルの一部として学習されたものである場合は
tf.train.Saver
を使って他のモデルのチェックポイントファイルから値を読み込むことができます。つまり、エンベッディングマトリックスはPythonを完全にバイパスすることができます。作成W
をオプション2のように作成し、次のようにします。W = tf.Variable(...) embedding_saver = tf.train.Saver({"name_of_variable_in_other_model": W}) # ... sess = tf.Session() embedding_saver.restore(sess, "checkpoint_filename.ckpt")
関連
-
[解決済み] DataFrameの文字列、dtypeがobjectの場合
-
[解決済み] SQLAlchemy: セッションの作成と再利用
-
[解決済み] Django Rest Framework ファイルアップロード
-
[解決済み] pandasのタイムゾーンに対応したDateTimeIndexを、特定のタイムゾーンに対応したナイーブなタイムスタンプに変換する。
-
[解決済み] オブジェクトのリストに特定の属性値を持つオブジェクトが含まれているかどうかをチェックする
-
[解決済み] Jupyter (IPython)ノートブックのセッションをpickleして保存する方法
-
[解決済み] Python Logging でログメッセージが2回表示される件
-
[解決済み] pycharmがタブをスペースに自動変換する
-
[解決済み] Pythonの文字列書式をリストで使う
-
[解決済み] Django filter queryset __in for *every* item in list
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] 2つの線分が交差しているかどうかを確認するにはどうすればよいですか?
-
[解決済み] PythonでファイルのMD5チェックサムを計算するには?重複
-
[解決済み] Pythonの構文に新しいステートメントを追加することはできますか?
-
[解決済み] ファブリック経由でデプロイユーザとしてvirtualenvを有効化する
-
[解決済み] スペースがないテキストを単語のリストに分割する方法
-
[解決済み] Django 1.7で初期マイグレーションからマイグレートバックする方法は?
-
[解決済み] あるオブジェクトが数であるかどうかを確認する、最もパイソン的な方法は何でしょうか?
-
[解決済み] Pythonによる一対のクロスプロダクト [重複] (英語)
-
[解決済み] virtualenv の `--no-site-packages` オプションを元に戻す。
-
[解決済み] Pythonでリストが空かどうかをチェックする方法は?重複