[解決済み] word2vec: ネガティブサンプリング(平たく言うと)?
2022-11-05 23:13:07
質問
以下の論文を読んでいるのですが、ネガティブサンプリングの概念を理解するのに苦労しています。
http://arxiv.org/pdf/1402.3722v1.pdf
誰か助けてください。
どのように解決するのですか?
の考え方は
word2vec
は、テキスト内で(互いの文脈で)近くに現れる単語のベクトル間の類似度(ドットプロダクト)を最大化し、そうでない単語の類似度を最小化することです。リンク先の論文の式(3)では、指数計算を一旦無視します。次のようになります。
v_c . v_w
-------------------
sum_i(v_ci . v_w)
分子は基本的に単語間の類似性である
c
(文脈) と
w
(ターゲット)の単語を比較する。分母は他のすべての文脈の類似度を計算する
ci
と目的語である
w
. この比率を最大にすることで、テキスト中で近くに現れる単語は、そうでない単語よりも類似したベクトルを持つようになる。しかし、これを計算するのは非常に時間がかかる。
ci
. ネガティブサンプリングはこの問題に対処する方法の1つで、いくつかの文脈を選択するだけでよい
ci
を無作為に選択します。最終的な結果は、もし
cat
のコンテキストに現れるということです。
food
のベクトルは
food
のベクトルに似ています。
cat
(のベクトルよりも(それらの内積で測ると)より似ています。
他のランダムに選ばれたいくつかの単語
(例えば
democracy
,
greed
,
Freddy
) の代わりに
の代わりに、他のすべての言語
. これによって
word2vec
をより速く訓練することができます。
関連
-
[解決済み】Keras - KerasRegressorを使用して予測を実行する方法は?
-
[解決済み] PyTorchのバックワード関数
-
[解決済み] イプシロン貪欲q学習におけるイプシロンと学習率の減衰について
-
[解決済み] サポートベクターマシンに対する人工ニューラルネットワークの優位性は何ですか?[終了しました]
-
[解決済み】ニューラルネットワークにおけるバイアスの役割とは?[クローズド]
-
[解決済み】線形回帰とロジスティック回帰の違いは何ですか?[クローズド]
-
[解決済み] なぜ人工ニューラルネットワークの入力を正規化する必要があるのですか?[クローズド]
-
[解決済み] Diablo 2をプレイするための人工ニューラルネットワークを視覚的に学習させる方法とは?
-
[解決済み] Appleはどのように電子メールの日付、時間、アドレスを見つけるのですか?
-
[解決済み] フィーチャーとラベルの違いは何ですか?[クローズド]
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】TensorFlowでtf.gradientsが動作する方法
-
[解決済み] tf.reset_default_graph() の使用方法
-
[解決済み] サポートベクターマシンに対する人工ニューラルネットワークの優位性は何ですか?[終了しました]
-
[解決済み】同じ問題で binary_crossentropy と categorical_crossentropy が異なる性能を示すのはなぜか?
-
[解決済み] なぜ人工ニューラルネットワークの入力を正規化する必要があるのですか?[クローズド]
-
[解決済み] Diablo 2をプレイするための人工ニューラルネットワークを視覚的に学習させる方法とは?
-
[解決済み] Appleはどのように電子メールの日付、時間、アドレスを見つけるのですか?
-
[解決済み] Windowsの.batファイルにプロセスを強制終了させる方法を教えてください。[クローズド]。
-
[解決済み] フィーチャーとラベルの違いは何ですか?[クローズド]
-
[解決済み] クロスエントロピーとは?[クローズド]