[解決済み] lemmatizationとstemmingの違いは何ですか?
2022-04-21 02:34:35
質問
それぞれどのような場合に使用するのですか?
また、NLTKのレムマター化は品詞に依存しているのでしょうか? そうであれば、より精度が高くなるのではないでしょうか?
どのように解決するのですか?
短く、濃く。 http://nlp.stanford.edu/IR-book/html/htmledition/stemming-and-lemmatization-1.html
ステミングとレンマタイゼーションの目的は、単語の屈折形や、場合によっては派生的に関連する形を、共通の基本 形に減らすことです。
しかし、この2つの言葉は、その趣を異にしている。ステミングは通常、この目標をほぼ正しく達成することを期待して語尾を切り落とす粗雑な発見的プロセスを指し、しばしば派生接辞の除去が含まれる。Lemmatizationは通常、語彙と形態素解析を用いて適切に行うことを指し、通常は屈折した語尾のみを取り除き、レンマと呼ばれる単語の基本形または辞書形を返すことを目的としています 。
NLTKのドキュメントより。
レムマター化とステミングは、正規化の特殊なケースです。これらは、関連する単語形式のセットに対する正準代表を識別します。
関連
-
[解決済み] Stupid Backoffの実装の明確化
-
TypeError: zip 引数 #1 は反復をサポートしなければならない 解決策。
-
BERT事前学習に基づく中国語名前付き固有表現認識のTensorFlow実装
-
pyhanlpレポートについて FileNotFoundError: [Errno 2] No such file or directory: '/usr/lib/jvm' エラー解決法
-
[解決済み】2つのテキスト文書間の類似性を計算する方法は?
-
[解決済み] lemmatizationとstemmingの違いは何ですか?
-
[解決済み] 単語中の音節を検出する
-
[解決済み] Did you mean "を実装するには?重複
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] Stupid Backoffの実装の明確化
-
TypeError: zip 引数 #1 は反復をサポートしなければならない 解決策。
-
BERT事前学習に基づく中国語名前付き固有表現認識のTensorFlow実装
-
pyhanlpレポートについて FileNotFoundError: [Errno 2] No such file or directory: '/usr/lib/jvm' エラー解決法
-
[解決済み】2つのテキスト文書間の類似性を計算する方法は?
-
[解決済み] lemmatizationとstemmingの違いは何ですか?
-
[解決済み] 単語中の音節を検出する
-
[解決済み] Did you mean "を実装するには?重複