1. ホーム
  2. nlp

[解決済み] lemmatizationとstemmingの違いは何ですか?

2022-04-21 02:34:35

質問

それぞれどのような場合に使用するのですか?

また、NLTKのレムマター化は品詞に依存しているのでしょうか? そうであれば、より精度が高くなるのではないでしょうか?

どのように解決するのですか?

短く、濃く。 http://nlp.stanford.edu/IR-book/html/htmledition/stemming-and-lemmatization-1.html

ステミングとレンマタイゼーションの目的は、単語の屈折形や、場合によっては派生的に関連する形を、共通の基本 形に減らすことです。

しかし、この2つの言葉は、その趣を異にしている。ステミングは通常、この目標をほぼ正しく達成することを期待して語尾を切り落とす粗雑な発見的プロセスを指し、しばしば派生接辞の除去が含まれる。Lemmatizationは通常、語彙と形態素解析を用いて適切に行うことを指し、通常は屈折した語尾のみを取り除き、レンマと呼ばれる単語の基本形または辞書形を返すことを目的としています 。

NLTKのドキュメントより。

レムマター化とステミングは、正規化の特殊なケースです。これらは、関連する単語形式のセットに対する正準代表を識別します。