1. ホーム
  2. java

[解決済み] Java Stanford NLP: 品詞のラベル?

2022-04-20 11:12:15

質問

スタンフォード大学NLPのデモ風景 こちら というような出力が得られます。

Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.

Part of Speechタグの意味を教えてください。公式のリストが見当たりません。スタンフォード独自のシステムなのでしょうか、それとも世界共通のタグを使っているのでしょうか? JJ 例えば?)

また、文章を繰り返しながら名詞を探すときなど、つい .contains('N') . これはかなり弱いと感じます。プログラム的に特定の品詞を検索する良い方法はないでしょうか?

どのように解決するのですか?

Penn Treebankプロジェクト . を見てください。 品詞タグ付け ps.

JJは形容詞。NNSは名詞、複数形。VBPは動詞現在形。RB は副詞。

これは英語の場合です。中国語の場合は、Penn Chinese Treebankです。そしてドイツ語はNEGRAコーパス。

<ブロッククオート
  1. CC 調整用接続詞
  2. CD 枢機卿番号
  3. DT 決定詞
  4. EX 存在する
  5. FW 外来語
  6. IN 前置詞または従属接続詞
  7. JJ 形容詞
  8. JJR 形容詞、比較級
  9. JJS 形容詞、最上級
  10. LS リストアイテムマーカー
  11. MDモダール
  12. NN 名詞、単数または複数
  13. NNS Noun, plural
  14. NNP 固有名詞、単数
  15. NNPS 固有名詞、複数形
  16. PDTプリデターナー
  17. POS 所有語尾
  18. PRP 人称代名詞
  19. PRP$ 所有代名詞
  20. RB副詞
  21. RBR 副詞、比較級
  22. RBS 副詞、最上級
  23. RP粒子
  24. SYMシンボル
  25. UH インタージェクション
  26. VB 動詞、基本形
  27. VBD Verb, 過去形
  28. VBG 動名詞、動名詞または現在分詞
  29. VBN Verb, 過去分詞
  30. VBP 動詞、非3人称単数現在
  31. VBZ 動詞、三人称単数現在
  32. WDT Whdeterminer
  33. WP Whpronoun
  34. WP$ 所有格の代名詞
  35. WRB Whadverb