[解決済み] スペイシーでの数学表現
2022-02-17 04:45:05
質問
Pythonとspacy(ドイツ語)を使って数式を含む数学のタスクを分析する:これらの数式にフラグを立てることは可能か?例えば、{}で。
Two cyclists {A} and {B}, {120 miles} apart, approach each other, each pedaling at {10 mph}.
今現在({}なし)、AとBは異なるタグ(ドイツ語ではNOUNとX)を持っています。
どのように解決するのですか?
はい、それは絶対に可能です。まず、このトークンが数学と関係があることを示す、新しい「math」属性を定義する必要があります。
その後、スペイシーパイプラインに新しいコンポーネントを追加して、次の2つを実現する必要があります。
- 数学トークンを1つの数学トークンに統合する
- このトークンに対して、math 属性を true に設定します。
以下のコードで問題ないでしょう。
import spacy
from spacy.tokens import Token
Token.set_extension('math', default=False)
nlp = spacy.load('en')
def math_expressions(doc):
flag_start = False
to_merge = []
for index, token in enumerate(doc):
if (token.text == "{"):
start = index
flag_start = True
if (flag_start and token.text == "}"):
flag_start = False
to_merge.append(doc[start:index+1])
for span in to_merge:
token = span.merge()
token._.set('math', True)
return doc
nlp.add_pipe(math_expressions, after='ner')
doc = nlp('Two cyclists {A} and {B}, {120 miles} apart, approach each other, each pedaling at {10 mph}.')
for token in doc:
if (token._.math):
print(token)
お役に立てれば幸いです。
関連
-
Pythonの非常に便利な2つのデコレーターを解説
-
Python 可視化 big_screen ライブラリ サンプル 詳細
-
Python interpreted model libraryによる機械学習モデル出力の可視化 Shap
-
Pythonの画像ファイル処理用ライブラリ「Pillow」(グラフィックの詳細)
-
[解決済み】OSError: [WinError 193] %1 は有効な Win32 アプリケーションではありません。
-
[解決済み] builtins.TypeError: strでなければならない、bytesではない
-
[解決済み】Pythonでgoogle APIのJSONコードを読み込むとエラーになる件
-
[解決済み】Python: SyntaxError: キーワードは式になり得ない
-
[解決済み】Python - "ValueError: not enough values to unpack (expected 2, got 1)" の修正方法 [閉店].
-
[解決済み] ジェネレータ式とリスト内包の比較
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Pythonの非常に便利な2つのデコレーターを解説
-
ピロウズ画像色処理の具体的な活用方法
-
Pythonコンテナのための組み込み汎用関数操作
-
Pythonの学習とデータマイニングのために知っておくべきターミナルコマンドのトップ10
-
Pythonの画像ファイル処理用ライブラリ「Pillow」(グラフィックの詳細)
-
FacebookオープンソースワンストップサービスpythonのタイミングツールKats詳細
-
[解決済み】RuntimeWarning: invalid value encountered in double_scalars で numpy の除算ができない。
-
[解決済み】syntaxError: 'continue' がループ内で適切に使用されていない
-
[解決済み] 'int'オブジェクトに'__getitem__'属性がない。
-
[解決済み】 AttributeError("'str' object has no attribute 'read'")