1. ホーム
  2. python

[解決済み] PythonによるSub Stringの削除

2023-05-17 21:17:15

質問

私はすでにフォーラムからいくつかの情報を抽出しています。それは私が今持っている生の文字列です。

string = 'i think mabe 124 + <font color="black"><font face="Times New Roman">but I don\'t have a big experience it just how I see it in my eyes <font color="green"><font face="Arial">fun stuff'

私が気に入らないのは、サブストリングである "<font color="black"><font face="Times New Roman">""<font color="green"><font face="Arial">" . これ以外の文字列の部分はそのままにしておきたい。だから、結果は次のようになるはずだ。

resultString = "i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff"

どうやったらこんなことができるのでしょうか?実は、フォーラムから上記の文字列を抽出するために美しいスープを使用しました。今は正規表現でその部分を削除したほうがいいかもしれません。

どうやって解決するの?

import re
re.sub('<.*?>', '', string)
"i think mabe 124 + but I don't have a big experience it just how I see it in my eyes fun stuff"

re.sub 関数は正規表現を受け取り、2番目のパラメータで文字列中のすべてのマッチを置き換えます。この例では、すべてのタグ ( '<.*?>' ) を検索し、それらを何もない状態に置き換えています ( '' ).

? が使われているのは re を使うと、欲張らない検索ができます。

の詳細については re module .