[解決済み] データフレーム列の </p> を置換する。
2022-02-18 09:32:17
質問事項
データフレームのカラムの説明文があります。データフレーム列から "<p> "& "<br> " というテキストを削除して、テキストだけを残したいのですが、どうすればよいですか?
Description
"<p>ID being used for RPA testing</p>"
"This NUID is used for User Acceptance Testing of the RPA solutions for mainframe provisioning (ACF2 NP10 and all IDMS lower environments)<br>"
<p>ID being used for RPA testing</p>
This NUID is used for User Acceptance Testing of the RPA solutions for mainframe provisioning (ACF2 NP10 and all IDMS lower environments)<br>
期待される出力
Description
ID being used for RPA testing
This NUID is used for User Acceptance Testing of the RPA solutions for mainframe provisioning (ACF2 NP10 and all IDMS lower environments)
ID being used for RPA testing
This NUID is used for User Acceptance Testing of the RPA solutions for mainframe provisioning (ACF2 NP10 and all IDMS lower environments)
解決方法は?
テキストが複雑でない場合は、正規表現を使って
<
と
>
df = pd.DataFrame({
"Description": [
"<p>ID being used for RPA testing</p>",
"This NUID is used for User Acceptance Testing of the RPA solutions for mainframe provisioning (ACF2 NP10 and all IDMS lower environments)<br>"
]
})
pattern = re.compile('<.+?(>|>)')
df["Description"] = df["Description"].str.replace(pattern, "")
より複雑な要件については、BeautifulSoupのような適切なHTMLパーサーに飛び込んで、プレーンテキストを抽出する必要があります。
関連
-
opencvとpillowを用いた顔認証システム(デモあり)
-
[解決済み] for'ループでインデックスにアクセスする?
-
[解決済み] PandasでDataFrameの行を反復処理する方法
-
[解決済み] 列の値に基づいてDataFrameから行を選択するにはどうすればよいですか?
-
[解決済み] Pandasのカラム名のリネーム
-
[解決済み] Pandas DataFrameからカラムを削除する
-
[解決済み] Pandas DataFrameの行数を取得する方法は?
-
[解決済み] 既存のDataFrameに新しい列を追加する方法は?
-
[解決済み】Pandas DataFrameのカラムヘッダからリストを取得する。
-
[解決済み】pandasでカラムの種類を変更する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Python関数の高度な応用を解説
-
Python機械学習Githubが8.9Kstarsに達したモデルインタープリタLIME
-
パッケージングツールPyinstallerの使用と落とし穴の回避
-
風力制御におけるKS原理を深く理解するためのpythonアルゴリズム
-
[解決済み】Python regex AttributeError: 'NoneType' オブジェクトに 'group' 属性がない。
-
[解決済み】OSError: [WinError 193] %1 は有効な Win32 アプリケーションではありません。
-
[解決済み】numpy: true_divide で無効な値に遭遇
-
[解決済み】socket.error: [Errno 48] アドレスはすでに使用中です。
-
[解決済み】 TypeError: += でサポートされていないオペランド型: 'int' および 'list' です。
-
[解決済み】 'numpy.float64' オブジェクトは反復可能ではない