[解決済み] string.replaceで正規表現を入力するには？

2022-03-24 08:20:11

質問

正規表現について教えてください。私の入力は次のようなものです。

this is a paragraph with<[1> in between</[1> and then there are cases ... where the<[99> number ranges from 1-100</[99>. 
and there are many other lines in the txt files
with<[3> such tags </[3>

必要な出力は

this is a paragraph with in between and then there are cases ... where the number ranges from 1-100. 
and there are many other lines in the txt files
with such tags

試してみました。

#!/usr/bin/python
import os, sys, re, glob
for infile in glob.glob(os.path.join(os.getcwd(), '*.txt')):
    for line in reader: 
        line2 = line.replace('<[1> ', '')
        line = line2.replace('</[1> ', '')
        line2 = line.replace('<[1>', '')
        line = line2.replace('</[1>', '')
        
        print line

これも試してみました（でも、正規表現の構文が間違っているような気がします）。

        line2 = line.replace('<[*> ', '')
        line = line2.replace('</[*> ', '')
        line2 = line.replace('<[*>', '')
        line = line2.replace('</[*>', '')

をハードコードしたくないので replace を1〜99まで設定できます。

解決方法は？

このテストされたスニペットはそれを行う必要があります。

import re
line = re.sub(r"</?\[\d+>", "", line)

編集する 以下は、その仕組みを説明したコメント付きバージョンです。

line = re.sub(r"""
  (?x) # Use free-spacing mode.
  <    # Match a literal '<'
  /?   # Optionally match a '/'
  \[   # Match a literal '['
  \d+  # Match one or more digits
  >    # Match a literal '>'
  """, "", line)

Regexesは 楽しい しかし、1〜2時間かけて基本を勉強することを強くお勧めします。まず、どの文字が特別なのかを学ぶ必要があります。 メタキャラクタ" をエスケープする必要があります(つまり、バックスラッシュを前に置く必要があります。また、文字クラスの内側と外側でルールが異なります。)。優れたオンラインチュートリアルがあります。 www.regular-expressions.info . このような時間を過ごすことで、何倍もの利益を得ることができます。それでは、Happy regexing!

[解決済み] string.replaceで正規表現を入力するには？

質問

解決方法は？

関連

[解決済み】 NameError: グローバル名 'xrange' は Python 3 で定義されていません。

[解決済み】"No JSON object could be decoded "よりも良いエラーメッセージを表示する。

[解決済み] JavaScriptで文字列が部分文字列を含むかどうかを確認する方法は？

[解決済み] プログラムの実行やシステムコマンドの呼び出しはどのように行うのですか？

[解決済み] JavaScriptでメールアドレスを検証するのに最適な方法は何ですか？

[解決済み] JavaでInputStreamを読み込んでStringに変換するにはどうすればよいですか？

[解決済み] 文字列の単語を反復処理するにはどうすればよいですか？

[解決済み] Pythonで文字列の部分文字列を取得するにはどうすればよいですか？

[解決済み】JavaScriptで文字列の出現箇所をすべて置換する方法

[解決済み】2つの辞書を1つの式でマージする（辞書の和をとる）には？）

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

PyQt5はユーザーログインGUIインターフェースとログイン後のジャンプを実装しています。

PythonによるExcelファイルの一括操作の説明

[解決済み] データ型が理解できない

[解決済み】numpy: true_divide で無効な値に遭遇

[解決済み】"No JSON object could be decoded "よりも良いエラーメッセージを表示する。

[解決済み】Python elifの構文が無効です【終了しました

[解決済み】インポートエラー。モジュール名 urllib2 がない

[解決済み】IndexError: invalid index to scalar variableを修正する方法

[解決済み] Python string.replace正規表現 [重複]について

[解決済み】python .replace() 正規表現 [重複]の場合］