[解決済み] 正規表現に基づく文字列の分割
2022-03-10 08:43:55
質問
あるコマンドの出力を表形式で持っています。この出力を結果ファイルからパースして、文字列に格納しています。1行の各要素は1つ以上の空白文字で区切られているため、正規表現を使って1つ以上の空白文字にマッチさせて分割しています。しかし、すべての要素の間にスペースが挿入されています。
>>> str1="a b c d" # spaces are irregular
>>> str1
'a b c d'
>>> str2=re.split("( )+", str1)
>>> str2
['a', ' ', 'b', ' ', 'c', ' ', 'd'] # 1 space element between!!!
何か良い方法はないでしょうか?
各分割後
str2
がリストに追加されます。
解決方法は?
を使用することで
(
,
)
の場合、グループをキャプチャしているので、それらを削除すれば、この問題は発生しません。
>>> str1 = "a b c d"
>>> re.split(" +", str1)
['a', 'b', 'c', 'd']
ただし、正規表現は必要ありません。
str.split
デリミタを指定しない場合、空白で分割されます。この場合、これが一番良い方法でしょう。
>>> str1.split()
['a', 'b', 'c', 'd']
もし、本当に正規表現が必要な場合は、次のようにします (
'\s'
は空白を表すので、より明確です)。
>>> re.split("\s+", str1)
['a', 'b', 'c', 'd']
あるいは、空白文字以外のすべての文字を検索することもできます。
>>> re.findall(r'\S+',str1)
['a', 'b', 'c', 'd']
関連
-
[解決済み】 NameError: グローバル名 'xrange' は Python 3 で定義されていません。
-
[解決済み] 正規表現で変数を使うには?
-
[解決済み] 単語を含まない行にマッチする正規表現
-
[解決済み] Pythonには文字列の'contains'サブストリングメソッドがありますか?
-
[解決済み] バイトを文字列に変換する
-
[解決済み] リストを均等な大きさの塊に分割するには?
-
[解決済み] 正規表現における非捕捉グループとは何ですか?
-
[解決済み] JavaScriptの正規表現でマッチしたグループにアクセスするにはどうすればよいですか?
-
[解決済み] 有効な正規表現を検出するための正規表現はありますか?
-
[解決済み】2つの辞書を1つの式でマージする(辞書の和をとる)には?)
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Pythonコンテナのための組み込み汎用関数操作
-
python call matlab メソッドの詳細
-
[解決済み】「RuntimeError: dictionary changed size during iteration」エラーを回避する方法とは?
-
[解決済み】pygame.error: ビデオシステムが初期化されていない
-
[解決済み】OSError: [WinError 193] %1 は有効な Win32 アプリケーションではありません。
-
[解決済み】TypeError: 系列を <class 'float'> に変換することができません。
-
[解決済み] 'int'オブジェクトに'__getitem__'属性がない。
-
[解決済み】NameError: 名前 'self' が定義されていません。
-
[解決済み] 文字列を複数の単語境界のデリミタで単語に分割する
-
[解決済み] Pythonでカンマで区切られた文字列をリストに変換するには?