[解決済み] sedで非欲張り(消極的)な正規表現マッチング?
2022-02-25 23:09:22
質問
sedを使ってURLの行を整理し、ドメインだけを抽出しようとしています。
だから、から。
http://www.suepearson.co.uk/product/174/71/3816/
欲しい
http://www.suepearson.co.uk/
(末尾のスラッシュはあってもなくてもかまいません)
試してみました。
sed 's|\(http:\/\/.*?\/\).*|\1|'
と(欲張りでない量詞をエスケープする)。
sed 's|\(http:\/\/.*\?\/\).*|\1|'
が、欲張りでない量詞(
?
) が機能しないため、常に文字列全体とマッチしてしまいます。
どのように解決するのですか?
基本的なPosix/GNU正規表現も拡張Posix/GNU正規表現も、非貪欲量詞を認識しません。 幸いなことに、この文脈のためのPerlの正規表現はかなり簡単に手に入ります。
perl -pe 's|(http://.*?/).*|\1|'
関連
-
[解決済み] この文字にマッチしない」という意味の正規表現演算子はどれ?
-
[解決済み] 正規表現における角括弧と括弧の違いは何ですか?
-
[解決済み] アドレスフィールド検証のための正規表現
-
[解決済み] 正規表現における非捕捉グループとは何ですか?
-
[解決済み] XHTMLの自己完結型タグを除くオープンタグにマッチするRegEx
-
[解決済み] sedで改行をスペースに置き換えるには?
-
[解決済み] grepによるネガティブマッチング(fooを含まない行にマッチする)
-
[解決済み] 正規表現における「lazy」「greedy」の意味とは?
-
[解決済み] vimでマッチを欲張らないようにするにはどうしたらいいですか?
-
[解決済み] 貪欲 vs. 渋い vs. 所有格の修飾語
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】Vimで正規表現に置換すると、`E488: Trailing characters`が発生します。
-
[解決済み] 正規表現でのコロン記号の使用
-
[解決済み] アポストロフィの正規表現
-
[解決済み] 正規表現の主題文字列で空白を無視するには?
-
[解決済み] Regex オプション文字にマッチさせる方法
-
[解決済み] 文字列の完全一致のための正規表現
-
[解決済み] 正規表現は、文字列がターゲットで終わる場合にのみマッチします。
-
[解決済み] 正規表現 - 文字列で始まり、文字列で終わる
-
[解決済み] Githubの「ブランチ名パターン」の否定
-
[解決済み] awk で gsub を使ってファイル中の ("./") と (".txt") の文字を検索・置換する方法