[解決済み] 文字列を単語のリストに変換する?
2023-04-12 19:12:58
質問
Pythonを使って、文字列を単語のリストに変換しようとしています。私は次のようなものを取りたい。
string = 'This is a string, with words!'
そして、次のようなものに変換します。
list = ['This', 'is', 'a', 'string', 'with', 'words']
句読点や空白が省略されていることに注意してください。最速の方法は何でしょうか?
どのように解決するのか?
これを試してみてください。
import re
mystr = 'This is a string, with words!'
wordList = re.sub("[^\w]", " ", mystr).split()
どのように機能するか
ドキュメントから :
re.sub(pattern, repl, string, count=0, flags=0)
文字列中のpatternの左端の重複しない箇所をreplで置き換えた文字列を返す。パターンが見つからない場合は、stringは変更されずに返される。 replは文字列または関数である。
ということで、我々の場合は.
patternは英数字以外の文字です。
[を意味し、英数字と等しい。 [a-zA-Z0-9_] となります。
a~z、A~Z、0~9、アンダースコアのことです。
というわけで、英数字以外の文字にマッチして、スペースに置き換えます。
そして、split() で文字列をスペースで分割し、リストに変換しています。
ということで、'hello-world'
は'hello world'になります。
re.subで
とすると ['hello' , 'world'] となります。
split()の後
何か疑問が生じたら教えてください。
関連
-
[解決済み] 関数デコレータを作成し、それらを連鎖させるには?
-
[解決済み] JavaScriptで文字列が部分文字列を含むかどうかを確認する方法は?
-
[解決済み] C#のStringとstringの違いは何ですか?
-
[解決済み] 文字列の単語を反復処理するにはどうすればよいですか?
-
[解決済み] バイトを文字列に変換する
-
[解決済み] リストを均等な大きさの塊に分割するには?
-
[解決済み] モジュールの関数名(文字列)を使って、モジュールの関数を呼び出す。
-
[解決済み] 複数行の長い文字列を作成するためのPythonicな方法
-
[解決済み】大文字・小文字を区別しない「Contains(string)
-
[解決済み] Pythonのインスタンス変数とクラス変数
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] 2つの線分が交差しているかどうかを確認するにはどうすればよいですか?
-
[解決済み] Flaskで1時間ごとに関数を実行するようにスケジュールするには?
-
[解決済み] 文字列のリストを内容に基づいてフィルタリングする
-
[解決済み] Pythonで0xを使わずにhex()を使うには?
-
[解決済み] SQLAlchemy - テーブルのリストを取得する
-
[解決済み] 範囲指定された浮動小数点数のランダムな配列を生成します。
-
[解決済み] tensorflowのCPUのみのインストールでダイナミックライブラリ 'cudart64_101.dll' を読み込めなかった
-
[解決済み] CSVデータを処理する際、1行目のデータを無視する方法を教えてください。
-
[解決済み] Python 言語を決定するには?
-
[解決済み] Pythonの文字列書式をリストで使う