[解決済み] 文字列を複数の単語境界のデリミタで単語に分割する
2022-03-24 21:31:52
質問
やりたいことはかなり一般的な作業だと思うのですが、Webで調べても参考になるものがありません。句読点を含むテキストがあり、その単語のリストが欲しいのです。
"Hey, you - what are you doing here!?"
であるべきです。
['hey', 'you', 'what', 'are', 'you', 'doing', 'here']
しかし、Pythonの
str.split()
は1つの引数でしか動作しないので、私は空白で分割した後に句読点を持つすべての単語を持っています。何かアイデアはありますか?
解決方法を教えてください。
正規表現が正当化されるケース
import re
DATA = "Hey, you - what are you doing here!?"
print re.findall(r"[\w']+", DATA)
# Prints ['Hey', 'you', 'what', 'are', 'you', 'doing', 'here']
関連
-
[解決済み】お使いのCPUは、このTensorFlowバイナリが使用するようにコンパイルされていない命令をサポートしています。AVX AVX2
-
[解決済み] [Solved] sklearn error ValueError: 入力に NaN、infinity または dtype('float64') に対して大きすぎる値が含まれている。
-
[解決済み】インポートエラー。モジュール名 urllib2 がない
-
[解決済み】IndexError: invalid index to scalar variableを修正する方法
-
[解決済み] UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 20: ordinal not in range(128)
-
[解決済み] リストを均等な大きさの塊に分割するには?
-
[解決済み] 配列をチャンクに分割する
-
[解決済み] SwiftでStringを配列に分割する?
-
[解決済み] 任意の空白文字をデリミタとして文字列を分割する方法
-
[解決済み】大文字・小文字を区別しない「Contains(string)
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
pythonサイクルタスクスケジューリングツール スケジュール詳解
-
python implement mysql add delete check change サンプルコード
-
Pythonショートビデオクローラーチュートリアル
-
[解決済み】RuntimeWarning: invalid value encountered in double_scalars で numpy の除算ができない。
-
[解決済み】numpyの配列連結。"ValueError:すべての入力配列は同じ次元数でなければならない"
-
[解決済み] データ型が理解できない
-
[解決済み】 NameError: グローバル名 'xrange' は Python 3 で定義されていません。
-
[解決済み】NameError: 名前 'self' が定義されていません。
-
[解決済み】django インポートエラー - core.managementという名前のモジュールがない
-
[解決済み] Pythonで複数のデリミタを持つ文字列を分割する【重複】について