[解決済み] ピリオドとスペースを残して非ASCII文字を削除するにはどうすればよいですか?
2022-08-07 03:56:03
質問
私は.txtファイルを扱っています。ファイルから非ASCII文字を含まない文字列を取得したいです。しかし、スペースとピリオドは残しておきたいと考えています。現在、私はそれらも除去しています。以下はそのコードです。
def onlyascii(char):
if ord(char) < 48 or ord(char) > 127: return ''
else: return char
def get_my_string(file_path):
f=open(file_path,'r')
data=f.read()
f.close()
filtered_data=filter(onlyascii, data)
filtered_data = filtered_data.lower()
return filtered_data
スペースやピリオドを残すためにonlyascii()をどのように修正すればよいのでしょうか?あまり複雑ではないと想像しますが、私はそれを理解することができません。
どのように解決するのですか?
文字列から印刷不可能な文字を除外するには、次のようにします。 文字列.printable のようにします。
>>> s = "some\x00string. with\x15 funny characters"
>>> import string
>>> printable = set(string.printable)
>>> filter(lambda x: x in printable, s)
'somestring. with funny characters'
私のマシンではstring.printableが含まれています。
0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~ \t\n\r\x0b\x0c
EDIT: Python 3では、filterはiterableを返します。文字列を返すのが正しい方法でしょう。
''.join(filter(lambda x: x in printable, s))
関連
-
[解決済み] (grep) 非 ASCII 文字にマッチする正規表現ですか?
-
[解決済み] 割り当て後にリストが予期せず変更されました。その理由と防止策を教えてください。
-
[解決済み] Pythonの辞書からキーを削除するにはどうしたらいいですか?
-
[解決済み] どうすれば、文字列中のリテラルな中抜き文字を印刷し、また.formatを使用することができるのでしょうか?
-
[解決済み] JavaScriptで文字列からスペースを削除する方法は?
-
[解決済み] 文字列からすべての特殊文字、句読点、空白を削除します。
-
[解決済み】非ASCII文字を半角スペースで置換する方法
-
[解決済み】文字列から非ASCII文字を取り除くにはどうすればよいですか?(C#の場合)
-
[解決済み】ASCII以外の文字をすべてgrepする方法とは?
-
[解決済み] SQLAlchemy: 日付フィールドをフィルタリングする方法は?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] リスト内包とラムダ+フィルタの比較
-
[解決済み】非ASCII文字を半角スペースで置換する方法
-
[解決済み] PythonでのAWS Lambdaのインポートモジュールエラー
-
[解決済み] django.db.migrations.exceptions.InconsistentMigrationHistory
-
[解決済み] なぜ(0-6)は-6=偽なのか?重複
-
[解決済み] Ctrl-CでPythonスクリプトを終了できない
-
[解決済み] Flask でグローバル変数はスレッドセーフか?リクエスト間でデータを共有するには?
-
[解決済み] Celeryタスクのユニットテストはどのように行うのですか?
-
[解決済み] virtualenvsはどこに作成するのですか?
-
[解決済み] 新しいpip backtrackingの実行時問題の解決