[解決済み] Pythonで文字列のb-プレフィックスを取り除くには?
2022-05-18 14:07:37
質問
私がインポートしているツイートの多くが、次のような問題を起こしています。
b'I posted a new photo to Facebook'
を集めると
b
はバイトであることを示しています。しかし、これは問題になっています。というのも、私が最終的に書くCSVファイルでは
b
が消えず、将来のコードに支障をきたすからです。
を削除する簡単な方法はありますか?
b
という接頭辞を削除する簡単な方法はありますか?
私はテキストがutf-8でエンコードされている必要があるようです。
私が解析しているリンクコンテンツはこちらです。
https://www.dropbox.com/s/sjmsbuhrghj7abt/new_tweets.txt?dl=0
new_tweets = 'content in the link'
コードの試行
outtweets = [[tweet.text.encode("utf-8").decode("utf-8")] for tweet in new_tweets]
print(outtweets)
エラー
UnicodeEncodeError Traceback (most recent call last)
<ipython-input-21-6019064596bf> in <module>()
1 for screen_name in user_list:
----> 2 get_all_tweets(screen_name,"instance file")
<ipython-input-19-e473b4771186> in get_all_tweets(screen_name, mode)
99 with open(os.path.join(save_location,'%s.instance' % screen_name), 'w') as f:
100 writer = csv.writer(f)
--> 101 writer.writerows(outtweets)
102 else:
103 with open(os.path.join(save_location,'%s.csv' % screen_name), 'w') as f:
C:\Users\Stan Shunpike\Anaconda3\lib\encodings\cp1252.py in encode(self, input, final)
17 class IncrementalEncoder(codecs.IncrementalEncoder):
18 def encode(self, input, final=False):
---> 19 return codecs.charmap_encode(input,self.errors,encoding_table)[0]
20
21 class IncrementalDecoder(codecs.IncrementalDecoder):
UnicodeEncodeError: 'charmap' codec can't encode characters in position 64-65: character maps to <undefined>
どのように解決するのですか?
あなたが必要なのは
デコード
は
bytes
という文字列が必要です。
b = b'1234'
print(b.decode('utf-8')) # '1234'
関連
-
[解決済み] Pythonには文字列の'contains'サブストリングメソッドがありますか?
-
[解決済み] Pythonで現在時刻を取得する方法
-
[解決済み] Pythonで2つのリストを連結する方法は?
-
[解決済み] ファイルのコピー方法について教えてください。
-
[解決済み] Pythonでファイルやフォルダを削除する方法は?
-
[解決済み] リストの最後の要素を取得する方法
-
[解決済み] Pythonで文字列の部分文字列を取得するにはどうすればよいですか?
-
[解決済み] Pythonで文字列を小文字にするには?
-
[解決済み] リストの要素数を取得する方法
-
[解決済み】ネストされたディレクトリを安全に作成するには?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] Python 3 で文字列リテラルの前にある 'b' 文字 do を削除する [重複] [重複] 。
-
[解決済み] pandasのDataFrameから空のセルを含む行を削除する
-
[解決済み] 2つの弦をインターリーブさせる最もピトニックな方法
-
[解決済み] Pythonでzip(*[iter(s)]*n)はどのように動作するのですか?
-
[解決済み] asyncio.ensure_future vs. BaseEventLoop.create_task vs. simple coroutine?
-
[解決済み] Pythonで関数の引数として辞書の項目を渡すには?重複
-
[解決済み] リストスライスの割り当てはどのように行われるのですか?
-
[解決済み] Pythonでファイルがバイナリ(非テキスト)かどうかを検出するにはどうしたらいいですか?
-
[解決済み] Pythonを使ったMicrosoft SQLサーバへの接続
-
[解決済み] PILでPNG画像を文字列に書き出すには?