Pythonラーニングノートです。TypeError: cannot use a string pattern on a bytes-like object とその解決法
2022-02-18 21:20:55
#! /usr/python3
インポートre
インポートUrllib .リクエスト
def gethtml(url):
ページ=urllib .リクエスト .urlopen(url)
html=page.read()
htmlを返す
def getimg(html):
reg = r'src="(.*??Ⅻ.jpg)"'
img=re.compile(reg)です。
html=html.decode('utf-8')#python3
imglist=re.findall(img,html)
x = 0
for imgurl in imglist:
urllib.request.urlretrieve(imgurl,'%s.jpg'%x)
x = x+1
html = gethtml("http://news.ifeng.com/a/20161115/50258273_0.shtml")
インポートre
インポートUrllib .リクエスト
def gethtml(url):
ページ=urllib .リクエスト .urlopen(url)
html=page.read()
htmlを返す
def getimg(html):
reg = r'src="(.*??Ⅻ.jpg)"'
img=re.compile(reg)です。
html=html.decode('utf-8')#python3
imglist=re.findall(img,html)
x = 0
for imgurl in imglist:
urllib.request.urlretrieve(imgurl,'%s.jpg'%x)
x = x+1
html = gethtml("http://news.ifeng.com/a/20161115/50258273_0.shtml")
print(getimg(html))する。
赤い部分はPython3.0以上のコードで、クロールの学習時に注意が必要です(私は以前はPython2.7、現在はPython3.5.2を使っています)。赤いコードがないと、以下のようになることがあります。
1.TypeError: cannot use string pattern on a bytes-like object この場合の解決策としては、文字列のパターンとして html=html.decode('utf-8')#python3 このようなコードです。
2. AttributeError: module 'urllib' has no attribute 'urlopen' この場合の解決策は、urllibをurllib.requestに変更することです。
関連
-
"Undefined symbols for architecture x86_64:" エラーを解決しました。
-
.NETで134217728バイトの許容メモリサイズを使い果たした(8192バイトを割り当てようとした)。解決方法
-
場所 0x00000004 の読み取りでアクセス違反が発生しました。
-
問題 free(): 無効な次のサイズ (fast): 0x0000000001475e70 ***
-
[UE4公式ドキュメント翻訳】Unreal Engine 4 For Unity Developers (UE4、ユニティデベロッパーズ向け)
-
Unity3d Drag and Drop script reports error スクリプトクラスが見つからないため、スクリプトコンポーネント "" を追加できません。
-
java.net.BindException: バインドに失敗しました。EADDRINUSE (アドレスは既に使用中です) 解決方法
-
Python3_TypeError: 'list' オブジェクトは呼び出し可能ではありません。
-
mscorlib.dll で "TargetInvocationException" 型の例外が発生するが、ユーザーコードで処理されない
-
adb shell prompt device not foundについて
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
ImportError の解決に成功しました。必要な依存関係 ['numpy'] がありません。
-
バンドルコマンドが見つかりません
-
列の数が 1 行目の値の数と一致しない 解決策
-
許容メモリサイズは134217728バイトで、問題は解決された php
-
mac git エラーを使用します。.git/FETCH_HEAD を開けない: パーミッションが拒否されました。
-
error: expect unqualified-id before 'delete' void delete(node* p,char a) ^.
-
ModuleNotFoundError を解決する。Pythonに'tensorflow._api'という名前のモジュールはありません。
-
QT5のQTimerは間違えやすい、正しい使い方
-
Python で 'str' と 'int' のインスタンス間でエラー '>=' がサポートされていない
-
Androidアプリケーション開発 - ビープ音とバイブレーションによる警告の実装