[解決済み] Pythonでhtmlをデータフレームに読み込む際に "html5libが見つからない "というエラーが発生する。
2022-02-11 16:45:46
質問
html5libについて、htmlデータフレームを読み込もうとすると、以下のようなエラーが発生します。
以下はそのコードです。
!pip install html5lib
!pip install lxml
!pip install beautifulSoup4
import html5lib
import lxml
from bs4 import BeautifulSoup
table_list = pd.read_html("http://www.psmsl.org/data/obtaining/")
これはエラーです。
ImportError Traceback (most recent call last)
<ipython-input-68-e24654a0a301> in <module>()
----> 1 table_list = pd.read_html("http://www.psmsl.org/data/obtaining/")
/home/sage/sage-8.0/local/lib/python2.7/site-packages/pandas/io/html.pyc in read_html(io, match, flavor, header, index_col, skiprows, attrs, parse_dates, tupleize_cols, thousands, encoding, decimal, converters, na_values, keep_default_na)
913 thousands=thousands, attrs=attrs, encoding=encoding,
914 decimal=decimal, converters=converters, na_values=na_values,
--> 915 keep_default_na=keep_default_na)
/home/sage/sage-8.0/local/lib/python2.7/site-packages/pandas/io/html.pyc in _parse(flavor, io, match, attrs, encoding, **kwargs)
737 retained = None
738 for flav in flavor:
--> 739 parser = _parser_dispatch(flav)
740 p = parser(io, compiled_match, attrs, encoding)
741
/home/sage/sage-8.0/local/lib/python2.7/site-packages/pandas/io/html.pyc in _parser_dispatch(flavor)
680 if flavor in ('bs4', 'html5lib'):
681 if not _HAS_HTML5LIB:
--> 682 raise ImportError("html5lib not found, please install it")
683 if not _HAS_BS4:
684 raise ImportError(
ImportError: html5lib not found, please install it
何かお手伝いいただけると助かります。 ありがとうございます。
解決方法は?
エラーメッセージを読むと、あなたは
html5lib
がインストールされています。してください。
pip install html5lib
をターミナルに入力してください。
jupyter notebookから呼び出している場合(ちょうど
!
) パッケージをロードするために、カーネルを再起動してみてください。
関連
-
[解決済み】ImportError: xlsxwriter という名前のモジュールがありません。
-
[解決済み] Pythonです。AttributeError: 'NoneType' オブジェクトには 'startswith' 属性がありません。
-
[解決済み] 同じファイル名が既に存在する場合、移動して置き換えるか?
-
[解決済み] cv2.createbackgroundsubtractormog2() のパラメータについて説明します.
-
[解決済み] インポートエラー; Quandlという名前のモジュールがない
-
[解決済み] matplotlibで科学的記法を制御するには?
-
[解決済み] リスト内包からのPython文字列
-
[解決済み] np.deleteとnp.s_。np_sの何がそんなに特別なんだ?
-
[解決済み] データフレーム列の名前によるドロップ
-
[解決済み] PandasとPythonでCSVファイルを読み込むとUnicodeDecodeErrorが発生する。
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】PyCharmが "PEP8: expected 2 blank lines, found 1 "と表示される。
-
[解決済み】ImportError: xlsxwriter という名前のモジュールがありません。
-
[解決済み] matplotlibのカラーバーのフォントサイズを変更する
-
[解決済み] Python 2 --> 3: 'zip' 型のオブジェクトは len() を持ちません。
-
[解決済み] トリプルクォートされた文字列リテラルのスキャン中に Python EOF が発生する
-
[解決済み] Python tkinterにおけるconfig()の有用性
-
[解決済み] リスト内包からのPython文字列
-
[解決済み] PandasでSeriesのDataFrameから1列を表示/印刷する
-
[解決済み] np.deleteとnp.s_。np_sの何がそんなに特別なんだ?
-
[解決済み] Pip install - Python 2.7 - Windows 7