Pythonデータマイニングでよく使われるAutoEDA5つのツールのまとめ
データ分析のプロセスを完了するために、人の代わりにいくつかの自動化されたツールを使用することができますか?この記事では、私は一般的なAutoEDAツールの在庫を取る、収集し、学ぶために歓迎し、サポートするように、記事の最後に技術交流会を提供し、チャットに歓迎します。
1. Pandasプロファイリング
https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html
Pandas Profiling
DataFrameに直接渡すことで解析処理を完了させ、結果をHTML形式で表示し、より強力な解析機能を持つ成熟したツールです。
- 機能:フィールドタイプ分析、変数分布分析、相関分析、欠損値分析、重複行分析
-
所要時間:少ない
2. オートビズ
https://github.com/AutoViML/AutoViz
AutoViz
結果を可視化し、画像で保存する美しいデータ分析ツールです。
- 機能:相関分析、数値変数の箱ひげ図、数値変数の分布図
-
時間がかかる:もっと
3. データプレップ
Dataprep
柔軟で強力なツールであり、筆者も愛用している。分析する列を指定でき、Notebookでインタラクティブに分析することも可能です。
- 特徴:フィールド型分析、変数分布分析、相関分析、欠損値分析、対話型分析。
-
時間がかかる:もっと
4. スウィートビズ
https://github.com/fbdesignpro/sweetviz
SweetViz
は強力なデータ分析ツールで、トレーニングセットとテストセット、およびターゲットラベルと特徴量の関係を分析するのに優れた仕事をします。
- 特徴:データセット比較分析、フィールドタイプ分析、変数分布分析、ターゲット変数分析
- 所要時間:中
5. D-テイル
https://github.com/man-group/dtale
D-Tale
最も強力なデータ分析ツールの1つで、一変量分析プロセスをよくサポートしています。
- 機能:フィールドタイプ分析、変数分布分析、相関分析、欠損値分析、対話型分析。
-
所要時間:中
テクニカルコミュニケーション
転載、ブックマーク、応援など、ご自由にどうぞ。
以上、Pythonのデータマイニングでよく使われるAutoEDA5つのツールについてまとめました。Pythonデータマイニングの詳細については、Script Houseの過去記事を検索するか、以下の記事を引き続きご覧ください。
関連
-
[解決済み】TypeError: 文字バッファオブジェクトを期待する
-
[解決済み】TypeError: 'encoding'はこの関数の無効なキーワード引数です。
-
[解決済み] PythonでXMLをきれいに印刷する
-
[解決済み] numpy の argpartition 出力を理解できない
-
[解決済み] OSError "を取得する。VideoFileClip関数で「[WinError 6] The handle is invalid」を取得する。
-
[解決済み] ValueError: dictにfieldnamesにないフィールドが含まれている。
-
[解決済み] OpenCVウェブカメラをKivyのユーザインタフェースに統合する
-
[解決済み] 標準エラーストリームのロギングを無効にする方法は?
-
ModuleNotFoundErrorについて。urllib3' という名前のモジュールはありません。
-
3つの位置引数を取るが、4つが与えられたエラー
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】お使いのCPUは、このTensorFlowバイナリが使用するようにコンパイルされていない命令をサポートしています。AVX AVX2
-
[解決済み】AttributeError: pandasのnp.object_d型を使用する文字列値では、.strアクセサしか使用できない
-
[解決済み】Pythonの__rlshift__、__ror__について
-
[解決済み】pytestでコンソールに印刷する方法は?
-
[解決済み] Pandasの内部結合がValueError: len(left_on) must equal the number of levels in index of "right "を出すのはなぜですか?
-
[解決済み] Tensorflow: セッションの作成に失敗しました
-
EOFError: pickle.load時に入力が尽きました。
-
python クロール陽性画像 mm131 (更新)
-
np.append()関数の使用法
-
Pythonのエラーです。ValueError: not enough values to unpack expected 3, got 2 (解凍するための十分な値がありません。