1. ホーム
  2. スクリプト・コラム
  3. パイソン

Pythonデータマイニングでよく使われるAutoEDA5つのツールのまとめ

2022-01-27 20:04:31

データ分析のプロセスを完了するために、人の代わりにいくつかの自動化されたツールを使用することができますか?この記事では、私は一般的なAutoEDAツールの在庫を取る、収集し、学ぶために歓迎し、サポートするように、記事の最後に技術交流会を提供し、チャットに歓迎します。

1. Pandasプロファイリング

https://pandas-profiling.github.io/pandas-profiling/docs/master/index.html

Pandas Profiling DataFrameに直接渡すことで解析処理を完了させ、結果をHTML形式で表示し、より強力な解析機能を持つ成熟したツールです。

  • 機能:フィールドタイプ分析、変数分布分析、相関分析、欠損値分析、重複行分析
  • 所要時間:少ない

2. オートビズ

https://github.com/AutoViML/AutoViz

AutoViz 結果を可視化し、画像で保存する美しいデータ分析ツールです。

  • 機能:相関分析、数値変数の箱ひげ図、数値変数の分布図
  • 時間がかかる:もっと

3. データプレップ

https://dataprep.ai/

Dataprep 柔軟で強力なツールであり、筆者も愛用している。分析する列を指定でき、Notebookでインタラクティブに分析することも可能です。

  • 特徴:フィールド型分析、変数分布分析、相関分析、欠損値分析、対話型分析。
  • 時間がかかる:もっと

4. スウィートビズ

https://github.com/fbdesignpro/sweetviz

SweetViz は強力なデータ分析ツールで、トレーニングセットとテストセット、およびターゲットラベルと特徴量の関係を分析するのに優れた仕事をします。

  • 特徴:データセット比較分析、フィールドタイプ分析、変数分布分析、ターゲット変数分析
  • 所要時間:中

5. D-テイル

https://github.com/man-group/dtale

D-Tale 最も強力なデータ分析ツールの1つで、一変量分析プロセスをよくサポートしています。

  • 機能:フィールドタイプ分析、変数分布分析、相関分析、欠損値分析、対話型分析。
  • 所要時間:中

テクニカルコミュニケーション

転載、ブックマーク、応援など、ご自由にどうぞ。

以上、Pythonのデータマイニングでよく使われるAutoEDA5つのツールについてまとめました。Pythonデータマイニングの詳細については、Script Houseの過去記事を検索するか、以下の記事を引き続きご覧ください。