1. ホーム
  2. スクリプト・コラム
  3. パイソン

Python データ可視化 JupyterLab ユーティリティ拡張 Mito

2022-01-26 11:24:29

JupyterLabは、Jupyterの本家本元が提供する最新のデータサイエンス制作ツールであり、ある意味Jupyter Notebookの後継として作られたものです。

ノートブックの作成、端末の操作、マークダウンテキストの編集、インタラクティブモードのオープン、csvファイルや画像の表示など、ウェブベースのIDEとして機能します。

JupyterLabの一番の魅力は、拡張プラグインが豊富なことです。以前、探索的なデータ分析にはnumpyとmatplotlibに頼らざるを得なかったことを思い出します。幸いなことに、そのような時代はとうに過ぎ去りました。

水戸はこちら

水戸の紹介

Mitoは、Excelを使用してデータセットの探索と変換を容易にする無料のJupyterLab拡張機能です。

Mitoを起動すると、Pandas Dataframeのスプレッドシートビューが表示されます。数回クリックするだけで、操作の作成、読み込み、更新、削除が可能です。

Mitoの起動方法

Mito でデータをロードし、スプレッドシートビューを表示するのは、以下のように簡単です。

import mitosheet
import pandas as pd
url = 'https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv'
iris = pd.read_csv(url)
mitosheet.sheet(iris)


Mitoは、データのフィルタリング、ソート、編集が可能な強力なスプレッドシートビューアを開きます。

ピボットテーブル

数回のクリックで、ピボットテーブルを作成します。sum、median、mean、count、uniqueなど、多くの一般的な集計をサポートしています。

ピボット・テーブルは、より広いテーブルの個々の項目を1つまたは複数の個別のカテゴリーに集約したグループ化された値表です。

水戸のすごい能力

表計算ソフトの計算式

動的な数式は、プログラミングに不慣れな人でも簡単に複雑なスプレッドシートを作成できるExcelのキラー機能です。もし、水戸がExcel流の動的数式をサポートしているとしたらどうだろう。この機能には本当に驚かされました。

以下の動画で、水戸の集計式の動きを確認してみてください。

可視化データ

近年、Pythonのデータ可視化ライブラリは、matplotlib、seaborn、plotlyなど、Pythonでわずかなコマンドで素晴らしい可視化を可能にするものが急増しています。

Mitoは、コードを書かずにデータを可視化することができ、棒グラフ、箱ひげ図、ヒストグラム、散布図に対応しています。

コードの自動生成

Mitoは、各操作をPandasのコードに変換し、同僚と共有することができます。これは経験の浅いデータサイエンティストにはありがたい機能です。いくつかクリックしてみたところ、Mitoは以下のようなコードスニペットを生成しました。

水戸のインストール

まず、以下のコマンドでMitoのインストーラーをダウンロードします。

python -m pip install mitoinstaller


そして、インストールは、実行するだけです。

python -m mitoinstaller install


上記はpythonデータ可視化JupyterLabユーティリティ拡張水戸の詳細ですが、JupyterLab拡張の詳細については、スクリプトハウスの他の関連記事に注意を払うしてください