[解決済み] Scikit-learnのデータセットをPandasのデータセットに変換する方法

2022-05-11 08:24:27

質問

Scikit-learnのBunchオブジェクトからPandasのDataFrameにデータを変換するにはどうしたらいいですか？

from sklearn.datasets import load_iris
import pandas as pd
data = load_iris()
print(type(data))
data1 = pd. # Is there a Pandas method to accomplish this?

どのように解決するのですか？

手動で pd.DataFrame のコンストラクタで、numpy配列( data ) とカラムの名前のリスト ( columns ). すべてを1つのDataFrameに収めるには、機能と対象を1つのnumpy配列に連結して、次のようにします。 np.c_[...] (で一つのnumpy配列にまとめることができます（ただし [] ):

import numpy as np
import pandas as pd
from sklearn.datasets import load_iris

# save load_iris() sklearn dataset to iris
# if you'd like to check dataset type use: type(load_iris())
# if you'd like to view list of attributes use: dir(load_iris())
iris = load_iris()

# np.c_ is the numpy concatenate function
# which is used to concat iris['data'] and iris['target'] arrays 
# for pandas column argument: concat iris['feature_names'] list
# and string list (in this case one string); you can make this anything you'd like..  
# the original dataset would probably call this ['Species']
data1 = pd.DataFrame(data= np.c_[iris['data'], iris['target']],
                     columns= iris['feature_names'] + ['target'])

[解決済み] Scikit-learnのデータセットをPandasのデータセットに変換する方法

質問

どのように解決するのですか？

関連

任意波形を生成してtxtで保存するためのPython実装

[解決済み] PandasでDataFrameの行を反復処理する方法

[解決済み] バイトを文字列に変換する

[解決済み] Pandasのカラム名のリネーム

[解決済み] Pandas DataFrameの行数を取得する方法は？

[解決済み] 一行ずつ追加してPandas Dataframeを作成する

[解決済み] pandasを使った "大量データ "ワークフロー【終了しました

[解決済み] pandasのDataFrameをCSVファイルに書き出す

[解決済み】Pandas DataFrameのカラムヘッダからリストを取得する。

[解決済み】pandasでカラムの種類を変更する

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

ピロウズ画像色処理の具体的な活用方法

Python Decorator 練習問題

Pythonの学習とデータマイニングのために知っておくべきターミナルコマンドのトップ10

Python LeNetネットワークの説明とpytorchでの実装

[解決済み】終了コード -1073741515 (0xC0000135)でプロセス終了）

[解決済み】TypeError: 系列を <class 'float'> に変換することができません。

[解決済み】LogisticRegression: Pythonでsklearnを使用して、未知のラベルタイプ： '連続'を使用しています。

[解決済み】Python: OverflowError: 数学の範囲エラー

[解決済み】django インポートエラー - core.managementという名前のモジュールがない

[解決済み] PandasでDataFrameの行を反復処理する方法