1. ホーム
  2. python

[解決済み] Numpyの配列からPandas DataFrameを作成する。インデックスカラムとカラムヘッダはどのように指定するのですか?

2022-03-14 18:40:28

質問

以下のような行ラベルと列名を持つ2次元配列を表す、リストのリストからなるNumpy配列があります。

data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])

結果として得られるDataFrameは、Row1とRow2がインデックス値、Col1とCol2がヘッダ値となるようにしたい。

インデックスは以下のように指定できますね。

df = pd.DataFrame(data,index=data[:,0]),

しかし、カラムヘッダーをどのように設定すればよいのかわかりません。

どのように解決しますか?

を指定する必要があります。 data , indexcolumns から DataFrame のように、コンストラクタを使用します。

>>> pd.DataFrame(data=data[1:,1:],    # values
...              index=data[1:,0],    # 1st column as index
...              columns=data[0,1:])  # 1st row as the column names

編集 : @joris のコメントと同様に、上記のように変更する必要があるかもしれません。 np.int_(data[1:,1:]) を使用すると、正しいデータ型になります。