1. ホーム
  2. パイソン

[解決済み】CSVファイルから読み込んだpandas DataFrameの "Unnamed: 0 "カラムを削除する方法は?

2022-04-02 09:33:56

質問

を読むと、ときどき、このような状況になることがあります。 csv から df という名前のインデックスのような不要なカラムができます。 unnamed:0 .

file.csv

,A,B,C
0,1,2,3
1,4,5,6
2,7,8,9

これでCSVを読み込む。

pd.read_csv('file.csv')

   Unnamed: 0  A  B  C
0           0  1  2  3
1           1  4  5  6
2           2  7  8  9

これは非常に迷惑な話です 誰かこれを取り除く方法を知っていますか?

解決方法は?

インデックスカラムに pd.to_csv(..., index=False) を参照して、そもそも無名のインデックスカラムを書き出さないようにしてください。 to_csv() ドキュメント .

In [37]:
df = pd.DataFrame(np.random.randn(5,3), columns=list('abc'))
pd.read_csv(io.StringIO(df.to_csv()))

Out[37]:
   Unnamed: 0         a         b         c
0           0  0.109066 -1.112704 -0.545209
1           1  0.447114  1.525341  0.317252
2           2  0.507495  0.137863  0.886283
3           3  1.452867  1.888363  1.168101
4           4  0.901371 -0.704805  0.088335

と比較する。

In [38]:
pd.read_csv(io.StringIO(df.to_csv(index=False)))

Out[38]:
          a         b         c
0  0.109066 -1.112704 -0.545209
1  0.447114  1.525341  0.317252
2  0.507495  0.137863  0.886283
3  1.452867  1.888363  1.168101
4  0.901371 -0.704805  0.088335

また、オプションで read_csv を渡すことで、最初のカラムがインデックスカラムであることを示します。 index_col=0 :

In [40]:
pd.read_csv(io.StringIO(df.to_csv()), index_col=0)

Out[40]:
          a         b         c
0  0.109066 -1.112704 -0.545209
1  0.447114  1.525341  0.317252
2  0.507495  0.137863  0.886283
3  1.452867  1.888363  1.168101
4  0.901371 -0.704805  0.088335