1. ホーム
  2. python

[解決済み] インデックスを持たないデータフレーム列の最後の値の取得

2022-02-10 08:41:19

質問

次のようなDataFrameがあるとします。

df = pd.DataFrame(np.random.randn(10,5), columns = ['a','b','c','d','e'])

で、e列の最後の値を取り出したいのですが、できました。

df['e'].tail(1)

しかし、これではインデックス9を持つ系列を返してしまいます。理想を言えば、値を直接扱える数値として取得したいのです。

np.array(df['e'].tail(1))

しかし、これでは実際に作業する前に、その0番目の要素にアクセス/コールする必要があります。

どのように解決するのですか?

を試してみてください。 iloc というメソッドがあります。

In [26]: df
Out[26]: 
          a         b         c         d         e
0 -1.079547 -0.722903  0.457495 -0.687271 -0.787058
1  1.326133  1.359255 -0.964076 -1.280502  1.460792
2  0.479599 -1.465210 -0.058247 -0.984733 -0.348068
3 -0.608238 -1.238068 -0.126889  0.572662 -1.489641
4 -1.533707 -0.218298 -0.877619  0.679370  0.485987
5 -0.864651 -0.180165 -0.528939  0.270885  1.313946
6  0.747612 -1.206509  0.616815 -1.758354 -0.158203
7 -2.309582 -0.739730 -0.004303  0.125640 -0.973230
8  1.735822 -0.750698  1.225104  0.431583 -1.483274
9 -0.374557 -1.132354  0.875028  0.032615 -1.131971

In [27]: df['e'].iloc[-1]
Out[27]: -1.1319705662711321

また、スカラーを使用する場合は、以下のようになります。 iat の方が高速です。から ドキュメント :

スカラー値にアクセスしたいだけなら、最も速い方法は atiat メソッドが実装されており、すべてのデータ構造の

In [28]: df.e.iat[-1]
Out[28]: -1.1319705662711321

ベンチマークを行う。

In [31]: %timeit df.e.iat[-1]
100000 loops, best of 3: 18 µs per loop

In [32]: %timeit df.e.iloc[-1]
10000 loops, best of 3: 24 µs per loop