1. ホーム
  2. python

[解決済み] pandas series/dataframeの行を整数インデックスで選択する。

2022-03-19 11:01:09

質問

なぜか気になる df[2] はサポートされていませんが df.ix[2]df[2:3] はどちらも動作します。

In [26]: df.ix[2]
Out[26]: 
A    1.027680
B    1.514210
C   -1.466963
D   -0.162339
Name: 2000-01-03 00:00:00

In [27]: df[2:3]
Out[27]: 
                  A        B         C         D
2000-01-03  1.02768  1.51421 -1.466963 -0.162339

期待する df[2] と同じように動作します。 df[2:3] Python のインデックス作成規則と一致させるためです。単一の整数による行のインデックスをサポートしない設計上の理由はありますか?

解決方法は?

HYRYのコメント:0.11の新しいドキュメントを参照してください。

http://pandas.pydata.org/pandas-docs/stable/indexing.html

ここで、新しい演算子が登場します。 .iloc は整数インデックスのみを明示的にサポートし .loc は、ラベルインデックスのみを明示的にサポートする

例:こんなシナリオを想像してください

In [1]: df = pd.DataFrame(np.random.rand(5,2),index=range(0,10,2),columns=list('AB'))

In [2]: df
Out[2]: 
          A         B
0  1.068932 -0.794307
2 -0.470056  1.192211
4 -0.284561  0.756029
6  1.037563 -0.267820
8 -0.538478 -0.800654

In [5]: df.iloc[[2]]
Out[5]: 
          A         B
4 -0.284561  0.756029

In [6]: df.loc[[2]]
Out[6]: 
          A         B
2 -0.470056  1.192211

[] は行を(ラベルの位置で)スライスするだけです。