1. ホーム
  2. python

[解決済み] numpyの配列に対する反復処理

2022-05-08 09:37:16

質問

もっと冗長でない代替案はないのでしょうか。

for x in xrange(array.shape[0]):
    for y in xrange(array.shape[1]):
        do_stuff(x, y)

と思いついたのです。

for x, y in itertools.product(map(xrange, array.shape)):
    do_stuff(x, y)

これはインデントを1つ減らすことになりますが、それでもかなり醜いです。

この疑似コードのようなものを希望しています。

for x, y in array.indices:
    do_stuff(x, y)

そんなものは存在するのでしょうか?

解決するには?

を探しているのだと思います。 ndenumerate .

>>> a =numpy.array([[1,2],[3,4],[5,6]])
>>> for (x,y), value in numpy.ndenumerate(a):
...  print x,y
... 
0 0
0 1
1 0
1 1
2 0
2 1

パフォーマンスについて。リスト内包より少し遅いです。

X = np.zeros((100, 100, 100))

%timeit list([((i,j,k), X[i,j,k]) for i in range(X.shape[0]) for j in range(X.shape[1]) for k in range(X.shape[2])])
1 loop, best of 3: 376 ms per loop

%timeit list(np.ndenumerate(X))
1 loop, best of 3: 570 ms per loop

もし、パフォーマンスが気になるのであれば、もう少し最適化するために ndenumerate これは、配列への変換とループの2つの処理を行います。配列があることが分かっている場合は、配列に変換するために .coords 属性で指定されたフラットなイテレータです。

a = X.flat
%timeit list([(a.coords, x) for x in a.flat])
1 loop, best of 3: 305 ms per loop