1. ホーム
  2. パイソン

[解決済み】空のnumpy配列に新しい行を追加する方法

2022-04-12 14:18:21

質問

Pythonの標準的な配列を使うと、以下のようなことができます。

arr = []
arr.append([1,2,3])
arr.append([4,5,6])
# arr is now [[1,2,3],[4,5,6]]

しかし、numpyでは同じことができません。例えば

arr = np.array([])
arr = np.append(arr, np.array([1,2,3]))
arr = np.append(arr, np.array([4,5,6]))
# arr is now [1,2,3,4,5,6]

も調べてみました。 vstack を使用すると vstack を空の配列に適用すると、次のようになります。

ValueError: all the input array dimensions except for the concatenation axis must match exactly

では、numpyで空の配列に新しい行を追加するにはどうすればよいのでしょうか?

どのように解決するのですか?

必要な配列の開始方法です。

arr = np.empty((0,3), int)

これは空の配列ですが、適切な次元数を持っています。

>>> arr
array([], shape=(0, 3), dtype=int64)

そして、必ず軸0に沿って追加してください。

arr = np.append(arr, np.array([[1,2,3]]), axis=0)
arr = np.append(arr, np.array([[4,5,6]]), axis=0)

でも、@jonrsharpeさんのおっしゃる通りです。 実際、ループの中で加算するのであれば、最初の例のようにリストに加算して、最後にnumpy配列に変換する方がずっと速いでしょう。

In [210]: %%timeit
   .....: l = []
   .....: for i in xrange(1000):
   .....:     l.append([3*i+1,3*i+2,3*i+3])
   .....: l = np.asarray(l)
   .....: 
1000 loops, best of 3: 1.18 ms per loop

In [211]: %%timeit
   .....: a = np.empty((0,3), int)
   .....: for i in xrange(1000):
   .....:     a = np.append(a, 3*i+np.array([[1,2,3]]), 0)
   .....: 
100 loops, best of 3: 18.5 ms per loop

In [214]: np.allclose(a, l)
Out[214]: True

numpythonicなやり方はアプリケーションによって異なりますが、以下のような感じでしょうか。

In [220]: timeit n = np.arange(1,3001).reshape(1000,3)
100000 loops, best of 3: 5.93 µs per loop

In [221]: np.allclose(a, n)
Out[221]: True