[解決済み] Pythonの配列はなぜ遅いのか?
質問
期待した
array.array
はリストよりも高速です。配列は箱詰めされていないように見えるからです。
しかし、以下のような結果になってしまいます。
In [1]: import array
In [2]: L = list(range(100000000))
In [3]: A = array.array('l', range(100000000))
In [4]: %timeit sum(L)
1 loop, best of 3: 667 ms per loop
In [5]: %timeit sum(A)
1 loop, best of 3: 1.41 s per loop
In [6]: %timeit sum(L)
1 loop, best of 3: 627 ms per loop
In [7]: %timeit sum(A)
1 loop, best of 3: 1.39 s per loop
このような差の原因は何でしょうか?
解決方法は?
その
ストレージ
はquot;unboxed"ですが、Pythonは要素にアクセスするたびに、それを使って何かをするためにquot;box"(通常のPythonオブジェクトにそれを埋め込む)する必要があります。 例えば、あなたの
sum(A)
は配列を繰り返し、整数を1つずつ通常のPythonの
int
オブジェクトを作成します。 その分時間がかかります。 あなたの
sum(L)
すべてのボックス化は、リストが作成されたときに行われました。
つまり、一般的には配列の方が遅いのですが、必要なメモリはかなり少なくて済みます。
これは最近のPython 3のコードですが、Pythonが最初にリリースされたときからのすべてのCPythonの実装に同じ基本的な考え方が適用されます。
以下は、リストアイテムにアクセスするコードです。
PyObject *
PyList_GetItem(PyObject *op, Py_ssize_t i)
{
/* error checking omitted */
return ((PyListObject *)op) -> ob_item[i];
}
ほとんどないんですよ。
somelist[i]
を返すだけです。
i
のレイアウトに準拠した初期セグメントを持つ構造体へのポインタです。
struct PyObject
).
そして、ここで
__getitem__
の実装は
array
タイプコード付き
l
:
static PyObject *
l_getitem(arrayobject *ap, Py_ssize_t i)
{
return PyLong_FromLong(((long *)ap->ob_item)[i]);
}
生メモリは、プラットフォームネイティブのベクトルとして扱われます。
C
long
の整数値です。
i
'th
C long
が読み上げられ、次に
PyLong_FromLong()
が呼び出され、ネイティブの
C long
をPythonの
long
オブジェクトを作成します (Python 3 では、Python 2 の
int
と
long
は、実際には型として表示されます。
int
).
このボクシングは、Pythonの新しいメモリを割り当てる必要があります。
int
オブジェクトを生成し、ネイティブの
C long
のビットを注入します。 元の例の文脈では、このオブジェクトの寿命は非常に短いものです (ちょうど
sum()
を実行中の合計に追加するために、さらに時間が必要です。
int
オブジェクトを作成します。
CPythonの実装では、スピードの違いはここから来ていますし、これまでも、そしてこれからも来るでしょう。
関連
-
[解決済み】ImportError: PILという名前のモジュールがない
-
[解決済み】csv.Error:イテレータはバイトではなく文字列を返すべき
-
[解決済み】Python: SyntaxError: キーワードは式になり得ない
-
[解決済み] Pythonのリストメソッドであるappendとextendの違いは何ですか?
-
[解決済み] B "の印刷が "#"の印刷より劇的に遅いのはなぜですか?
-
[解決済み] Python 3で「1000000000000000 in range(1000000000000001)」はなぜ速いのですか?
-
[解決済み] 要素ごとの加算は、結合ループよりも分離ループの方がはるかに高速なのはなぜですか?
-
[解決済み] 配列の場合、なぜ a[5] == 5[a] になるのでしょうか?
-
[解決済み] 0.1fを0にすると、なぜ10倍もパフォーマンスが落ちるのですか?
-
[解決済み] Intel CPU の _mm_popcnt_u64 で、32 ビットのループカウンターを 64 ビットに置き換えると、パフォーマンスが著しく低下します。
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
ピロウズ画像色処理の具体的な活用方法
-
pythonを使ったオフィス自動化コード例
-
python call matlab メソッドの詳細
-
Python jiabaライブラリの使用方法について説明
-
任意波形を生成してtxtで保存するためのPython実装
-
[解決済み】ImportError: sklearn.cross_validation という名前のモジュールがない。
-
[解決済み】TypeError: re.findall()でバイトのようなオブジェクトに文字列パターンを使用することはできません。)
-
[解決済み】syntaxError: 'continue' がループ内で適切に使用されていない
-
[解決済み] 'int'オブジェクトに'__getitem__'属性がない。
-
[解決済み】ImportError: bs4という名前のモジュールがない(BeautifulSoup)