[Tensorflow-Error】CUDA_ERROR_OUT_OF_MEMORY:メモリが不足しています。
2022-02-12 11:12:49
Tensorflowでモデルを学習する際、以下のようなエラーが発生します。
デバイスから 3.77G (4046333952 bytes) の割り当てに失敗しました。CUDA_ERROR_OUT_OF_MEMORY: メモリ不足です。
メモリオーバーフローの問題は報告されているものの、通常のトレーニングには影響がないのですが、やはりこの問題がどこから来たのか知りたいところです。
さっそく、セッションの初期化コードから見てみましょう。
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=1.0)
config = tf.ConfigProto(gpu_options=gpu_options, allow_soft_placement=False, log_device_placement=False)
session = tf.Session(config=config)
プロセスごとのgpu_memory_fraction。 はグラフィックカードが使用可能な割合を表し、コード内で1に設定すると、グラフィックカードが100%使用されていることを意味するため、トレーニングで上記のエラーが報告されます。
次に、セッションの初期化コードを修正します。
config = tf.ConfigProto(allow_soft_placement=False, log_device_placement=False)
config.gpu_options.allow_growth = True
session = tf.Session(config=config)
tf.ConfigProto() パラメータで、config の初期化後に gpu_options 設定を削除して config.gpu_options.allow_growth = True を追加します。このオプションにより、セッションは現在のメモリサイズに基づいて自動的にビデオメモリを割り当て、そのすべてを使用しないようにすることができます。このオプションにより、セッションは現在のメモリサイズに基づいて自動的にビデオメモリを割り当て、そのすべてを使用しないため、最大限の占有率を確保することができます。
関連
-
ResNetの紹介
-
トーチの取り付けと使用
-
参照用シークレットを呼び出す:BN層詳細解説
-
PackagesNotFoundError: 次のパッケージは、現在のチャンネルから利用できません ソリューション
-
U-netのソースコード解説(Keras編)
-
Pytorch Deep Learningです。TypeError: 'builtin_function_or_method' object is not iterable エラーの解決方法
-
TypeError: 'module' object is not callable solution to [Keras] call "merge".
-
pytorchはエラーを報告します。ValueError: num_samples は正の整数値であるべきですが、num_samples=0 となりました。
-
tensorflow experience code error Adding visible gpu devices: 0 , モジュール 'tensorflow' には 'Session' という属性がありません。
-
AttributeError: 'tuple' オブジェクトには 'log_softmax' という属性がありません。
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
undefinedGoogLeNet 論文の翻訳 - 英語と中国語で書かれています。
-
xx.exe の 0x00007FF7A7B64FB3 でスローされた例外: 0xC0000005: 場所 0x00 を読み取るアクセス違反
-
Tensorflow 踩坑:ImportError: DLL のロードに失敗しました。指定されたモジュールが見つかりません。 TensorFlowのネイティブランタイムのロードに失敗しました。
-
tensorflowをインポートしています。ImportError: libcublas.so.9.0: cannot open shared object file: No such file or director
-
ImportError: libSM.so.6: cannot open shared object file: そのようなファイルやディレクトリはありません
-
Tensorflowのメタフィジカルエラーです。終了コード -1073741819 (0xC0000005)
-
カーネルが死んだようです」の解決法。自動的に再起動します" の解決方法
-
caffeのインストールで「error : too few arguments in function call」エラーが発生する。
-
Tensorflow-gpu2.0.0インストールとtensorflow-gpuインストール成功のテストプログラム。
-
AttributeError: モジュール 'pandas' には 'core' という属性がありません。