1. ホーム
  2. Linux

Nvidia グラフィックスカード 初期化に失敗しました NVML Driver/library version mismatch エラー解決法

2022-02-14 08:01:16
<パス
<ブロッククオート

この記事はエラーを記録しています Failed to initialize NVML: Driver/library version mismatch エラーの解決

質問の再掲載

$ nvidia-smi 

-->
Failed to initialize NVML: Driver/library version mismatch


課題分析

  • NVIDIAカーネルドライババージョンとシステムドライバが一致しません。

グラフィックスカードドライバーが使用するカーネルバージョンを表示する

cat /proc/driver/nvidia/version

-->
NVRM version: NVIDIA UNIX x86_64 Kernel Module 430.34 Wed Jun 26 12:19:48 CDT 2019
GCC version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.12)


  • カーネルバージョン Kernel Moduleは430.34、システムカーネルは16.04.12

システムドライバログの表示

cat /var/log/dpkg.log | grep nvidia

-->
2021-03-30 14:04:55 install libnvidia-compute-460-server:amd64 <none> 460.32.03-0ubuntu0.18.04.2
2021-03-30 14:04:55 status half-installed libnvidia-compute-460-server:amd64 460.32.03-0ubuntu0.18.04.2
2021-03-30 14:04:57 status unpacked libnvidia-compute-460-server:amd64 460.32.03-0ubuntu0.18.04.2
2021-03-30 14:04:57 status unpacked libnvidia-compute-460-server:amd64 460.32.03-0ubuntu0.18.04.2
2021-03-30 14:05:15 install nvidia-cuda-dev:amd64 <none> 9.1.85-3ubuntu1
2021-03-30 14:05:15 status half-installed nvidia-cuda-dev:amd64 9.1.85-3ubuntu1
2021-03-30 14:05:34 status unpacked nvidia-cuda-dev:amd64 9.1.85-3ubuntu1
2021-03-30 14:05:34 status unpacked nvidia-cuda-dev:amd64 9.1.85-3ubuntu1
2021-03-30 14:05:34 install nvidia-cuda-doc:all <none> 9.1.85-3ubuntu1
2021-03-30 14:05:34 status half-installed nvidia-cuda-doc:all 9.1.85-3ubuntu1
2021-03-30 14:05:38 status unpacked nvidia-cuda-doc:all 9.1.85-3ubuntu1
2021-03-30 14:05:38 status unpacked nvidia-cuda-doc:all 9.1.85-3ubuntu1
2021-03-30 14:05:38 install nvidia-cuda-gdb:amd64 <none> 9.1.85-3ubuntu1
2021-03-30 14:05:38 status half-installed nvidia-cuda-gdb:amd64 9.1.85-3ubuntu1
2021-03-30 14:05:39 status unpacked nvidia-cuda-gdb:amd64 9.1.85-3ubuntu1
2021-03-30 14:05:39 status unpacked nvidia-cuda-gdb:amd64 9.1.85-3ubuntu1
2021-03-30 14:05:39 install nvidia-profiler:amd64 <none> 9.1.85-3ubuntu1
2021-03-30 14:05:39 status half-installed nvidia-profiler:amd64 9.1.85-3ubuntu1



  • システムカーネル18.04に460.32ドライバが一度インストールされたことがわかります。

ドライバを見る

sudo dpkg --list | grep nvidia-*

-->
ii libnvidia-compute-460-server:amd64 460.32.03-0ubuntu0.18.04.2 amd64 NVIDIA libcompute package
ii libnvidia-container-tools 1.0.5-1 amd64 NVIDIA container runtime library (command-line tools)
ii libnvidia-container1:amd64 1.0.5-1 amd64 NVIDIA container runtime library
ii nvidia-container-runtime 3.1.4-1 amd64 NVIDIA container runtime
ii nvidia-container-toolkit 1.0.5-1 amd64 NVIDIA container runtime hook
ii nvidia-cuda-dev 9.1.85-3ubuntu1 amd64 NVIDIA CUDA development files
ii nvidia-cuda-doc 9.1.85-3ubuntu1 all NVIDIA CUDA and OpenCL documentation


  • ubuntu kernel 18.04でnvidia 460ドライバがインストールされていることが確認できます。
  • 実際のシステムカーネルバージョンとドライバの要件に矛盾があることが問題の原因です

解決方法

  • 既存のドライバをアンインストールして、再インストールする

ドライバのアンインストール

sudo /usr/bin/nvidia-uninstall
sudo apt-get --purge remove nvidia-*
sudo apt-get purge nvidia*
sudo apt-get purge libnvidia*


  • コマンドから何も出力されなくなるまで
sudo dpkg --list | grep nvidia-*


  • 再インストール
sudo chmod a+x NVIDIA-Linux-x86_64-450.80.02.run
sudo . /NVIDIA-Linux-x86_64-450.80.02.run -no-x-check -no-nouveau-check -no-opengl-files


-no-opengl-files ドライバファイルのみをインストールし、OpenGLファイルをインストールしない。

-no-x-check Xサービスをチェックせずにドライバをインストールします。

-no-nouveau-check ヌーヴォーをチェックせずにドライバをインストールします。

ドライバーのアップデート結果を表示する

$ nvidia-smi


<イグ

参考

  • https://blog.csdn.net/qq_40200387/article/details/90341107

  • https://www.zywvvd.com/2020/12/03/linux/driver/nvidia-driver-install-linux/