環境
OS:Linux Ubuntu16.04
CPU:Intel Core i7-6800K
GPU:GeForce GTX1080
以前のアップデートなどにより一時的にGPUが認識されず、GUIなど様々な不具合が続出して困っていたが、ついに解決できたのでしっかりとメモ。
GPUドライバによって起こっていた不具合を代表的に上げると
- ログインループ
- デスクトップ環境が使えない
- TensorflowにRun time errorが起こる
- そもそもグラフィック処理が重い(CPUのグラフィクスを使用してるから当たり前)
- nvidia-smiを使いたかった(不具合ではないが)
ちなみに、今回の原因はbumblebeeが悪さをしていた。もし、どこのサイトに掲載されているやり方でもうまくいかなかったという人はぜひ参考にしてほしい。(他にもaptitudeを使ったからうまく言ったのかもしれないので、参考に)
ちなみに、bumlebeeとは、GPU関連の処理をノートPCように最適化してくれる?ような機能を持ったソフトウェアという認識である(よくわかってない)。
詳しくはwikiを見てね(>>Bumblebee – Arch Wiki<<)
では、解決手順を書いていこう。
まずは準備段階でnvidia とcudaの関連ソフトを削除
sudo apt-get --purge remove nvidia-* sudo apt-get --purge remove cuda-*
次に、aptitudeをインストール
sudo apt aptitude
aptitudeでbumblebeeがあるか確認(全部入力せず、”bumb”などで検索してもひっかかるよ)
sudo aptitude search bumblebee
これで、bumblebeeが見つかったら、そのパッケージを消去
sudo apt purge remove bumblebee
後処理
sudo apt autoclean;apt autoremove
sudo apt update;apt upgrade
再起動
sudo shutdown -rF now
ここまでで、やっとドライバのインストール準備完了
ここからは通常通りの手順でドライバをインストールすればいい。
ドライバインストール
ppaのリポジトリを登録
sudo add-apt-repository ppa:graphics-driver/ppa sudo apt-get update
ドライバをインストールする。今回はnvidia-410を選択(どのバージョンが最適かはわからないが、とりあえず他のサイトでもGTX1080で動いてたので)
sudo apt-get install nvidia-410
またまた再起動
sudo shutdown -rF now
詳しく理解していないが、nvidiaドライバを入れた時点でcuda tool-kit10.0も同時にインストールされていた。
確認で待望の
nvidia-smi
以下、出力(注:tensorflow実行中)
ひとまず、一安心。
ログインも問題なくでき、普段通りのGUI環境が使えるようになった。本当に良かった
普通って大事。
どうやら、LinuxカーネルバージョンやOSなど、非常に環境依存が強いNVIDIAなので、アップデートなどは慎重にやるべきなようだ。
コメント
[…] Ubuntu16.04 にNVIDIAドライバがインストールできないのを解決した話 […]