CUDA 및 tensorflow-gpu를 통해 딥러닝을 위한 GPU 환경 구축하기
추천글 : 【Python】 파이썬 목차
1. 정식 방법 [본문]
2. 추천 방법 [본문]
1. 정식 방법 [목차]
⑴ 개요
① GPU는 CPU에 비해 코어가 많아 대규모 데이터를 빠르게 처리할 수 있음 : 병렬 컴퓨터 관련
② 다만, 데이터를 전송하는 속도는 GPU가 CPU보다 더 느릴 수 있음
⑵ step 1. CUDA가 설치 가능한 GPU인지 확인
① 내 GPU 버전 확인 : Ctrl + Alt + Del → 작업 관리자 → 성능 → GPU 0
② 현재 필자가 사용중인 NVIDIA GeForce RTX 2060은 가능
⑶ step 2. Anaconda3 설치
① conda —version : 현재 버전을 알 수 있음
② 최신 버전을 설치하는 게 바람직하며 필자의 경우 conda 4.11.0
⑷ step 3. NVIDIA® GPU DRIVER
① https://www.nvidia.com/ko-kr/geforce/drivers/
② 필자는 GeForce RTX 20 Series → GeForce RTX 2060 → GEFORCE GAME READY 드라이브 - WHQL 설치
③ cmd 창에 들어간 뒤 “nvidia-smi”를 입력하면 설치됐는지 확인 가능
④ 여기까지는 대부분 쉽게 진행함
⑸ step 4. CUDA® Toolkit
① 적절한 버전의 CUDA를 설치해야 함 : 적절한 버전으로 설치하는 게 정말 중요함
② 필자는 CUDA Toolkit 10.0을 설치 : tensorflow==1.14.0을 원하므로
⑹ step 5. cuDNN
① 적절한 버전의 cuDNN을 설치해야 함 : 적절한 버전으로 설치하는 게 정말 중요함
② 필자는 cuDNN v7.6.2를 설치 : tensorflow==1.14.0을 원하므로
③ 압축을 풀면 bin 폴더, include 폴더, lib 폴더, NVIDIA_SLA_cuDNN_Support.txt이 나옴
④ bin 폴더 내 파일을 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin 내에 넣음
⑤ include 폴더 내 파일을 C:\Program Files\NVIDIA GPU Computing\Toolkit\CUDA\v10.2\include 내에 넣음
⑥ lib 폴더 내 파일을 C:\Program Files\NVIDIA GPU Computing\Toolkit\CUDA\v10.2\lib 내에 넣음
⑺ step 6. 실행
① Anaconda3 실행
② pip install tensorflow-gpu
○ 또는 conda install tensorflow-gpu
○ pip install tensorflow-gpu==1.14.0 처럼 적절한 버전을 명시해야 함
③ jupyter notebook
④ .ipynb에서 다음 코드를 실행
import tensorflow as tf
tf.__version__
from tensorflow.python.client import device_lib
device_lib.list_local_devices()
⑤ 작동 안하면 tensorflow를 다시 설치
⑥ 기본 [CPU:0] 가 아닌 [GPU:0] 가 추가로 보인다면 성공적으로 설치된 것
⑻ step 7. NVIDIA GPU DRIVER, CUDA, cuDNN 삭제
① 목적 : 재설치를 위해 필요하거나 영구적으로 삭제하기 위한 목적
② Windows 기준 : 제어판 → 프로그램 제거에서 다음 파일들을 제거함
○ NVIDIA CUDA Development 10.0
○ NVIDIA CUDA Documentation 10.0
○ NVIDIA 그래픽 드라이버 511.65
○ NVIDIA GeForce Experience 3.24.0.126
○ NVIDIA CUDA Samples 10.0
○ NVIDIA Tools Extension SDK (NVTX) - 64 bit
○ NVIDIA Nsight Compute v1.0
○ NVIDIA Nsight Visual Studio Edition 6.0.0.18227
○ NVIDIA CUDA Visual Studio Integration 10.0
○ NVIDIA HD 오디오 드라이버 1.3.39.3
○ NVIDIA FrameView SDK 1.2.4999.30397803
○ NVIDIA PhysX 시스템 소프트웨어 9.21.0713
③ Ubuntu 기준
○ Nvidia driver 삭제
sudo apt-get remove --purge '^nvidia-.*'
○ CUDA 삭제
sudo apt-get --purge remove 'cuda*'
sudo apt-get autoremove --purge 'cuda*'
○ CUDA 파일 삭제
sudo rm -rf /usr/local/cuda
### 또는 ###
sudo rm -rf /usr/local/cuda-10.0
2. 추천 방법 [목차]
⑴ 전략 : 자신의 PC 스펙 및 tensorflow 버전에 대해 진행한 포스팅을 구글링한 뒤, 그 포스팅의 절차를 참고
⑵ 예시
① Windows 7, tensorflow 1.14.0, CUDA Toolkit 10.0, cuDNN v7.6.2 (링크)
② GTX1660 Ti, Windows 10 64-bit, tensorflow 2.0.0, CUDA Toolkit 10.1, cuDNN v7.6.5 (링크)
③ GTX1660, tensorflow_gpu 2.1.0, CUDA Toolkit 10.1, cuDNN v7.6 (링크)
④ RTX3080, Window 10 64-bit, tensorflow-gpu 2.4.0, CUDA Toolkit 11.1, cuDNN v8.04 (링크)
⑤ RTX3090, Windows 10, tensorflow 2.4.1, python 3.8 anaconda, CUDA 11.0.3, cuDNN v8.0.4 (링크)
입력 : 2022.01.26 01:35
'▶ 자연과학 > ▷ Python' 카테고리의 다른 글
【Python】 파이썬 목차 (0) | 2022.05.06 |
---|---|
【Python】 파이썬 시각화를 위한 Bokeh 설치하기 (0) | 2022.03.07 |
【Python】 파이썬 주요 트러블슈팅 [01-20] (0) | 2021.12.01 |
【Python】 파이썬 유용 함수 모음 (0) | 2020.03.24 |
【Python】 'pip'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다. (5) | 2019.04.20 |
최근댓글