▶ 자연과학/▷ Python

【Python】 CUDA 및 tensorflow-gpu를 통해 딥러닝을 위한 GPU 환경 구축하기

초록E 2022. 1. 26. 01:44

CUDA 및 tensorflow-gpu를 통해 딥러닝을 위한 GPU 환경 구축하기

 

추천글 :  【Python】  파이썬 목차


1. 정식 방법 [본문]

2. 추천 방법 [본문]  


 

1. 정식 방법 [목차]

⑴ 개요

① GPU는 CPU에 비해 코어가 많아 대규모 데이터를 빠르게 처리할 수 있음 : 병렬 컴퓨터 관련

② 다만, 데이터를 전송하는 속도는 GPU가 CPU보다 더 느릴 수 있음

step 1. CUDA가 설치 가능한 GPU인지 확인 

 

CUDA GPUs

Your GPU Compute Capability Are you looking for the compute capability for your GPU, then check the tables below. NVIDIA GPUs power millions of desktops, notebooks, workstations and supercomputers around the world, accelerating computationally-intensive ta

developer.nvidia.com

① 내 GPU 버전 확인 : Ctrl + Alt + Del → 작업 관리자 → 성능 → GPU 0

② 현재 필자가 사용중인 NVIDIA GeForce RTX 2060은 가능

step 2. Anaconda3 설치 

 

【Python】 파이썬에서 tensorflow 환경 조성 및 Jupyter 사용법

파이썬에서 tensorflow 환경 조성 및 Jupyter 사용법 추천글 : 【Python】 파이썬 목차 1. 개요 [본문] 2. Anaconda 설치 [본문] 3. Anaconda Prompt (anaconda3) [본문] 4. Jupyter 설치 [본문] 1. 개요 [목차] ⑴ Tensorflow, Ke

nate9389.tistory.com

① conda —version : 현재 버전을 알 수 있음

② 최신 버전을 설치하는 게 바람직하며 필자의 경우 conda 4.11.0

step 3. NVIDIA® GPU DRIVER

https://www.nvidia.com/ko-kr/geforce/drivers/

 

최신 공식 GeForce 드라이버 다운로드

PC 게이밍 환경을 향상하고 앱을 더 빠르게 실행할 수 있도록 최신 공식 GeForce 드라이버를 다운로드하세요.

www.nvidia.com

② 필자는 GeForce RTX 20 Series → GeForce RTX 2060 → GEFORCE GAME READY 드라이브 - WHQL 설치

③ cmd 창에 들어간 뒤 “nvidia-smi”를 입력하면 설치됐는지 확인 가능

④ 여기까지는 대부분 쉽게 진행함

step 4. CUDA® Toolkit 

적절한 버전의 CUDA를 설치해야 함 : 적절한 버전으로 설치하는 게 정말 중요함

② 필자는 CUDA Toolkit 10.0을 설치 : tensorflow==1.14.0을 원하므로

step 5. cuDNN

적절한 버전의 cuDNN을 설치해야 함 : 적절한 버전으로 설치하는 게 정말 중요함

② 필자는 cuDNN v7.6.2를 설치 : tensorflow==1.14.0을 원하므로

③ 압축을 풀면 bin 폴더, include 폴더, lib 폴더, NVIDIA_SLA_cuDNN_Support.txt이 나옴

④ bin 폴더 내 파일을 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin 내에 넣음

⑤ include 폴더 내 파일을 C:\Program Files\NVIDIA GPU Computing\Toolkit\CUDA\v10.2\include 내에 넣음

⑥ lib 폴더 내 파일을 C:\Program Files\NVIDIA GPU Computing\Toolkit\CUDA\v10.2\lib 내에 넣음

step 6. 실행

① Anaconda3 실행

② pip install tensorflow-gpu

○ 또는 conda install tensorflow-gpu

○ pip install tensorflow-gpu==1.14.0 처럼 적절한 버전을 명시해야 함

③ jupyter notebook

④ .ipynb에서 다음 코드를 실행

 

import tensorflow as tf
tf.__version__
from tensorflow.python.client import device_lib
device_lib.list_local_devices()

 

⑤ 작동 안하면 tensorflow를 다시 설치

⑥ 기본 [CPU:0] 가 아닌 [GPU:0] 가 추가로 보인다면 성공적으로 설치된 것

step 7. NVIDIA GPU DRIVER, CUDA, cuDNN 삭제 

① 목적 : 재설치를 위해 필요하거나 영구적으로 삭제하기 위한 목적

② Windows 기준 : 제어판 → 프로그램 제거에서 다음 파일들을 제거함

○ NVIDIA CUDA Development 10.0

○ NVIDIA CUDA Documentation 10.0

○ NVIDIA 그래픽 드라이버 511.65

○ NVIDIA GeForce Experience 3.24.0.126

○ NVIDIA CUDA Samples 10.0

○ NVIDIA Tools Extension SDK (NVTX) - 64 bit

○ NVIDIA Nsight Compute v1.0

○ NVIDIA Nsight Visual Studio Edition 6.0.0.18227

○ NVIDIA CUDA Visual Studio Integration 10.0

○ NVIDIA HD 오디오 드라이버 1.3.39.3

○ NVIDIA FrameView SDK 1.2.4999.30397803

NVIDIA PhysX 시스템 소프트웨어 9.21.0713

③ Ubuntu 기준

○ Nvidia driver 삭제  

 

sudo apt-get remove --purge '^nvidia-.*'

 

○ CUDA 삭제 

 

sudo apt-get --purge remove 'cuda*'
sudo apt-get autoremove --purge 'cuda*'

 

○ CUDA 파일 삭제 

 

sudo rm -rf /usr/local/cuda
### 또는 ###
sudo rm -rf /usr/local/cuda-10.0

 

 

2. 추천 방법 [목차]

⑴ 전략 : 자신의 PC 스펙 및 tensorflow 버전에 대해 진행한 포스팅을 구글링한 뒤, 그 포스팅의 절차를 참고

⑵ 예시

① Windows 7, tensorflow 1.14.0, CUDA Toolkit 10.0, cuDNN v7.6.2 (링크)

② GTX1660 Ti, Windows 10 64-bit, tensorflow 2.0.0, CUDA Toolkit 10.1, cuDNN v7.6.5 (링크)

③ GTX1660, tensorflow_gpu 2.1.0, CUDA Toolkit 10.1, cuDNN v7.6 (링크)

④ RTX3080, Window 10 64-bit, tensorflow-gpu 2.4.0, CUDA Toolkit 11.1, cuDNN v8.04 (링크)

⑤ RTX3090, Windows 10, tensorflow 2.4.1, python 3.8 anaconda, CUDA 11.0.3, cuDNN v8.0.4 (링크

 

입력 : 2022.01.26 01:35