建设网站门户/公关公司排行榜
CUDA(Compute Unified Device Architecture)是NVIDIA推出的一种并行计算平台和编程模型,用于利用GPU的强大计算能力。以下是在不同操作系统上搭建CUDA开发环境的详细步骤:
一、准备工作
1. 检查GPU兼容性
- 访问NVIDIA官网,确认你的GPU支持CUDA(通常GeForce 8系列及以上、Quadro、Tesla等专业卡都支持)
- 记录GPU型号,后续安装驱动时需要
2. 检查系统要求
- 操作系统:Windows 10/11、Linux(Ubuntu、CentOS等)、macOS(仅支持到CUDA 11.7)
- 至少8GB RAM(推荐16GB以上)
- 预留至少10GB磁盘空间
二、安装NVIDIA驱动
1. 获取最新驱动
- 访问NVIDIA驱动下载页面:https://www.nvidia.com/Download/index.aspx
- 选择对应GPU型号、操作系统版本,下载最新稳定版驱动
2. 安装驱动
- Windows:双击安装程序,按提示完成安装(需重启)
- Linux:
- 禁用nouveau驱动(开源驱动,会与NVIDIA驱动冲突)
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
# 添加以下内容
blacklist nouveau
options nouveau modeset=0
# 保存后更新initramfs
sudo update-initramfs -u
# 重启系统
sudo reboot
- 进入tty模式(Ctrl+Alt+F1),停止图形界面
sudo systemctl stop lightdm # Ubuntu/Debian
sudo systemctl stop gdm # Fedora/CentOS
- 运行驱动安装程序
chmod +x NVIDIA-Linux-x86_64-*.run
sudo ./NVIDIA-Linux-x86_64-*.run
- 安装完成后重启系统
3. 验证驱动安装
nvidia-smi
# 应显示GPU信息、驱动版本等
三、安装CUDA Toolkit
1. 下载CUDA Toolkit
- 访问NVIDIA CUDA下载页面:https://developer.nvidia.com/cuda-downloads
- 选择操作系统、架构、版本等信息
- 推荐下载最新稳定版(如CUDA 12.x)
2. 安装CUDA Toolkit
- Windows:运行下载的安装程序,选择自定义安装(可取消勾选Visual Studio集成)
- Linux:
- 以.run文件为例:
chmod +x cuda_*.run
sudo ./cuda_*.run --silent --toolkit --samples --toolkitpath=/usr/local/cuda
- 或使用包管理器安装(以Ubuntu为例):
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.2.0/local_installers/cuda-repo-ubuntu2004-12-2-local_12.2.0-535.54.03-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-12-2-local_12.2.0-535.54.03-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-12-2-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda
3. 配置环境变量
- Windows:安装程序会自动配置
- Linux:
# 编辑 /.bashrc或 /.zshrc
echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
. 验证CUDA安装 nvcc --version
# 应显示CUDA版本信息# 编译并运行示例
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
make
./deviceQuery
# 应显示GPU信息和CUDA支持情况
四、安装cuDNN(深度学习加速库)
1. 注册NVIDIA开发者账号
- 访问:https://developer.nvidia.com/
- 注册并登录账号
2. 下载cuDNN
- 访问:https://developer.nvidia.com/cudnn
- 选择与CUDA版本匹配的cuDNN版本
- 下载对应操作系统的库文件(通常是压缩包)
3. 安装cuDNN
- Windows:
- 解压下载的文件
- 将bin、include、lib目录中的文件复制到CUDA安装目录对应的文件夹中
- Linux:
# 解压下载的文件
tar -xzvf cudnn-*.tgz
# 复制文件到CUDA目录
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn .h /usr/local/cuda/lib64/libcudnn
五、安装CUDA相关库和工具
1. 安装NCCL(多GPU通信库)
# Ubuntu/Debian
sudo apt-get install libnccl2 libnccl-dev# 或从源码安装
2. 安装TensorRT(高性能推理库)
- 访问:https://developer.nvidia.com/tensorrt
- 下载并安装适合你的CUDA版本的TensorRT
六、测试环境
1. 编译并运行CUDA示例
# 编译向量加法示例
cd /usr/local/cuda/samples/1_Utilities/vectorAdd
make
./vectorAdd
# 应显示计算结果和性能统计
2. 使用PyTorch或TensorFlow测试GPU支持
# PyTorch
import torch
print(torch.cuda.is_available()) # 应返回True
print(torch.cuda.device_count()) # 应返回GPU数量# TensorFlow
import tensorflow as tf
print(tf.test.is_gpu_available()) # 应返回True
七、常见问题及解决方法
1. 驱动与CUDA版本不兼容
- 检查NVIDIA官网的CUDA兼容性矩阵
- 升级/降级驱动或CUDA版本
2. Linux安装驱动后黑屏
- 进入tty模式,卸载驱动重新安装
- 检查nouveau是否已禁用
3. 环境变量未生效
- 确认路径正确
- 使用`echo $PATH`检查变量是否正确设置
- 尝试重启终端或系统
4. cuDNN安装问题
- 确认cuDNN版本与CUDA版本匹配
- 检查文件权限是否正确