NVIDIA,FxxK YOU-纸皮机箱装服务器(续)及V100/T10/P104三卡驱动和显卡计算模式更改分享(AI ALL IN ONE)
警告:
稳定性未经验证,请勿用于生产环境
数据无价,谨慎操作
注意用电安全
如果你不清楚你在做什么,立即停止任何操作
前文:深得垃圾佬真传-纸皮机箱装服务器
买了TESLA T10和V100,原机箱体积(360x360(mm))导致散热和走线都受限制,于是用机箱包装箱搓了一个大号纸壳机箱。但是高度仍然不足,只能取消吊装方案。
内部概览:
关于驱动
关于三张显卡驱动,其中:
- V100使用Data Center Driver驱动553.62版本
(553.62-data-center-tesla-desktop-win10-win11-64bit-dch-international.exe) - P104使用GeForce Game Ready驱动572.83版本
(572.83-desktop-win10-win11-64bit-international-dch-whql.exe) - T10使用Cloud Gaming驱动572.16版本(云游戏驱动,请自行搜索该文件名)
(572.16_Cloud_Gaming_win10_win11_server2022_dch_64bit_international.exe)
安装驱动时,先双击使用安装程序安装V100使用的Data Center Driver驱动,然后在设备管理器手动安装P104使用的GeForce Game Ready驱动和T10使用的Cloud Gaming驱动。安装完成后,我的Z270由于PCIe通道不足重启会导致无法使用V100,其他型号未实测,请自行注意。
关于显卡模式
由于上文原因,我的服务器无法重启,而T10云游戏驱动由于用途是游戏渲染所以安装后默认为WDDM模式,如果改为TCC模式需要重启。这个问题的解决方法是:
- 命令提示符使用
nvidia-smi -dm 1
转换为TCC模式 - 使用
nvidia-smi
检查T10的模式是否显示为WDDM*(注意要显示*号,代表模式更改未应用) - 设备管理器停用再启用T10
- 使用
nvidia-smi
检查T10的模式是否显示为TCC
关于供电
由于原本使用的500W长城电源功率不足,最多勉强带动T10+P104,面对V100的300W功耗,我选择收了一个二手800W昂达(带80 PLUS GOLD认证)*电源,使用PDD六块钱电源同步线连接,让800W电源带主板、CPU、显卡,500W电源继续共给硬盘,毕竟这个二手电源无法确定真伪,同时按照成色和积灰应该也经历过长时间使用,防止把硬盘也一套带走了(这硬盘待遇真好)。
*真伪未知
关于V100散热
V100的散热属实让人头疼,300W的功耗不是能轻易压住的,虽然有V100在服务器里服役时原配的服务器被动散热器,但是过大的体积以及吹透散热器的难度让人望而却步,而闲鱼上适配V100的水冷散热相当昂贵,还需要自行外接水路。最终找到一个可以将一体式水冷固定的散热方式,搭配二手360水冷。但是由于这个水冷的原配安装螺丝必须破坏性取下,将其强行固定的后果就是螺丝没法拧很紧导致散热有一定损耗。最终实测:Comfyui + AnythingV5 + 512x768连续生图32张最高停止在69℃,64张会缓慢上升到75℃,LM Studio + QwQ 32B q4连续对话10轮共5000+ token稳定67℃。
大彬多更新一点这种内容,迎合广大人民群众对美好生活的需要😀
很用心的教程👍