警告:
稳定性未经验证,请勿用于生产环境
数据无价,谨慎操作
注意用电安全
如果你不清楚你在做什么,立即停止任何操作

前文:深得垃圾佬真传-纸皮机箱装服务器

买了TESLA T10和V100,原机箱体积(360x360(mm))导致散热和走线都受限制,于是用机箱包装箱搓了一个大号纸壳机箱。但是高度仍然不足,只能取消吊装方案。
内部概览:d87f96104302e3e2876d7f60d964577c.jpg

关于驱动

关于三张显卡驱动,其中:

安装驱动时,先双击使用安装程序安装V100使用的Data Center Driver驱动,然后在设备管理器手动安装P104使用的GeForce Game Ready驱动和T10使用的Cloud Gaming驱动。6cb3be32ef1b1c68160d74cb89ef19c6.png0a5318179778fd89bfccbb9c3b04c2d7.png297fa84bb3cefcb9a066aed2fd0090c3.png安装完成后,我的Z270由于PCIe通道不足重启会导致无法使用V100,其他型号未实测,请自行注意。

关于显卡模式

由于上文原因,我的服务器无法重启,而T10云游戏驱动由于用途是游戏渲染所以安装后默认为WDDM模式,如果改为TCC模式需要重启。这个问题的解决方法是:

  1. 命令提示符使用nvidia-smi -dm 1转换为TCC模式
  2. 使用nvidia-smi检查T10的模式是否显示为WDDM*(注意要显示*号,代表模式更改未应用)
  3. 设备管理器停用再启用T10
  4. 使用nvidia-smi检查T10的模式是否显示为TCC

关于供电

由于原本使用的500W长城电源功率不足,最多勉强带动T10+P104,面对V100的300W功耗,我选择收了一个二手800W昂达(带80 PLUS GOLD认证)*电源,使用PDD六块钱电源同步线连接,让800W电源带主板、CPU、显卡,500W电源继续共给硬盘,毕竟这个二手电源无法确定真伪,同时按照成色和积灰应该也经历过长时间使用,防止把硬盘也一套带走了(这硬盘待遇真好)。

*真伪未知

关于V100散热

V100的散热属实让人头疼,300W的功耗不是能轻易压住的,虽然有V100在服务器里服役时原配的服务器被动散热器,但是过大的体积以及吹透散热器的难度让人望而却步,而闲鱼上适配V100的水冷散热相当昂贵,还需要自行外接水路。最终找到一个可以将一体式水冷固定的散热方式,搭配二手360水冷。但是由于这个水冷的原配安装螺丝必须破坏性取下,将其强行固定的后果就是螺丝没法拧很紧导致散热有一定损耗。最终实测:Comfyui + AnythingV5 + 512x768连续生图32张最高停止在69℃,64张会缓慢上升到75℃,LM Studio + QwQ 32B q4连续对话10轮共5000+ token稳定67℃。