近期在逛中國閒魚時意外發現了一張獨特的顯示卡 – Tesla T10。這款源自專業數據中心的 GPU 原本是 NVIDIA 專門為雲端遊戲服務設計的產品,主要用於 GeForce NOW 雲端遊戲伺服器。現在這些退役的顯示卡進入了二手市場,在中國閒魚上目前約以 1350 人民幣(約 190 美金)價格販售。由於價格便宜,我買了兩張來研究其效能表現。
Table of Contents
硬體規格與效能
- 16GB GDDR6 記憶體
- 150W TDP 設計
- 單槽全高設計
- 原廠被動散熱設計
- PCIe 3.0 x16 介面
- TU102 晶片
- 基礎時脈:1065 MHz
- 最高 Boost 時脈:1590 MHz
- 記憶體時脈:1575 MHz
- 記憶體匯流排:256-bit
- 顯示記憶體:16GB GDDR6
效能測試
測試環境
測試環境皆為 VM。
Linux:
- Ubuntu 24.04 kernel 6.8.0-51-generic
- Nvidia Driver: 550.127.08
- CUDA Version: 12.4
- CPU: Eypc 7413 16 core vCPU
- RAM: 16GiB DDR4 3200 Mhz ECC REG
Windows:
- Windows 11 24H2 OS 組建 26100.2894
- Nvidia Driver: 560.81 (AWS Cloud Gaming Driver)
- CPU: Eypc 7413 16 core vCPU
- RAM: 16GiB DDR4 3200 Mhz ECC REG
遊戲效能
3DMark Time Spy GPU 分數:10092
3DMark Steel Nomad 分數:2338
效能大約接近 RTX 2070 Super 和 RTX 4060。
AI 運算效能
使用 Llama 3 8B 模型並利用 llama-bench 測試:
Q4_K 量化版本(4.58 GiB)
測試情境 | 生成速度 (tokens/s) |
---|---|
512 tokens | 62.10 |
1024 tokens | 60.41 |
4096 tokens | 52.43 |
8192 tokens | 41.46 |
F16 全精度版本(14.96 GiB)
測試情境 | 生成速度 (tokens/s) |
---|---|
512 tokens | 24.10 |
1024 tokens | 23.85 |
4096 tokens | 22.53 |
8192 token 由於記憶體不足無法測試。
功耗、散熱與溫度表現
顯卡的最高功耗為 150W,閒置時 (P8 狀態) 功耗約為 18W 左右。
由於是全被動散熱因此機殼需要提供足夠的風量才能壓制其溫度。
筆者是將此顯卡至於 Dell PowerEdge R7515 伺服器中使用,滿載時用大約 89% PWM 的風扇速度可以將顯示卡維持在 82-83°C 的溫度。
使用經驗
目前是將兩張 T10 分別裝載於 Dell PowerEdge R7515 上,一張用於 Windows 環境作為 remote gaming machine,另一張則用於 Linux 環境作為 Kubernetes 的 GPU 運算節點。
在實際應用上,無論是執行輕中度的遊戲或是運行 phi-4 等 AI 模型都相當順暢。不過最大的問題在於散熱控制:若關閉 Dell 伺服器的第三方 PCIe 卡 LFM (Linear Feet per Minute) 模式,GPU 溫度容易達到 86°C 而觸發降頻,此時系統風扇仍維持在較低轉速;但若開啟 LFM 模式,風扇會持續維持在 89% PWM 轉速,導致系統整體功耗增加約 100W,這在電費昂貴的 colocation 環境中並不理想。目前的解決方案是在需要時才手動調整風扇轉速。
以 1350 人民幣(約 190 美金)的價格來說,這張顯示卡的性價比相當高,推薦有興趣的玩家可以考慮入手。
優點
- Nvidia vGPU 支援
- 16GB 大容量顯示記憶體並且支援 ECC
- 單槽設計節省空間
- AI 運算效能優異
缺點
- 需要額外散熱方案
- 溫度控制要求高
- 功耗上限限制晶片效能
- 無輸出接口
結論
Tesla T10 完美展現了伺服器級硬體在消費市場的第二春。對於能夠克服其散熱限制,並且需要強大運算能力或是 VDI 解決方案的用戶來說,這是一個極具吸引力的選擇。特別推薦給具備基本硬體知識,且願意投入時間進行優化的使用者。
購買建議
適合:
- 預算有限的 AI 玩家
- 需要大容量顯示記憶體的專業用戶
- 需要 VDI 顯示卡加速解決方案的使用者
不適合:
- 一般消費者
- 追求即插即用體驗的用戶