隨著人工智慧技術的快速發展,越來越多的企業和開發者希望在自己的系統中整合語言模型聊天機器人(LLM Chatbot)。本文旨在引導讀者如何在 Kubernetes 環境中使用 Nvidia GPU,來部署一個高效能的 LLM Chatbot,從安裝必要的驅動和工具到具體的部署步驟,逐一介紹。
Nvidia
在 Proxmox VE 上使用 Nvidia vGPU
前言 前幾週在中國的二手平台上看到了很便宜的 Nvidia Tesla P4,由於 Tesla P4 是半高單槽顯示卡,又不需要額外插電,非常適合放在 1U 伺服器上做使用,於是就買了幾張來測試 vGPU 看看。本篇將會介紹如何在 Proxmox VE 上使用 Nvidia 的 vGPU 功能。