Intel Arc Pro B60 & B50 評測:24GB vs 16GB Homelab GPU

Intel Arc Pro B60 & B50 評測:24GB vs 16GB Homelab GPU

B60 和 B50 用的是同一顆 Battlemage G21 晶片,media engine 一樣,SR-IOV 支援一樣,差別就是 VRAM:B60 24GB,B50 16GB。這個差距在某些工作上其實蠻具體的,在某些工作上又幾乎感覺不到。 兩張卡都在同一台 host 上跑,所以比較數字反映的是卡本身的差異,不是平台造成的。 測試平台 Host OS: Proxmox VE,Debian GNU/Linux 13 (trixie),kernel 6.17.13-2-pve CPU: AMD EPYC 平台(雙插槽) RAM: 128GB ECC Driver stack: xe B60: Intel Arc Pro B60 24GB(PCI ID 8086:e211,sriov_totalvfs=7) B50: Intel Arc Pro B50 16GB(PCI ID 8086:e212,sriov_totalvfs=2) Container images: vllm-xpu-env(vLLM 0.17.2.dev,本地自建)、linuxserver/ffmpeg:latest […]

告別 ingress-nginx:Cilium Gateway API 遷移筆記

告別 ingress-nginx:Cilium Gateway API 遷移筆記

前陣子看到 ingress-nginx 宣布 deprecated,其實也不太意外,Kubernetes 官方推 Gateway API 也推了好一陣子了。我的叢集上跑著六個服務,一直都是用 ingress-nginx 做路由,於是趁這個機會全部遷移到 Cilium Gateway API。 本文記錄遷移過程和途中踩到的幾個坑。 環境 CNI:Cilium v1.18.6 TLS:cert-manager(Helm) DNS-01 Provider:Cloudflare Gateway API 快速介紹 在開始之前先簡單說明 Gateway API 的三個主要資源,不然後面看 YAML 會有點迷失。 GatewayClass 定義 Gateway 的實作方式,概念上類似 Ingress 的 ingressClassName。Cilium 安裝後會自動建立一個叫 cilium 的 GatewayClass。 Gateway 代表一個實際的 load balancer。一個 Gateway 可以有多個 listener,每個 listener 對應一個 port/protocol/hostname 的組合。 HTTPRoute 定義路由規則,指定流量要送到哪個 Service。跟 Ingress […]

六千多的雲端伺服器顯卡!Nvidia Tesla T10 實測分享

Tesla T10 GPU-Z

近期在逛中國閒魚時意外發現了一張獨特的顯示卡 – Tesla T10。這款源自專業數據中心的 GPU 原本是 NVIDIA 專門為雲端遊戲服務設計的產品,主要用於 GeForce NOW 雲端遊戲伺服器。現在這些退役的顯示卡進入了二手市場,在中國閒魚上目前約以 1350 人民幣(約 190 美金)價格販售。由於價格便宜,我買了兩張來研究其效能表現。

在 Kubernetes 上利用 Nvidia GPU 部署 LLM Chatbot

在 Kubernetes 上利用 Nvidia GPU 部署 LLM Chatbot

隨著人工智慧技術的快速發展,越來越多的企業和開發者希望在自己的系統中整合語言模型聊天機器人(LLM Chatbot)。本文旨在引導讀者如何在 Kubernetes 環境中使用 Nvidia GPU,來部署一個高效能的 LLM Chatbot,從安裝必要的驅動和工具到具體的部署步驟,逐一介紹。

Linux PSI (Pressure Stall Information) 指標的解讀與應用

如何監控 container 的 PSI 資訊

前言 當 CPU、記憶體或 I/O 裝置發生競爭時,工作負載會經歷延遲峰值、吞吐量損失,並且面臨 OOM 終止的風險。在沒有準確測量此類競爭的情況下,使用者被迫要麼保守地運用他們的硬體資源,要麼冒險經常遭受因過度設定而引起的中斷。在 Linux kernel 4.20 之後,Linux kernel 加入了 PSI (Pressure Stall Information) 這個資訊,讓使用者可以跟精確的了解到資源不足對整個系統的效能影響。本篇文章將會簡單介紹 PSI 跟如何解讀其資訊。

部署 Charmed Kubernetes with OpenStack Integrator

部署 Charmed Kubernetes with OpenStack Integrator

前言 Charmed Kuberenetes 是 Canonical 提供的 Kubernetes 部署方式,可以透過 juju 將 Kubernetes 部署至各種不同環境。 本篇將介紹如何部署 Charmed Kubernetes 至 OpenStack 上,並且利用 OpenStack Integrator 使用 OpenStack 提供 Persistent Volume 和 Load Balancer 給 Kubernetes 使用。