Gene WorkSpace

Cloud

Intel Arc Pro B60 & B50 評測：24GB vs 16GB Homelab GPU

Posted on March 26, 2026March 26, 2026by Gene Kuo

B60 和 B50 用的是同一顆 Battlemage G21 晶片，media engine 一樣，SR-IOV 支援一樣，差別就是 VRAM：B60 24GB，B50 16GB。這個差距在某些工作上其實蠻具體的，在某些工作上又幾乎感覺不到。兩張卡都在同一台 host 上跑，所以比較數字反映的是卡本身的差異，不是平台造成的。測試平台 Host OS： Proxmox VE，Debian GNU/Linux 13 (trixie)，kernel 6.17.13-2-pve CPU： AMD EPYC 平台（雙插槽） RAM： 128GB ECC Driver stack： xe B60： Intel Arc Pro B60 24GB（PCI ID 8086:e211，sriov_totalvfs=7） B50： Intel Arc Pro B50 16GB（PCI ID 8086:e212，sriov_totalvfs=2） Container images： vllm-xpu-env（vLLM 0.17.2.dev，本地自建）、linuxserver/ffmpeg:latest […]

No comments yet

Cloud

告別 ingress-nginx：Cilium Gateway API 遷移筆記

Posted on March 22, 2026March 22, 2026by Gene Kuo

前陣子看到 ingress-nginx 宣布 deprecated，其實也不太意外，Kubernetes 官方推 Gateway API 也推了好一陣子了。我的叢集上跑著六個服務，一直都是用 ingress-nginx 做路由，於是趁這個機會全部遷移到 Cilium Gateway API。本文記錄遷移過程和途中踩到的幾個坑。環境 CNI：Cilium v1.18.6 TLS：cert-manager（Helm） DNS-01 Provider：Cloudflare Gateway API 快速介紹在開始之前先簡單說明 Gateway API 的三個主要資源，不然後面看 YAML 會有點迷失。 GatewayClass 定義 Gateway 的實作方式，概念上類似 Ingress 的 ingressClassName。Cilium 安裝後會自動建立一個叫 cilium 的 GatewayClass。 Gateway 代表一個實際的 load balancer。一個 Gateway 可以有多個 listener，每個 listener 對應一個 port/protocol/hostname 的組合。 HTTPRoute 定義路由規則，指定流量要送到哪個 Service。跟 Ingress […]

No comments yet

Misc

六千多的雲端伺服器顯卡！Nvidia Tesla T10 實測分享

Posted on January 27, 2025January 27, 2025by Gene Kuo

近期在逛中國閒魚時意外發現了一張獨特的顯示卡 – Tesla T10。這款源自專業數據中心的 GPU 原本是 NVIDIA 專門為雲端遊戲服務設計的產品，主要用於 GeForce NOW 雲端遊戲伺服器。現在這些退役的顯示卡進入了二手市場，在中國閒魚上目前約以 1350 人民幣（約 190 美金）價格販售。由於價格便宜，我買了兩張來研究其效能表現。

No comments yet

Cloud

在 Arista 交換機上部署 Prometheus 監控系統

Posted on January 12, 2025January 12, 2025by Gene Kuo

概述本文將介紹如何在 Arista 交換機上使用 Docker 容器運行 node_exporter 和 snmp_exporter，以實現透過 Prometheus 監控交換機狀態的功能。

No comments yet

Cloud
...
- Kubernetes

在 Kubernetes 上利用 Nvidia GPU 部署 LLM Chatbot

Posted on February 28, 2024February 28, 2024by Gene Kuo

隨著人工智慧技術的快速發展，越來越多的企業和開發者希望在自己的系統中整合語言模型聊天機器人（LLM Chatbot）。本文旨在引導讀者如何在 Kubernetes 環境中使用 Nvidia GPU，來部署一個高效能的 LLM Chatbot，從安裝必要的驅動和工具到具體的部署步驟，逐一介紹。

No comments yet

Container
...
- Linux

如何監控 container 的 PSI 資訊

Posted on December 28, 2023February 28, 2024by Gene Kuo

前言在上一篇文章中，我們探討了 PSI (Pressure Stall Information) 以及如何監控系統的 PSI 資訊。本文將深入探討如何監控單一 container 的 PSI 資訊。

No comments yet

Linux

Linux PSI (Pressure Stall Information) 指標的解讀與應用

Posted on December 22, 2023February 28, 2024by Gene Kuo

前言當 CPU、記憶體或 I/O 裝置發生競爭時，工作負載會經歷延遲峰值、吞吐量損失，並且面臨 OOM 終止的風險。在沒有準確測量此類競爭的情況下，使用者被迫要麼保守地運用他們的硬體資源，要麼冒險經常遭受因過度設定而引起的中斷。在 Linux kernel 4.20 之後，Linux kernel 加入了 PSI (Pressure Stall Information) 這個資訊，讓使用者可以跟精確的了解到資源不足對整個系統的效能影響。本篇文章將會簡單介紹 PSI 跟如何解讀其資訊。

No comments yet

Cloud
...
- Container
  - Kubernetes
- OpenStack

部署 Charmed Kubernetes with OpenStack Integrator

Posted on December 16, 2023February 28, 2024by Gene Kuo

前言 Charmed Kuberenetes 是 Canonical 提供的 Kubernetes 部署方式，可以透過 juju 將 Kubernetes 部署至各種不同環境。本篇將介紹如何部署 Charmed Kubernetes 至 OpenStack 上，並且利用 OpenStack Integrator 使用 OpenStack 提供 Persistent Volume 和 Load Balancer 給 Kubernetes 使用。

No comments yet