容器 | 大数据笔记

Welcome to runzhliu's blogs

Kubernetes Cloud Hypervisor实战: 构建安全sandbox边界

前言 在上一篇文章《Kubernetes Agent Sandbox实战: 调度AIO全能容器》中,我们深入探讨了如何在 Kubernetes 集群中使用 Agent Sandbox 技术来运行 AIO(A

2026/2/7
articleCard.readMore

Kubernetes Agent Sandbox实战: 调度AIO全能容器

背景与目标 本文将带领大家深入探索如何利用 agent-sandbox 控制器,在 Kubernetes 集群中高效调度 AIO (All-In-One) 容器。 我们要构建的是一个集成了 OpenCode(深度编程专家)与 Op

2026/2/1
articleCard.readMore

用Kubernetes快速部署openclaw

概述 这份文档记录了在新加坡华为云节点上,基于 K3s 部署 OpenClaw 的完整配置与实操过程。 基础设施概况 节点 ID: vip-proxy-1-1c44-13dd 容器引擎: K3s (v1.34.3+k3s1) 宿主机路径: /root/.openclaw-k8s (持久化存储) 部署

2026/1/31
articleCard.readMore

dcgm-exporter指标异常

概述 关于 DCGM Exporter 中 DCGM_FI_DEV_GPU_UTIL 存在异常值的问题,官方有相关的 issue 进行讨论,具体的表现是 DCGM_FI_DEV_GPU_UTIL 偶尔会被采集到异常大的值,超过了正常的 [0, 100] 区间。 问题影响 从下图可以发

2025/12/24
articleCard.readMore

基于scheduler-plugins扩展kube-scheduler

概述 笔者在之前的文章kube-scheduler的二次开发示例有提过说直接基于 kube-scheduler 的源码做二次开发,把需要增加的插件代码加入之后重新编译和构建

2025/8/10
articleCard.readMore

公有云ipv6访问家宽ipv6

概述 如果经常在公司有访问家里服务器/主机的需求,有很多方式,包括在公司电脑/内网做一些「不安全的」的配置,比如用 tailscale,cpol

2025/8/8
articleCard.readMore

kube-scheduler的二次开发示例

概述 本文以 Kubernetes v1.30.4 为例,详细讲解一下如何在原来的 kube-scheduler 的基础上,通过增加 Plugins 的方式,完成二次开发和上线验证。 调度场景 Kubernetes 原生的调度器里没有根据节点磁盘空

2025/8/6
articleCard.readMore

grafana-image-renderer插件使用

概述 grafana-image-renderer 这个插件安装之后,Grafana 支持通过 API 将 dashboard 导出成图片,不过官方镜像并没有直接将 grafana-image-renderer 插件安装进去,原因可能是图片渲染插件依赖很多系统的

2025/7/30
articleCard.readMore

k8s-dra-driver-gpu的安装部署和测试

概述 大模型时代,GPU 已经了各个大模型和互联网公司的重要资产,如何高效地使用 GPU 资源,最大限度地满足业务需求变成了基础架构部门的重点项目。而传

2025/7/2
articleCard.readMore

ingress简单账密

概述 很多人会在一个服务前面部署一个 Nginx 并且配置密码,来保证基础的访问安全,所以同理在 Ingress 上,一样是有一些参数可以进行这样的配置。 操作 1 2 3 4 5 6

2025/6/20
articleCard.readMore