容器 | 大数据笔记

Welcome to runzhliu's blogs

基于scheduler-plugins扩展kube-scheduler

概述 笔者在之前的文章kube-scheduler的二次开发示例有提过说直接基于 kube-scheduler 的源码做二次开发,把需要增加的插件代码加入之后重新编译和构建

2025/8/10
articleCard.readMore

公有云ipv6访问家宽ipv6

概述 如果经常在公司有访问家里服务器/主机的需求,有很多方式,包括在公司电脑/内网做一些「不安全的」的配置,比如用 tailscale,cpol

2025/8/8
articleCard.readMore

kube-scheduler的二次开发示例

概述 本文以 Kubernetes v1.30.4 为例,详细讲解一下如何在原来的 kube-scheduler 的基础上,通过增加 Plugins 的方式,完成二次开发和上线验证。 调度场景 Kubernetes 原生的调度器里没有根据节点磁盘空

2025/8/6
articleCard.readMore

grafana-image-renderer插件使用

概述 grafana-image-renderer 这个插件安装之后,Grafana 支持通过 API 将 dashboard 导出成图片,不过官方镜像并没有直接将 grafana-image-renderer 插件安装进去,原因可能是图片渲染插件依赖很多系统的

2025/7/30
articleCard.readMore

k8s-dra-driver-gpu的安装部署和测试

概述 大模型时代,GPU 已经了各个大模型和互联网公司的重要资产,如何高效地使用 GPU 资源,最大限度地满足业务需求变成了基础架构部门的重点项目。而传

2025/7/2
articleCard.readMore

ingress简单账密

概述 很多人会在一个服务前面部署一个 Nginx 并且配置密码,来保证基础的访问安全,所以同理在 Ingress 上,一样是有一些参数可以进行这样的配置。 操作 1 2 3 4 5 6

2025/6/20
articleCard.readMore

Cilium模式下部署node-local-dns

概述 node-local-dns 的作用主要如下: 使用当前的dns体系结构,如果没有本地kube-dns/coredns实例,则具有最高dns qps的pod可能必须延伸

2025/5/30
articleCard.readMore

nvitop-exporter编译和部署

概述 nvitop 可以提升 GPU 的可观测性,而 nvitop 项目里还提供了 nvitop-exporter 可以将相关的 GPU 指标以 Prometheus 的表格格式提供采集,对提升 GPU 的可观测性是非常有帮助的。 镜像 nvitop 在v1.5

2025/5/17
articleCard.readMore

poe2openai部署

概述 因为个人常用的 AI 工具是 Poe,且已经是订阅用户了,但比较可惜的是,Poe 没有提供 OpenAI API 的接入方式,所以无法直接使用 Poe 的 API 来调用 OpenAI 的模型。G

2025/5/16
articleCard.readMore

用Gitea做Charts仓库

概述 当 K8S 集群引入越来越多的组件之后,要维护的 Helm Charts 的数量会越来越多,业界关于存储 Helm Charts 的方式也有很多种,常见的有 Harbor,以及 ChartMuseum 等等,笔者一

2025/5/10
articleCard.readMore