陈

陈少文的网站

容器部署中间件

1. ClickHouse 单节点配置环境变量 1 2 3 4 5 6 7 8 export CONTAINER_CLI=nerdctl export IMAGE=clickhouse/clickhouse-server:24 export CLICKHOUSE_INSTANCE_NAME=clickhouse export CH_DATA=/data/ops/clickhouse/$CLICKHOUSE_INSTANCE_NAME mkdir -p $CH_DATA/data $CH_DATA/log export CLICKHOUSE_PORT=9000 export CLICKHOUSE_USER=default export CLICKHOUSE_PASSWORD=xxxxxx 启动服务 1 2 3 4 5 6 7 8 9 10 11 12 13 14 $CONTAINER_CLI run -d \ --name $CLICKHOUSE_INSTANCE_NAME \ --restart always \ --network host \ --ulimit memlock=-1 \ --ulimit stack=67108864 \ --ulimit nofile=1048576:1048576 \ --memory-swappiness=0 \ -v $CH_DATA/data:/var/lib/clickhouse \ -v $CH_DATA/log:/var/log/clickhouse-server \ -e CLICKHOUSE_USER=$CLICKHOUSE_USER \ -e CLICKHOUSE_PASSWORD=$CLICKHOUSE_PASSWORD \ -e CLICKHOUSE_PORT=$CLICKHOUSE_PORT \ $IMAGE 测试连接 1 $CONTAINER_CLI exec -it $CLICKHOUSE_INSTANCE_NAME clickhouse-client --host 127.0.0.1 --port $CLICKHOUSE_PORT 打印交付结果 1 2 3 4 5

陈少文的网站

容器部署中间件

容器部署多节点 FoundationDB 及运维

多机多盘 minio 集群不同纠删码配置在 IPoIB 下的性能测试

多机多盘 MinIO 集群在不同纠删码配置下的性能测试

使用 HAProxy 代理 MinIO 及性能测试

MinIO 多节点多盘部署与运维

Cursor 之下，何以立足

你也可以这样落地 AI Agent - MCP 篇

阿里云 eRDMA 测试及 PD 分离应用部署

你也可以这样落地 AI Agent - 运维事件篇

常见的几种 LLM Agent 架构

你也可以这样落地 AI Agent - 案例篇

ext4、xfs、zfs、btrfs 在 RAID6 下的性能测试

RAID 下 ZFS 运维操作

RAID 下 XFS 运维操作

RAID 下 Btrfs 运维操作

xfs 在各种 RAID 下的性能测试

RAID 存储技术

使用 LLaMA-Factory 微调 Qwen3 模型

vLLM 部署 PD 分离应用

使用 lmcache 能显著改善模型推理的 TTFT

什么是 Prefix Cache

NVIDIA RTX 5090 推理测试

什么是模型量化

Kubernetes 基础环境要求

如何升级 Kubernetes 节点的 cgroup 版本

在服务器上使用 claude-code

常用 NPU 运维及故障处理

NVIDIA DCGM 使用指南

如何清理僵尸进程

使用 VLLM Benchmark 进行模型性能测试

眼看他拔地起，眼看他化作泥 - KubeSphere

在 Kubernetes 集群部署 Dragonfly

history 命令使用

AI 相关论文

在服务器上使用 Gemini CLI

Ascend DMI 工具使用指南

Kubernetes 下开源的 GPU 虚拟化项目

FoundationDB 数据备份与恢复

认知觉醒

给 Node Exporter 添加抓取凭证

部署 smokeping-prober 探测网络质量

Opscli 支持 MCP 提供 Cline\Cursor 集成

kube-proxy 异常导致节点上的 Pod 无法访问 Service

为什么 NFS Over RDMA 比 NFS 的 FIO 大块读性能好很多

3FS 关键技术和设计

DeepSeek 3FS 运维指南

容器化部署 DeepSeek 3FS 存储系统

3FS 的一些性能测试

在 Kubernetes 中使用 Fluid 挂载 3FS 存储及性能测试

NFS Over RDMA

kubectl logs 无法查看 Pod 日志报错 NotFound

使用 Dante 提供 SOCKS5 转发

使用 Calico 限制 Pod 的带宽

分布式计算框架 Ray

以 Qwen 为例，学习大模型的结构

NVIDIA 环境变量配置

Ascend 环境变量配置

Fluid 下的 Juicefs 企业版维护

使用 vLLM 进行模型推理

使用 Nerdctl 构建多架构镜像

使用 vLLM 应用验证推理节点

AI 应用开发技术栈

在 Kubernetes 部署 Jumpserver 跳板机

使用 Ops 项目查看并监控集群事件

使用 Fluid 和 S3FS 对接 S3 存储及性能测试

使用 Fluid 对接 S3 存储及性能测试

使用 TensorBoard 可视化 PyTorch 训练过程

使用 PyTorch 在 MNIST 数据集训练模型

Ubuntu 切换指定版本的内核

MPI 通信原语及 Python 编程使用

Ops 发布 v1.0.0 版本

常见的几种网络拓扑结构

RDMA 技术

SR-IOV 技术

InfiniBand 网络及常用命令

使用 Fluid 对接 OBS 存储及性能测试

使用 Iceberg 和 Spark 在 Kubernetes 上处理数据

GPU 主机如何开启 GDS