1. 安装驱动
- 创建 HwHiAiUser 用户
| |
- 添加目录权限
| |
- 下载驱动、固件
前往 https://www.hiascend.ru/hardware/firmware-drivers/community?product=1&model=30&cann=All&driver=1.0.26.alpha 找到对应的驱动和固件。
| |
| |
- 安装驱动
| |
- 安装固件
| |
2. 安装 ascend-docker-runtime
- 下载 ascend-docker-runtime
前往 https://gitee.com/ascend/ascend-docker-runtime/releases/tag/v5.0.0-RC3.2 找到对应架构的下载链接。
| |
- 安装 ascend-docker-runtime
| |
3. 安装 Docker [可选]
Docker 和 Containerd 二选一。
3.1 安装 docker
- 添加 key
| |
- 添加源
| |
- 更新源
| |
- 安装 docker
| |
3.2 配置 docker
| |
- 重启 docker
| |
3.3 安装 cri-docker
用于 Kubelet 调用,如果使用的是 containerd,可以跳过这一步。
- 安装 CRI-Docker
| |
- 添加用户组
| |
- 配置启动文件
| |
- 生成 socket 文件
| |
- 启动 CRI-DOCKER
| |
3.4 验证
| |
4. 安装 Containerd [可选]
Docker 和 Containerd 二选一。
4.1 安装 containerd
- 添加源
| |
| |
| |
- 安装 containerd
| |
4.2 配置 containerd
- 生成 containerd 配置文件 toml
| |
- 修改 containerd 配置文件
| |
- 修改 runtime 为 ascend
| |
- 重启 containerd
| |
4.3 验证
- 安装
nerdctl工具
| |
- 验证
ARM 镜像
| |
AMD64 镜像
| |
| |
4. 加入 K8s 集群
4.1 修改 Hostname
| |
创建设备管理插件的工作目录
| |
4.2 初始化内核参数
| |
4.3 安装 K8s 基础组件
- 添加 K8s 源
https://developer.aliyun.com/mirror/kubernetes/ 1.28 以下版本添加
| |
| |
| |
- 安装 K8s 基础组件
| |
| |
4.4 加入集群
- 生成 Token
在 master 节点生成 token
| |
- 加入集群
如果 worker 节点是 Docker Runtime,在加入集群时,需要加上参数 --cri-socket unix:///var/run/cri-dockerd.sock 。
| |
4.5 创建测试的 Pod
- 创建 Pod
| |
AMD64 镜像
| |
| |
- 查看 Pod 状态
| |
- 删除 Pod
| |
5. NPU 状态检测
- 禁用 TLS
| |
- IP
| |
- 网关
| |
- 健康状态
| |
- link 状态
| |
- 网卡状态
| |
- ECC
| |
