1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
| 好的,我将使用 `nvidia-smi` 命令来检查 GPU 卡的状态。好的,这是您当前节点上 GPU 卡的状态摘要:
- **GPU 总览**: 系统上共有 8 张 NVIDIA L20 GPU。
- **驱动和 CUDA 版本**: NVIDIA 驱动版本为 570.158.01,CUDA 版本为 12.8。
- **GPU 使用情况**:
- **GPU 0, 1, 2, 3, 4, 5** 目前正在被使用,主要运行 `python` 和 `tritonserver` 进程。
- **GPU 6, 7** 目前处于空闲状态,功耗和温度都较低。
- **内存使用**:
- GPU 0, 1, 2 的显存几乎被占满。
- 其他 GPU 的显存使用率各不相同。
简而言之,大部分 GPU 资源都已被分配使用,但仍有两张卡是完全空闲的。
如果您需要任何其他具体信息,请告诉我。
|