ColossalAI/docs/source/zh-Hans/features/cluster_utils.md

17 lines
462 B
Markdown

# 集群实用程序
作者: [Hongxin Liu](https://github.com/ver217)
**前置教程:**
- [分布式训练](../concepts/distributed_training.md)
## 引言
我们提供了一个实用程序类 `colossalai.cluster.DistCoordinator` 来协调分布式训练。它对于获取有关集群的各种信息很有用,例如节点数、每个节点的进程数等。
## API 参考
{{ autodoc:colossalai.cluster.DistCoordinator }}
<!-- doc-test-command: echo -->