ColossalAI/docs/source/zh-Hans/features/cluster_utils.md

462 B

集群实用程序

作者: Hongxin Liu

前置教程:

引言

我们提供了一个实用程序类 colossalai.cluster.DistCoordinator 来协调分布式训练。它对于获取有关集群的各种信息很有用,例如节点数、每个节点的进程数等。

API 参考

{{ autodoc:colossalai.cluster.DistCoordinator }}