mirror of https://github.com/hpcaitech/ColossalAI
462 B
462 B
集群实用程序
作者: Hongxin Liu
前置教程:
引言
我们提供了一个实用程序类 colossalai.cluster.DistCoordinator
来协调分布式训练。它对于获取有关集群的各种信息很有用,例如节点数、每个节点的进程数等。
API 参考
{{ autodoc:colossalai.cluster.DistCoordinator }}