InternLM

History

Wenwen Qu 582ee000bd feat(moe):support zero for expert local dp (#404 ) * support zero for expert local dp * fix above codes: treat optim.zero_world_size and optim.zero_local_rank as list in model_checkpoint.py and test_model_checkpoint.py add overlap and zero check for moe in args_sanity_check(.)		2023-10-09 17:45:26 +08:00
..
__init__.py	Merge develop to main (#233 )	2023-08-24 22:03:04 +08:00
training_internlm.py	feat(moe): add local data parallel support for experts (#376 )	2023-09-28 13:38:02 +08:00
utils.py	feat(moe):support zero for expert local dp (#404 )	2023-10-09 17:45:26 +08:00