InternLM

History

ytxiong 1d7e2d04ec fix()/all-reduce for norm in sequence parallel (#443 ) fix all-reduce norm grad * change the order of dp and sp all-reduce * fix lint		2023-10-25 14:16:32 +08:00
..
__init__.py	feat(train): add fsdp training option (#293 )	2023-10-09 18:59:31 +08:00
base_optimizer.py	feat(train): add fsdp training option (#293 )	2023-10-09 18:59:31 +08:00
fsdp_optimizer.py	fix(optimizer/fsdp_optimizer.py): fsdp process empty params group (#408 )	2023-10-10 20:06:04 +08:00
hybrid_zero_optim.py	fix(*)/all-reduce for norm in sequence parallel (#443 )	2023-10-25 14:16:32 +08:00
store.py	feat(moe):support zero for expert local dp (#404 )	2023-10-09 17:45:26 +08:00
utils.py	feat(optimizer): add layer norm to tensorboard (#429 )	2023-10-23 17:07:04 +08:00