[test] reorganize zero/gemini tests (#3445)

2023-04-06 09:38:25 +08:00 · 2023-04-06 09:38:25 +08:00 · 933048ad3e
parent 72cb4dd433
commit 933048ad3e
34 changed files with 7 additions and 8 deletions
--- a/tests/test_moe/test_moe_checkpoint.py
+++ b/tests/test_moe/test_moe_checkpoint.py
@ -14,7 +14,7 @@ from colossalai.utils import free_port, get_current_device
 from colossalai.zero import ColoInitContext
 from tests.test_moe.test_moe_zero_init import MoeModel
 from tests.test_tensor.common_utils import debug_print
-from tests.test_zero.common import CONFIG
+from tests.test_zero.test_legacy.common import CONFIG


 def exam_moe_checkpoint():
--- a/tests/test_moe/test_moe_colo_init.py
+++ b/tests/test_moe/test_moe_colo_init.py
@ -13,7 +13,7 @@ from colossalai.utils import free_port, get_current_device
 from colossalai.zero import ColoInitContext
 from tests.test_moe.test_moe_zero_init import MoeModel
 from tests.test_tensor.common_utils import debug_print
-from tests.test_zero.common import CONFIG
+from tests.test_zero.test_legacy.common import CONFIG


@parameterize("init_device_type", ['cpu', 'cuda'])
--- a/tests/test_moe/test_moe_zero_init.py
+++ b/tests/test_moe/test_moe_zero_init.py
@ -14,7 +14,7 @@ from colossalai.testing import parameterize, rerun_if_address_is_in_use
 from colossalai.utils import free_port, get_current_device
 from colossalai.zero.legacy.init_ctx import ZeroInitContext
 from colossalai.zero.legacy.shard_utils import BucketTensorShardStrategy, TensorShardStrategy
-from tests.test_zero.common import CONFIG
+from tests.test_zero.test_legacy.common import CONFIG


 class MoeModel(nn.Module):
--- a/tests/test_moe/test_moe_zero_model.py
+++ b/tests/test_moe/test_moe_zero_model.py
@ -17,7 +17,7 @@ from colossalai.zero.legacy.sharded_model._utils import cast_tensor_to_fp16
 from colossalai.zero.legacy.sharded_model.utils import col_model_deepcopy
 from tests.components_to_test.registry import non_distributed_component_funcs
 from tests.test_moe.test_moe_zero_init import MoeModel
-from tests.test_zero.common import CONFIG, check_grads_padding, run_fwd_bwd
+from tests.test_zero.test_legacy.common import CONFIG, check_grads_padding, run_fwd_bwd


@parameterize("enable_autocast", [False])
--- a/tests/test_moe/test_moe_zero_optim.py
+++ b/tests/test_moe/test_moe_zero_optim.py
@ -20,7 +20,7 @@ from colossalai.zero.legacy.sharded_optim import ShardedOptimizerV2
 from colossalai.zero.low_level._utils import has_inf_or_nan
 from tests.components_to_test.registry import non_distributed_component_funcs
 from tests.test_moe.test_moe_zero_init import MoeModel
-from tests.test_zero.common import CONFIG, check_sharded_model_params
+from tests.test_zero.test_legacy.common import CONFIG, check_sharded_model_params


 def _run_step(model, optimizer, data, label, criterion, grad_handler):
--- a/tests/test_zero/test_gemini/test_chunk_mgrv2.py
+++ b/tests/test_zero/test_gemini/test_chunk_mgrv2.py
--- a/tests/test_zero/test_gemini/test_chunkv2.py
+++ b/tests/test_zero/test_gemini/test_chunkv2.py
--- a/tests/test_zero/test_gemini/test_fwd_bwd.py
+++ b/tests/test_zero/test_gemini/test_fwd_bwd.py
--- a/tests/test_zero/test_gemini/test_gemini_use_rmt.py
+++ b/tests/test_zero/test_gemini/test_gemini_use_rmt.py
--- a/tests/test_zero/test_gemini/test_get_torch_model.py
+++ b/tests/test_zero/test_gemini/test_get_torch_model.py
--- a/tests/test_zero/test_gemini/test_grad_clip.py
+++ b/tests/test_zero/test_gemini/test_grad_clip.py
--- a/tests/test_zero/test_gemini/test_inference.py
+++ b/tests/test_zero/test_gemini/test_inference.py
--- a/tests/test_zero/test_gemini/test_optim.py
+++ b/tests/test_zero/test_gemini/test_optim.py
--- a/tests/test_zero/test_gemini/test_runtime_mem_tracer.py
+++ b/tests/test_zero/test_gemini/test_runtime_mem_tracer.py
--- a/tests/test_zero/test_gemini/test_search.py
+++ b/tests/test_zero/test_gemini/test_search.py
--- a/tests/test_zero/test_gemini/test_zeroddp_state_dict.py
+++ b/tests/test_zero/test_gemini/test_zeroddp_state_dict.py
--- a/tests/test_zero/test_gemini/test_zerooptim_state_dict.py
+++ b/tests/test_zero/test_gemini/test_zerooptim_state_dict.py
--- a/tests/test_zero/test_legacy/common.py
+++ b/tests/test_zero/test_legacy/common.py
--- a/tests/test_zero/test_legacy/test_found_inf.py
+++ b/tests/test_zero/test_legacy/test_found_inf.py
@ -4,6 +4,7 @@ import pytest
 import torch
 import torch.multiprocessing as mp
 from common import CONFIG
+from test_sharded_optim_v2 import _run_step

 import colossalai
 from colossalai.nn.optimizer import HybridAdam
@ -16,7 +17,6 @@ from colossalai.zero.legacy.sharded_model import ShardedModelV2
 from colossalai.zero.legacy.sharded_optim import ShardedOptimizerV2
 from colossalai.zero.low_level._utils import has_inf_or_nan
 from tests.components_to_test.registry import non_distributed_component_funcs
-from tests.test_zero.test_sharded_optim_v2 import _run_step


@parameterize("cpu_offload", [True, False])
--- a/tests/test_zero/test_legacy/test_gemini_manager.py
+++ b/tests/test_zero/test_legacy/test_gemini_manager.py
--- a/tests/test_zero/test_legacy/test_init_context.py
+++ b/tests/test_zero/test_legacy/test_init_context.py
--- a/tests/test_zero/test_legacy/test_param_op.py
+++ b/tests/test_zero/test_legacy/test_param_op.py
--- a/tests/test_zero/test_legacy/test_shard_model_v2.py
+++ b/tests/test_zero/test_legacy/test_shard_model_v2.py
--- a/tests/test_zero/test_legacy/test_shard_param.py
+++ b/tests/test_zero/test_legacy/test_shard_param.py
@ -4,6 +4,7 @@ from functools import partial
 import pytest
 import torch
 import torch.multiprocessing as mp
+from common import CONFIG, allclose

 import colossalai
 from colossalai.testing import parameterize, rerun_if_address_is_in_use
@ -12,7 +13,6 @@ from colossalai.zero.legacy.gemini.stateful_tensor import StatefulTensor
 from colossalai.zero.legacy.shard_utils import BucketTensorShardStrategy, TensorShardStrategy
 from colossalai.zero.legacy.sharded_param import ShardedTensor
 from colossalai.zero.legacy.sharded_param.sharded_param import ShardedParamV2
-from tests.test_zero.common import CONFIG, allclose


@parameterize("shard_strategy_class", [TensorShardStrategy, BucketTensorShardStrategy])
--- a/tests/test_zero/test_legacy/test_sharded_optim_state_dict.py
+++ b/tests/test_zero/test_legacy/test_sharded_optim_state_dict.py
--- a/tests/test_zero/test_legacy/test_sharded_optim_v2.py
+++ b/tests/test_zero/test_legacy/test_sharded_optim_v2.py
--- a/tests/test_zero/test_legacy/test_sharded_optim_with_sync_bn.py
+++ b/tests/test_zero/test_legacy/test_sharded_optim_with_sync_bn.py
--- a/tests/test_zero/test_legacy/test_state_dict.py
+++ b/tests/test_zero/test_legacy/test_state_dict.py
@ -1,7 +1,6 @@
 #!/usr/bin/env python
 # -*- encoding: utf-8 -*-

-from copy import deepcopy
 from functools import partial

 import pytest
--- a/tests/test_zero/test_legacy/test_tensor_utils.py
+++ b/tests/test_zero/test_legacy/test_tensor_utils.py
--- a/tests/test_zero/test_legacy/test_zero_engine.py
+++ b/tests/test_zero/test_legacy/test_zero_engine.py
--- a/tests/test_zero/test_low_level/test_grad_acc.py
+++ b/tests/test_zero/test_low_level/test_grad_acc.py
--- a/tests/test_zero/test_low_level/test_zero1_2.py
+++ b/tests/test_zero/test_low_level/test_zero1_2.py
--- a/tests/test_zero/test_low_level/test_zero_init.py
+++ b/tests/test_zero/test_low_level/test_zero_init.py
--- a/tests/test_zero/test_low_level/test_zero_tp.py
+++ b/tests/test_zero/test_low_level/test_zero_tp.py