ColossalAI/colossalai/zero/legacy/shard_utils/base_shard_strategy.py

from abc import ABC, abstractmethod
from typing import List, Optional

import torch.distributed as dist

from colossalai.zero.legacy.sharded_param.sharded_tensor import ShardedTensor


class BaseShardStrategy(ABC):

    def __init__(self) -> None:
        """Abstract Shard Strategy. Use to shard a tensors on multiple GPUs.
        """
        super().__init__()

    @abstractmethod
    def shard(self, tensor_list: List[ShardedTensor], process_group: Optional[dist.ProcessGroup] = None):
        pass

    @abstractmethod
    def gather(self, tensor_list: List[ShardedTensor], process_group: Optional[dist.ProcessGroup] = None):
        pass
[zero] a shard strategy in granularity of tensor (#307) 2022-03-04 03:59:35 +00:00			`from abc import ABC, abstractmethod`
			`from typing import List, Optional`

[zero] Update initialize for ZeRO (#458) * polish code * shard strategy receive pg in shard() / gather() * update zero engine * polish code 2022-03-18 08:18:31 +00:00			`import torch.distributed as dist`
[zero] reorganize zero/gemini folder structure (#3424) * [zero] refactor low-level zero folder structure * [zero] fix legacy zero import path * [zero] fix legacy zero import path * [zero] remove useless import * [zero] refactor gemini folder structure * [zero] refactor gemini folder structure * [zero] refactor legacy zero import path * [zero] refactor gemini folder structure * [zero] refactor gemini folder structure * [zero] refactor gemini folder structure * [zero] refactor legacy zero import path * [zero] fix test import path * [zero] fix test * [zero] fix circular import * [zero] update import 2023-04-04 05:48:16 +00:00
			`from colossalai.zero.legacy.sharded_param.sharded_tensor import ShardedTensor`
[zero] Update initialize for ZeRO (#458) * polish code * shard strategy receive pg in shard() / gather() * update zero engine * polish code 2022-03-18 08:18:31 +00:00
[zero] a shard strategy in granularity of tensor (#307) 2022-03-04 03:59:35 +00:00
			`class BaseShardStrategy(ABC):`

[zero] Update initialize for ZeRO (#458) * polish code * shard strategy receive pg in shard() / gather() * update zero engine * polish code 2022-03-18 08:18:31 +00:00			`def __init__(self) -> None:`
[zero] update zero context init with the updated test utils (#327) 2022-03-08 06:45:01 +00:00			`"""Abstract Shard Strategy. Use to shard a tensors on multiple GPUs.`
			`"""`
[zero] a shard strategy in granularity of tensor (#307) 2022-03-04 03:59:35 +00:00			`super().__init__()`

			`@abstractmethod`
[zero] Update initialize for ZeRO (#458) * polish code * shard strategy receive pg in shard() / gather() * update zero engine * polish code 2022-03-18 08:18:31 +00:00			`def shard(self, tensor_list: List[ShardedTensor], process_group: Optional[dist.ProcessGroup] = None):`
[zero] a shard strategy in granularity of tensor (#307) 2022-03-04 03:59:35 +00:00			`pass`

			`@abstractmethod`
[zero] Update initialize for ZeRO (#458) * polish code * shard strategy receive pg in shard() / gather() * update zero engine * polish code 2022-03-18 08:18:31 +00:00			`def gather(self, tensor_list: List[ShardedTensor], process_group: Optional[dist.ProcessGroup] = None):`
[zero] a shard strategy in granularity of tensor (#307) 2022-03-04 03:59:35 +00:00			`pass`