ColossalAI/colossalai/zero/shard_utils/base_shard_strategy.py

from abc import ABC, abstractmethod
from typing import List, Optional

import torch.distributed as dist
from colossalai.zero.sharded_param.sharded_tensor import ShardedTensor


class BaseShardStrategy(ABC):

    def __init__(self) -> None:
        """Abstract Shard Strategy. Use to shard a tensors on multiple GPUs.
        """
        super().__init__()

    @abstractmethod
    def shard(self, tensor_list: List[ShardedTensor], process_group: Optional[dist.ProcessGroup] = None):
        pass

    @abstractmethod
    def gather(self, tensor_list: List[ShardedTensor], process_group: Optional[dist.ProcessGroup] = None):
        pass
[zero] a shard strategy in granularity of tensor (#307) 2022-03-04 03:59:35 +00:00			`from abc import ABC, abstractmethod`
			`from typing import List, Optional`

[zero] Update initialize for ZeRO (#458) * polish code * shard strategy receive pg in shard() / gather() * update zero engine * polish code 2022-03-18 08:18:31 +00:00			`import torch.distributed as dist`
			`from colossalai.zero.sharded_param.sharded_tensor import ShardedTensor`

[zero] a shard strategy in granularity of tensor (#307) 2022-03-04 03:59:35 +00:00
			`class BaseShardStrategy(ABC):`

[zero] Update initialize for ZeRO (#458) * polish code * shard strategy receive pg in shard() / gather() * update zero engine * polish code 2022-03-18 08:18:31 +00:00			`def __init__(self) -> None:`
[zero] update zero context init with the updated test utils (#327) 2022-03-08 06:45:01 +00:00			`"""Abstract Shard Strategy. Use to shard a tensors on multiple GPUs.`
			`"""`
[zero] a shard strategy in granularity of tensor (#307) 2022-03-04 03:59:35 +00:00			`super().__init__()`

			`@abstractmethod`
[zero] Update initialize for ZeRO (#458) * polish code * shard strategy receive pg in shard() / gather() * update zero engine * polish code 2022-03-18 08:18:31 +00:00			`def shard(self, tensor_list: List[ShardedTensor], process_group: Optional[dist.ProcessGroup] = None):`
[zero] a shard strategy in granularity of tensor (#307) 2022-03-04 03:59:35 +00:00			`pass`

			`@abstractmethod`
[zero] Update initialize for ZeRO (#458) * polish code * shard strategy receive pg in shard() / gather() * update zero engine * polish code 2022-03-18 08:18:31 +00:00			`def gather(self, tensor_list: List[ShardedTensor], process_group: Optional[dist.ProcessGroup] = None):`
[zero] a shard strategy in granularity of tensor (#307) 2022-03-04 03:59:35 +00:00			`pass`