ColossalAI/colossalai/zero/sharded_param/sharded_tensor.py

import torch
import torch.distributed as dist
from typing import Optional
from colossalai.zero.sharded_param.tensorful_state import StatefulTensor, TensorState


class ShardedTensor(StatefulTensor):

    def __init__(self, tensor: torch.Tensor, process_group: Optional[dist.ProcessGroup] = None) -> None:
        r"""
        A tensor sharded in multiple processes. Constructed from an existing torch.Tensor instance.
        """
        super().__init__(tensor)
        self.trans_state(TensorState.HOLD)

        self._origin_shape = tensor.shape
        self._origin_numel = tensor.numel()
        self._origin_dtype = tensor.dtype

        self._is_sharded = False

    @property
    def origin_numel(self) -> int:
        return self._origin_numel

    @property
    def origin_shape(self) -> int:
        return self._origin_shape

    @property
    def is_sharded(self):
        return self._is_sharded

    @is_sharded.setter
    def is_sharded(self, flag: bool):
        self._is_sharded = flag
[zero] sharded tensor (#305) * init shard param from shape tuple * add more unitest for shard param * add set_payload method for ShardedParam * [zero] add shareded tensor class * polish code 3 years ago			`import torch`
			`import torch.distributed as dist`
			`from typing import Optional`
[zero] add stateful tensor (#549) 3 years ago			`from colossalai.zero.sharded_param.tensorful_state import StatefulTensor, TensorState`
[zero] sharded tensor (#305) * init shard param from shape tuple * add more unitest for shard param * add set_payload method for ShardedParam * [zero] add shareded tensor class * polish code 3 years ago

[zero] add stateful tensor (#549) 3 years ago			`class ShardedTensor(StatefulTensor):`
[zero] sharded tensor (#305) * init shard param from shape tuple * add more unitest for shard param * add set_payload method for ShardedParam * [zero] add shareded tensor class * polish code 3 years ago
			`def __init__(self, tensor: torch.Tensor, process_group: Optional[dist.ProcessGroup] = None) -> None:`
			`r"""`
[zero] global model data memory tracer (#360) 3 years ago			`A tensor sharded in multiple processes. Constructed from an existing torch.Tensor instance.`
[zero] sharded tensor (#305) * init shard param from shape tuple * add more unitest for shard param * add set_payload method for ShardedParam * [zero] add shareded tensor class * polish code 3 years ago			`"""`
[zero] add stateful tensor (#549) 3 years ago			`super().__init__(tensor)`
			`self.trans_state(TensorState.HOLD)`
[zero] sharded tensor (#305) * init shard param from shape tuple * add more unitest for shard param * add set_payload method for ShardedParam * [zero] add shareded tensor class * polish code 3 years ago
			`self._origin_shape = tensor.shape`
			`self._origin_numel = tensor.numel()`
			`self._origin_dtype = tensor.dtype`

[zero] add stateful tensor (#549) 3 years ago			`self._is_sharded = False`

[zero] polish shard strategy (#310) * init shard param from shape tuple * add more unitest for shard param * add set_payload method for ShardedParam * [zero] add shareded tensor class * polish code * add shard stratgy * move shard and gather logic to shard strategy from shard tensor. * polish code 3 years ago			`@property`
[zero] add stateful tensor (#549) 3 years ago			`def origin_numel(self) -> int:`
[zero] polish shard strategy (#310) * init shard param from shape tuple * add more unitest for shard param * add set_payload method for ShardedParam * [zero] add shareded tensor class * polish code * add shard stratgy * move shard and gather logic to shard strategy from shard tensor. * polish code 3 years ago			`return self._origin_numel`

			`@property`
[zero] add stateful tensor (#549) 3 years ago			`def origin_shape(self) -> int:`
[zero] polish shard strategy (#310) * init shard param from shape tuple * add more unitest for shard param * add set_payload method for ShardedParam * [zero] add shareded tensor class * polish code * add shard stratgy * move shard and gather logic to shard strategy from shard tensor. * polish code 3 years ago			`return self._origin_shape`

[zero] sharded tensor (#305) * init shard param from shape tuple * add more unitest for shard param * add set_payload method for ShardedParam * [zero] add shareded tensor class * polish code 3 years ago			`@property`
			`def is_sharded(self):`
			`return self._is_sharded`

[zero] polish shard strategy (#310) * init shard param from shape tuple * add more unitest for shard param * add set_payload method for ShardedParam * [zero] add shareded tensor class * polish code * add shard stratgy * move shard and gather logic to shard strategy from shard tensor. * polish code 3 years ago			`@is_sharded.setter`
			`def is_sharded(self, flag: bool):`
			`self._is_sharded = flag`