ColossalAI/colossalai/nn/_ops/addmm.py

import torch
from colossalai.tensor.op_wrapper import colo_op_impl
from colossalai.tensor import ComputePattern, ComputePattern, ComputeSpec, ColoTensor
from colossalai.tensor import distspec, ColoTensorSpec, ShardSpec, ReplicaSpec
from ._utils import GeneralTensor, Number, convert_to_colo_tensor
from ._utils import reduce_input, reduce_grad


def colo_addmm_1Drow(input_tensor: ColoTensor, mat1: ColoTensor, mat2: ColoTensor, beta: Number,
                     alpha: Number) -> ColoTensor:
    # mat1:S[1] x mat2:S[0] = Output:P
    # beta * input + alpha * All-Reduce(Output) = res

    mat1 = mat1.redistribute(ShardSpec([-1], [mat2.get_tp_world_size()]), mat2.get_process_group())

    # Output:P
    partial_output = torch.mm(mat1, mat2)
    # Reduce(Output)
    output = reduce_input(partial_output, mat2.get_process_group())
    # input
    assert not input_tensor.has_compute_spec(), 'Invalid input spec for 1Drow addmm op'
    output = beta * input_tensor + alpha * output
    output = ColoTensor.from_torch_tensor(output, spec=ColoTensorSpec(input_tensor.get_process_group()))
    return output


def colo_addmm_1Dcol(input_tensor: ColoTensor, mat1: ColoTensor, mat2: ColoTensor, beta: Number,
                     alpha: Number) -> ColoTensor:
    # mat1:B x mat2:S[1] + input:S[1] = Output:S[1]
    compute_spec = mat2.compute_spec
    mat1 = mat1.redistribute(ReplicaSpec())
    mat1 = reduce_grad(mat1, mat1.get_process_group())

    output_parallel = torch.addmm(input_tensor, mat1, mat2, beta=beta, alpha=alpha)
    output_spec = ColoTensorSpec(input_tensor.get_process_group(), ShardSpec([-1], [mat2.get_tp_world_size()]),
                                 ComputeSpec(ComputePattern.TP1D))
    output = ColoTensor.from_torch_tensor(output_parallel, spec=output_spec)

    if compute_spec.output_replicate:
        return output.to_replicate()
    else:
        return output


def colo_addmm_1d(mode: str, input_tensor: ColoTensor, mat1: ColoTensor, mat2: ColoTensor, beta: Number,
                  alpha: Number) -> ColoTensor:
    assert mode in ('row', 'col')
    funcs = {'row': colo_addmm_1Drow, 'col': colo_addmm_1Dcol}
    return funcs[mode](input_tensor, mat1, mat2, beta, alpha)


@colo_op_impl(torch.addmm)
def colo_addmm(input_tensor: GeneralTensor,
               mat1: ColoTensor,
               mat2: ColoTensor,
               beta: Number = 1,
               alpha: Number = 1,
               **kargs) -> ColoTensor:
    """Handles ``__torch_function__`` dispatch for ``torch.nn.functional.linear``.
    This method computes a linear.
    """
    # At least one of the tensor should be ColoTensor
    assert isinstance(mat2, ColoTensor)
    input_tensor = convert_to_colo_tensor(input_tensor, mat2.get_process_group())
    mat1 = convert_to_colo_tensor(mat1, mat2.get_process_group())

    # Add communication logic before and after linear call.
    ret_tensor = None
    if not mat2.has_compute_spec():    # No Model Parallel Applied
        assert mat2.is_replicate(), 'Invalid mat2 spec for native addmm op'
        assert input_tensor.is_replicate(), 'Invalid input spec for native addmm op'
        ret_tensor = ColoTensor.from_torch_tensor(
            tensor=torch.addmm(input_tensor, mat1, mat2, beta=beta, alpha=alpha, **kargs),
            spec=ColoTensorSpec(mat2.get_process_group()))
    elif mat2.has_compute_pattern(ComputePattern.TP1D):    # Single Model Parallel Applied
        if mat2.is_shard_1drow() and input_tensor.is_replicate():
            mode = 'row'
        elif mat2.is_shard_1dcol() and (input_tensor.is_shard_1dcol() or input_tensor.is_shard_1drow()):
            mode = 'col'
        else:
            raise NotImplementedError
        ret_tensor = colo_addmm_1d(mode, input_tensor, mat1, mat2, beta, alpha)
    else:
        raise NotImplementedError

    return ret_tensor
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			`import torch`
			`from colossalai.tensor.op_wrapper import colo_op_impl`
[refactor] move process group from _DistSpec to ColoTensor. (#1203) 2022-07-06 08:15:16 +00:00			`from colossalai.tensor import ComputePattern, ComputePattern, ComputeSpec, ColoTensor`
[tensor] a shorter shard and replicate spec (#1245) 2022-07-11 07:51:48 +00:00			`from colossalai.tensor import distspec, ColoTensorSpec, ShardSpec, ReplicaSpec`
[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`from ._utils import GeneralTensor, Number, convert_to_colo_tensor`
[refactor] remove gpc dependency in colotensor's _ops (#1189) 2022-07-04 10:54:37 +00:00			`from ._utils import reduce_input, reduce_grad`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00

[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`def colo_addmm_1Drow(input_tensor: ColoTensor, mat1: ColoTensor, mat2: ColoTensor, beta: Number,`
			`alpha: Number) -> ColoTensor:`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			`# mat1:S[1] x mat2:S[0] = Output:P`
			`# beta * input + alpha * All-Reduce(Output) = res`

[hotfix] fix shape error in backward when using ColoTensor (#1298) 2022-07-13 15:06:12 +00:00			`mat1 = mat1.redistribute(ShardSpec([-1], [mat2.get_tp_world_size()]), mat2.get_process_group())`
[tensor] a shorter shard and replicate spec (#1245) 2022-07-11 07:51:48 +00:00
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			`# Output:P`
[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`partial_output = torch.mm(mat1, mat2)`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			`# Reduce(Output)`
[hotfix] fix shape error in backward when using ColoTensor (#1298) 2022-07-13 15:06:12 +00:00			`output = reduce_input(partial_output, mat2.get_process_group())`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			`# input`
[ColoTensor] rename APIs and add output_replicate to ComputeSpec (#1168) 2022-06-24 05:08:54 +00:00			`assert not input_tensor.has_compute_spec(), 'Invalid input spec for 1Drow addmm op'`
[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`output = beta * input_tensor + alpha * output`
[hotfix] fix shape error in backward when using ColoTensor (#1298) 2022-07-13 15:06:12 +00:00			`output = ColoTensor.from_torch_tensor(output, spec=ColoTensorSpec(input_tensor.get_process_group()))`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			`return output`


[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`def colo_addmm_1Dcol(input_tensor: ColoTensor, mat1: ColoTensor, mat2: ColoTensor, beta: Number,`
			`alpha: Number) -> ColoTensor:`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			`# mat1:B x mat2:S[1] + input:S[1] = Output:S[1]`
[refactor] move process group from _DistSpec to ColoTensor. (#1203) 2022-07-06 08:15:16 +00:00			`compute_spec = mat2.compute_spec`
[tensor] a shorter shard and replicate spec (#1245) 2022-07-11 07:51:48 +00:00			`mat1 = mat1.redistribute(ReplicaSpec())`
[refactor] remove gpc dependency in colotensor's _ops (#1189) 2022-07-04 10:54:37 +00:00			`mat1 = reduce_grad(mat1, mat1.get_process_group())`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00
[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`output_parallel = torch.addmm(input_tensor, mat1, mat2, beta=beta, alpha=alpha)`
[tensor] a shorter shard and replicate spec (#1245) 2022-07-11 07:51:48 +00:00			`output_spec = ColoTensorSpec(input_tensor.get_process_group(), ShardSpec([-1], [mat2.get_tp_world_size()]),`
[refactor] move process group from _DistSpec to ColoTensor. (#1203) 2022-07-06 08:15:16 +00:00			`ComputeSpec(ComputePattern.TP1D))`
[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`output = ColoTensor.from_torch_tensor(output_parallel, spec=output_spec)`
remove gather out in parallel action (#1163) 2022-06-23 08:35:05 +00:00
[ColoTensor] rename APIs and add output_replicate to ComputeSpec (#1168) 2022-06-24 05:08:54 +00:00			`if compute_spec.output_replicate:`
			`return output.to_replicate()`
			`else:`
			`return output`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00

[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`def colo_addmm_1d(mode: str, input_tensor: ColoTensor, mat1: ColoTensor, mat2: ColoTensor, beta: Number,`
			`alpha: Number) -> ColoTensor:`
			`assert mode in ('row', 'col')`
			`funcs = {'row': colo_addmm_1Drow, 'col': colo_addmm_1Dcol}`
			`return funcs[mode](input_tensor, mat1, mat2, beta, alpha)`


[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			`@colo_op_impl(torch.addmm)`
[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`def colo_addmm(input_tensor: GeneralTensor,`
[refactor] move process group from _DistSpec to ColoTensor. (#1203) 2022-07-06 08:15:16 +00:00			`mat1: ColoTensor,`
			`mat2: ColoTensor,`
[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`beta: Number = 1,`
[refactor] move process group from _DistSpec to ColoTensor. (#1203) 2022-07-06 08:15:16 +00:00			`alpha: Number = 1,`
[hotfix] add kwargs for colo_addmm (#2171) 2022-12-22 05:25:30 +00:00			`**kargs) -> ColoTensor:`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			"""Handles ``__torch_function__`` dispatch for ``torch.nn.functional.linear``.
			`This method computes a linear.`
			`"""`
[refactor] move process group from _DistSpec to ColoTensor. (#1203) 2022-07-06 08:15:16 +00:00			`# At least one of the tensor should be ColoTensor`
			`assert isinstance(mat2, ColoTensor)`
			`input_tensor = convert_to_colo_tensor(input_tensor, mat2.get_process_group())`
			`mat1 = convert_to_colo_tensor(mat1, mat2.get_process_group())`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00
			`# Add communication logic before and after linear call.`
			`ret_tensor = None`
[ColoTensor] rename APIs and add output_replicate to ComputeSpec (#1168) 2022-06-24 05:08:54 +00:00			`if not mat2.has_compute_spec(): # No Model Parallel Applied`
[refactor] move process group from _DistSpec to ColoTensor. (#1203) 2022-07-06 08:15:16 +00:00			`assert mat2.is_replicate(), 'Invalid mat2 spec for native addmm op'`
			`assert input_tensor.is_replicate(), 'Invalid input spec for native addmm op'`
[colotensor] add Tensor.view op and its unit test (#1343) [colotensor] add megatron initialization for gpt2 2022-07-21 02:53:15 +00:00			`ret_tensor = ColoTensor.from_torch_tensor(`
[hotfix] add kwargs for colo_addmm (#2171) 2022-12-22 05:25:30 +00:00			`tensor=torch.addmm(input_tensor, mat1, mat2, beta=beta, alpha=alpha, **kargs),`
[colotensor] add Tensor.view op and its unit test (#1343) [colotensor] add megatron initialization for gpt2 2022-07-21 02:53:15 +00:00			`spec=ColoTensorSpec(mat2.get_process_group()))`
[refactor] move process group from _DistSpec to ColoTensor. (#1203) 2022-07-06 08:15:16 +00:00			`elif mat2.has_compute_pattern(ComputePattern.TP1D): # Single Model Parallel Applied`
			`if mat2.is_shard_1drow() and input_tensor.is_replicate():`
[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`mode = 'row'`
[refactor] move process group from _DistSpec to ColoTensor. (#1203) 2022-07-06 08:15:16 +00:00			`elif mat2.is_shard_1dcol() and (input_tensor.is_shard_1dcol() or input_tensor.is_shard_1drow()):`
[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`mode = 'col'`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			`else:`
			`raise NotImplementedError`
[tensor] refactor colo-tensor (#992) * refactor colo-tensor and update linear op * polish code * polish code * update ops and unit tests * update unit tests * polish code * rename dist_spec module * polish code * polish code * remove unneeded import * fix pipelinable 2022-05-19 04:44:59 +00:00			`ret_tensor = colo_addmm_1d(mode, input_tensor, mat1, mat2, beta, alpha)`
[tensor] hijack addmm for colo tensor (#923) * hijack addmm for colo tensor * fix bugs * polish unit test * polish comments 2022-05-09 10:55:49 +00:00			`else:`
			`raise NotImplementedError`

			`return ret_tensor`