ColossalAI/colossalai/nn/lr_scheduler/multistep.py

from typing import List

from torch.optim.lr_scheduler import MultiStepLR as _MultiStepLR

from colossalai.registry import LR_SCHEDULERS
from .delayed import WarmupScheduler


@LR_SCHEDULERS.register_module
class MultiStepLR(_MultiStepLR):
    """Decays the learning rate of each parameter group by gamma once the
    number of epoch reaches one of the milestones. Notice that such decay can
    happen simultaneously with other changes to the learning rate from outside
    this scheduler. When last_epoch=-1, sets initial lr as lr.

    Args:
        optimizer (:class:`torch.optim.Optimizer`): Wrapped optimizer.
        total_steps (int): Number of total training steps.
        milestones (List[int], optional): List of epoch indices. Must be increasing, defaults to None.
        gamma (float, optional): Multiplicative factor of learning rate decay, defaults to 0.1.
        last_epoch (int, optional): The index of last epoch, defaults to -1. When last_epoch=-1,
            the schedule is started from the beginning or When last_epoch=-1, sets initial lr as lr.
    """

    def __init__(self, optimizer, total_steps: int, milestones: List[int] = None, gamma: float = 0.1, last_epoch: int = -1, **kwargs):
        super().__init__(optimizer, milestones, gamma=gamma, last_epoch=last_epoch)


@LR_SCHEDULERS.register_module
class MultiStepWarmupLR(WarmupScheduler):
    """Multistep learning rate scheduler with warmup.

    Args:
        optimizer (:class:`torch.optim.Optimizer`): Wrapped optimizer.
        total_steps (int): Number of total training steps.
        warmup_steps (int, optional): Number of warmup steps, defaults to 0.
        milestones (List[int], optional): List of epoch indices. Must be increasing, defaults to None.
        gamma (float, optional): Multiplicative factor of learning rate decay, defaults to 0.1.
        num_steps_per_epoch (int, optional): Number of steps per epoch, defaults to -1.
        last_epoch (int, optional): The index of last epoch, defaults to -1. When last_epoch=-1,
            the schedule is started from the beginning or When last_epoch=-1, sets initial lr as lr.
    """

    def __init__(self, optimizer, total_steps: int, warmup_steps: int = 0, milestones: List[int] = None,
                 gamma: float = 0.1, last_epoch: int = -1, **kwargs):
        if len(milestones) == 0:
            raise ValueError('milestones cannot be empty')
        milestones = [
            v - warmup_steps for v in milestones if v >= warmup_steps]
        base_scheduler = _MultiStepLR(optimizer, milestones=milestones,
                                      gamma=gamma)
        super().__init__(optimizer, warmup_steps, base_scheduler, last_epoch=last_epoch)
Migrated project 3 years ago			`from typing import List`

			`from torch.optim.lr_scheduler import MultiStepLR as _MultiStepLR`

			`from colossalai.registry import LR_SCHEDULERS`
			`from .delayed import WarmupScheduler`


			`@LR_SCHEDULERS.register_module`
			`class MultiStepLR(_MultiStepLR):`
			`"""Decays the learning rate of each parameter group by gamma once the`
			`number of epoch reaches one of the milestones. Notice that such decay can`
			`happen simultaneously with other changes to the learning rate from outside`
			`this scheduler. When last_epoch=-1, sets initial lr as lr.`
Fixed docstring in colossalai (#171) 3 years ago
Refactored docstring to google style 3 years ago			`Args:`
			optimizer (:class:`torch.optim.Optimizer`): Wrapped optimizer.
			`total_steps (int): Number of total training steps.`
			`milestones (List[int], optional): List of epoch indices. Must be increasing, defaults to None.`
			`gamma (float, optional): Multiplicative factor of learning rate decay, defaults to 0.1.`
			`last_epoch (int, optional): The index of last epoch, defaults to -1. When last_epoch=-1,`
			`the schedule is started from the beginning or When last_epoch=-1, sets initial lr as lr.`
Migrated project 3 years ago			`"""`

Support TP-compatible Torch AMP and Update trainer API (#27) * Add gradient accumulation, fix lr scheduler * fix FP16 optimizer and adapted torch amp with tensor parallel (#18) * fixed bugs in compatibility between torch amp and tensor parallel and performed some minor fixes * fixed trainer * Revert "fixed trainer" This reverts commit 2e0b0b76990e8d4e337add483d878c0f61cf5097. * improved consistency between trainer, engine and schedule (#23) Co-authored-by: 1SAA <c2h214748@gmail.com> Co-authored-by: 1SAA <c2h214748@gmail.com> Co-authored-by: ver217 <lhx0217@gmail.com> 3 years ago			`def __init__(self, optimizer, total_steps: int, milestones: List[int] = None, gamma: float = 0.1, last_epoch: int = -1, **kwargs):`
Migrated project 3 years ago			`super().__init__(optimizer, milestones, gamma=gamma, last_epoch=last_epoch)`


			`@LR_SCHEDULERS.register_module`
			`class MultiStepWarmupLR(WarmupScheduler):`
Refactored docstring to google style 3 years ago			`"""Multistep learning rate scheduler with warmup.`

			`Args:`
			optimizer (:class:`torch.optim.Optimizer`): Wrapped optimizer.
			`total_steps (int): Number of total training steps.`
			`warmup_steps (int, optional): Number of warmup steps, defaults to 0.`
			`milestones (List[int], optional): List of epoch indices. Must be increasing, defaults to None.`
			`gamma (float, optional): Multiplicative factor of learning rate decay, defaults to 0.1.`
			`num_steps_per_epoch (int, optional): Number of steps per epoch, defaults to -1.`
			`last_epoch (int, optional): The index of last epoch, defaults to -1. When last_epoch=-1,`
			`the schedule is started from the beginning or When last_epoch=-1, sets initial lr as lr.`
Migrated project 3 years ago			`"""`

			`def __init__(self, optimizer, total_steps: int, warmup_steps: int = 0, milestones: List[int] = None,`
Support TP-compatible Torch AMP and Update trainer API (#27) * Add gradient accumulation, fix lr scheduler * fix FP16 optimizer and adapted torch amp with tensor parallel (#18) * fixed bugs in compatibility between torch amp and tensor parallel and performed some minor fixes * fixed trainer * Revert "fixed trainer" This reverts commit 2e0b0b76990e8d4e337add483d878c0f61cf5097. * improved consistency between trainer, engine and schedule (#23) Co-authored-by: 1SAA <c2h214748@gmail.com> Co-authored-by: 1SAA <c2h214748@gmail.com> Co-authored-by: ver217 <lhx0217@gmail.com> 3 years ago			`gamma: float = 0.1, last_epoch: int = -1, **kwargs):`
Migrated project 3 years ago			`if len(milestones) == 0:`
			`raise ValueError('milestones cannot be empty')`
Support TP-compatible Torch AMP and Update trainer API (#27) * Add gradient accumulation, fix lr scheduler * fix FP16 optimizer and adapted torch amp with tensor parallel (#18) * fixed bugs in compatibility between torch amp and tensor parallel and performed some minor fixes * fixed trainer * Revert "fixed trainer" This reverts commit 2e0b0b76990e8d4e337add483d878c0f61cf5097. * improved consistency between trainer, engine and schedule (#23) Co-authored-by: 1SAA <c2h214748@gmail.com> Co-authored-by: 1SAA <c2h214748@gmail.com> Co-authored-by: ver217 <lhx0217@gmail.com> 3 years ago			`milestones = [`
			`v - warmup_steps for v in milestones if v >= warmup_steps]`
Migrated project 3 years ago			`base_scheduler = _MultiStepLR(optimizer, milestones=milestones,`
			`gamma=gamma)`
			`super().__init__(optimizer, warmup_steps, base_scheduler, last_epoch=last_epoch)`