[doc] Fix gradient accumulation doc. (#4349)

* [doc] fix gradient accumulation doc * [doc] fix gradient accumulation doc
2023-08-04 17:24:35 +08:00 · 2023-08-04 17:24:35 +08:00 · f40b718959
parent 38b792aab2
commit f40b718959
2 changed files with 4 additions and 0 deletions
--- a/docs/source/en/features/gradient_accumulation_with_booster.md
+++ b/docs/source/en/features/gradient_accumulation_with_booster.md
@ -103,10 +103,12 @@ for idx, (img, label) in enumerate(train_dataloader):
            with sync_context:
                output = model(img)
                train_loss = criterion(output, label)
+                train_loss = train_loss / GRADIENT_ACCUMULATION
                booster.backward(train_loss, optimizer)
        else:
            output = model(img)
            train_loss = criterion(output, label)
+            train_loss = train_loss / GRADIENT_ACCUMULATION
            booster.backward(train_loss, optimizer)
            optimizer.step()
            optimizer.zero_grad()
--- a/docs/source/zh-Hans/features/gradient_accumulation_with_booster.md
+++ b/docs/source/zh-Hans/features/gradient_accumulation_with_booster.md
@ -106,10 +106,12 @@ for idx, (img, label) in enumerate(train_dataloader):
            with sync_context:
                output = model(img)
                train_loss = criterion(output, label)
+                train_loss = train_loss / GRADIENT_ACCUMULATION
                booster.backward(train_loss, optimizer)
        else:
            output = model(img)
            train_loss = criterion(output, label)
+            train_loss = train_loss / GRADIENT_ACCUMULATION
            booster.backward(train_loss, optimizer)
            optimizer.step()
            optimizer.zero_grad()