ColossalAI/applications/Chat/examples/train_sft.sh

13 lines
363 B
Bash
Raw Normal View History

2023-03-28 12:25:36 +00:00
torchrun --standalone --nproc_per_node=4 train_sft.py \
--pretrain "/path/to/LLaMa-7B/" \
--model 'llama' \
--strategy colossalai_zero2 \
--log_interval 10 \
--save_path /path/to/Coati-7B \
--dataset /path/to/data.json \
--batch_size 4 \
--accumulation_steps 8 \
2023-03-28 12:25:36 +00:00
--lr 2e-5 \
--max_datasets_size 512 \
--max_epochs 1 \