Update batch size

2023-03-31 11:28:13 +08:00 · 2023-03-31 11:28:13 +08:00 · d2645d8816
parent 971a6fbb20
commit d2645d8816
1 changed files with 3 additions and 3 deletions
--- a/ptuning/train.sh
+++ b/ptuning/train.sh
@ -8,14 +8,14 @@ CUDA_VISIBLE_DEVICES=0 python3 main.py \
    --prompt_column content \
    --response_column summary \
    --overwrite_cache \
-    --model_name_or_path THUDM/chatglm-6b \
+    --model_name_or_path /mnt/vepfs/workspace/zxdu/chatglm_6b \
    --output_dir output/adgen-chatglm-6b-pt-$PRE_SEQ_LEN-$LR-dev \
    --overwrite_output_dir \
    --max_source_length 64 \
    --max_target_length 64 \
-    --per_device_train_batch_size 8 \
+    --per_device_train_batch_size 1 \
    --per_device_eval_batch_size 1 \
-    --gradient_accumulation_steps 2 \
+    --gradient_accumulation_steps 16 \
    --predict_with_generate \
    --max_steps 3000 \
    --logging_steps 10 \