From 8123b592152bd3290cc01e084ea7519abcf1547e Mon Sep 17 00:00:00 2001 From: duzx16 Date: Thu, 13 Apr 2023 15:24:59 +0800 Subject: [PATCH] Add length instruction --- ptuning/README.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/ptuning/README.md b/ptuning/README.md index 318a7fc..2cc20dc 100644 --- a/ptuning/README.md +++ b/ptuning/README.md @@ -176,7 +176,7 @@ response, history = model.chat(tokenizer, "你好", history=[]) ``` ## 使用自己的数据集 -修改 `train.sh` 和 `evaluate.sh` 中的 `train_file`、`validation_file`和`test_file`为你自己的 JSON 格式数据集路径,并将 `prompt_column` 和 `response_column` 改为 JSON 文件中输入文本和输出文本对应的 KEY。 +修改 `train.sh` 和 `evaluate.sh` 中的 `train_file`、`validation_file`和`test_file`为你自己的 JSON 格式数据集路径,并将 `prompt_column` 和 `response_column` 改为 JSON 文件中输入文本和输出文本对应的 KEY。可能还需要更改 `max_source_length` 和 `max_target_length` 来匹配你自己的数据集中的最大输入输出长度。 ## 对话数据集