diff --git a/ptuning/README.md b/ptuning/README.md index 318a7fc..2cc20dc 100644 --- a/ptuning/README.md +++ b/ptuning/README.md @@ -176,7 +176,7 @@ response, history = model.chat(tokenizer, "你好", history=[]) ``` ## 使用自己的数据集 -修改 `train.sh` 和 `evaluate.sh` 中的 `train_file`、`validation_file`和`test_file`为你自己的 JSON 格式数据集路径,并将 `prompt_column` 和 `response_column` 改为 JSON 文件中输入文本和输出文本对应的 KEY。 +修改 `train.sh` 和 `evaluate.sh` 中的 `train_file`、`validation_file`和`test_file`为你自己的 JSON 格式数据集路径,并将 `prompt_column` 和 `response_column` 改为 JSON 文件中输入文本和输出文本对应的 KEY。可能还需要更改 `max_source_length` 和 `max_target_length` 来匹配你自己的数据集中的最大输入输出长度。 ## 对话数据集