ColossalAI/applications/Chat/evaluate/config/config_en.json

{
  "language": "en",
  "path_for_UniEval": {
    "summarization": "path to unieval-sum",
    "dialogue": "path to unieval-dialog",
    "data2text": "path to unieval-sum"
  },
  "category": {
    "brainstorming": {
      "GPT": [
        "language organization",
        "relevance",
        "creativity",
        "practicality",
        "reasonableness"
      ],
      "Metrics": [
        "Distinct"
      ],
      "UniEval": [
        "summarization-fluency",
        "data2text-naturalness",
        "data2text-informativeness"
      ]
    },
    "chat": {
      "GPT": [
        "language organization",
        "naturalness",
        "engagingness",
        "fidelity"
      ],
      "Metrics": [
        "Distinct"
      ],
      "UniEval": [
        "summarization-fluency",
        "dialogue-naturalness",
        "dialogue-coherence",
        "dialogue-understandability",
        "data2text-naturalness",
        "data2text-informativeness"
      ]
    },
    "classification": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
        "Precision",
        "Recall",
        "F1 score",
        "CHRF"
      ],
      "UniEval": [
        "summarization-fluency",
        "data2text-naturalness",
        "data2text-informativeness"
      ]
    },
    "closed_qa": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
        "BLEU",
        "ROUGE",
        "BERTScore",
        "CHRF"
      ],
      "UniEval": [
        "summarization-fluency",
        "data2text-naturalness",
        "data2text-informativeness"
      ]
    },
    "extraction": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
        "Precision",
        "Recall",
        "F1 score",
        "CHRF"
      ],
      "UniEval": [
        "summarization-fluency",
        "data2text-naturalness",
        "data2text-informativeness"
      ]
    },
    "generation": {
      "GPT": [
        "language organization",
        "relevance",
        "diversity"
      ],
      "Metrics": [
        "BLEU",
        "ROUGE",
        "BERTScore"
      ],
      "UniEval": [
        "summarization-fluency",
        "data2text-naturalness",
        "data2text-informativeness"
      ]
    },
    "logical_reasoning": {
      "GPT": [
        "correctness",
        "relevance",
        "reasonableness"
      ],
      "Metrics": [
        "BLEU",
        "ROUGE",
        "BERTScore",
        "CHRF"
      ],
      "UniEval": [
      ]
    },
    "open_qa": {
      "GPT": [
        "language organization",
        "relevance",
        "correctness"
      ],
      "Metrics": [
        "Distinct"
      ],
      "UniEval": [
        "summarization-fluency",
        "data2text-naturalness",
        "data2text-informativeness"
      ]
    },
    "rewriting": {
      "GPT": [
        "language organization",
        "relevance",
        "correctness"
      ],
      "Metrics": [
        "BLEU",
        "ROUGE",
        "BERTScore"
      ],
      "UniEval": [
        "summarization-fluency",
        "data2text-naturalness",
        "data2text-informativeness"
      ]
    },
    "roleplay": {
      "GPT": [
        "language organization",
        "relevance",
        "fidelity",
        "creativity"
      ],
      "Metrics": [
        "Distinct"
      ],
      "UniEval": [
        "summarization-fluency",
        "data2text-naturalness",
        "data2text-informativeness"
      ]
    },
    "summarization": {
      "GPT": [
        "language organization",
        "relevance",
        "correctness",
        "conciseness"
      ],
      "Metrics": [
        "BLEU",
        "ROUGE",
        "BERTScore",
        "CHRF"
      ],
      "UniEval": [
      ]
    },
    "Finance": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
      ],
      "UniEval": [
      ]
    },
    "Law": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
      ],
      "UniEval": [
      ]
    },
    "Education": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
      ],
      "UniEval": [
      ]
    },
    "Medical": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
      ],
      "UniEval": [
      ]
    },
    "STEM": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
      ],
      "UniEval": [
      ]
    },
    "SocialScience": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
      ],
      "UniEval": [
      ]
    },
    "Humanity": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
      ],
      "UniEval": [
      ]
    },
    "Other": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
      ],
      "UniEval": [
      ]
    },
    "ethics": {
      "GPT": [
        "relevance",
        "correctness"
      ],
      "Metrics": [
      ],
      "UniEval": [
      ]
    }
  }
}
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`{`
			`"language": "en",`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`"path_for_UniEval": {`
			`"summarization": "path to unieval-sum",`
			`"dialogue": "path to unieval-dialog",`
			`"data2text": "path to unieval-sum"`
			`},`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`"category": {`
			`"brainstorming": {`
			`"GPT": [`
			`"language organization",`
			`"relevance",`
			`"creativity",`
			`"practicality",`
[evaluate] support gpt evaluation with reference (#3972) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-13 07:12:29 +00:00			`"reasonableness"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`],`
			`"Metrics": [`
			`"Distinct"`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`],`
			`"UniEval": [`
			`"summarization-fluency",`
			`"data2text-naturalness",`
			`"data2text-informativeness"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`]`
			`},`
			`"chat": {`
			`"GPT": [`
			`"language organization",`
			`"naturalness",`
			`"engagingness",`
[chat] update config and prompt (#4139) * update config and prompt * update config --------- Co-authored-by: Qianran Ma <qianranm@luchentech.com> 2023-08-21 06:30:25 +00:00			`"fidelity"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`],`
			`"Metrics": [`
			`"Distinct"`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`],`
			`"UniEval": [`
			`"summarization-fluency",`
			`"dialogue-naturalness",`
			`"dialogue-coherence",`
			`"dialogue-understandability",`
			`"data2text-naturalness",`
			`"data2text-informativeness"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`]`
			`},`
			`"classification": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`"Precision",`
			`"Recall",`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`"F1 score",`
			`"CHRF"`
			`],`
			`"UniEval": [`
			`"summarization-fluency",`
			`"data2text-naturalness",`
			`"data2text-informativeness"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`]`
			`},`
			`"closed_qa": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`"BLEU",`
			`"ROUGE",`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`"BERTScore",`
			`"CHRF"`
			`],`
			`"UniEval": [`
			`"summarization-fluency",`
			`"data2text-naturalness",`
			`"data2text-informativeness"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`]`
			`},`
			`"extraction": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`"Precision",`
			`"Recall",`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`"F1 score",`
			`"CHRF"`
			`],`
			`"UniEval": [`
			`"summarization-fluency",`
			`"data2text-naturalness",`
			`"data2text-informativeness"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`]`
			`},`
			`"generation": {`
			`"GPT": [`
			`"language organization",`
			`"relevance",`
			`"diversity"`
			`],`
			`"Metrics": [`
			`"BLEU",`
			`"ROUGE",`
			`"BERTScore"`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`],`
			`"UniEval": [`
			`"summarization-fluency",`
			`"data2text-naturalness",`
			`"data2text-informativeness"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`]`
			`},`
[chat] update config and prompt (#4139) * update config and prompt * update config --------- Co-authored-by: Qianran Ma <qianranm@luchentech.com> 2023-08-21 06:30:25 +00:00			`"logical_reasoning": {`
			`"GPT": [`
			`"correctness",`
			`"relevance",`
			`"reasonableness"`
			`],`
			`"Metrics": [`
			`"BLEU",`
			`"ROUGE",`
			`"BERTScore",`
			`"CHRF"`
			`],`
			`"UniEval": [`
			`]`
			`},`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`"open_qa": {`
			`"GPT": [`
			`"language organization",`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`"Distinct"`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`],`
			`"UniEval": [`
			`"summarization-fluency",`
			`"data2text-naturalness",`
			`"data2text-informativeness"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`]`
			`},`
			`"rewriting": {`
			`"GPT": [`
			`"language organization",`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`"BLEU",`
			`"ROUGE",`
			`"BERTScore"`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`],`
			`"UniEval": [`
			`"summarization-fluency",`
			`"data2text-naturalness",`
			`"data2text-informativeness"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`]`
			`},`
			`"roleplay": {`
			`"GPT": [`
			`"language organization",`
			`"relevance",`
			`"fidelity",`
			`"creativity"`
			`],`
			`"Metrics": [`
			`"Distinct"`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`],`
			`"UniEval": [`
			`"summarization-fluency",`
			`"data2text-naturalness",`
			`"data2text-informativeness"`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`]`
			`},`
			`"summarization": {`
			`"GPT": [`
			`"language organization",`
			`"relevance",`
			`"correctness",`
			`"conciseness"`
			`],`
			`"Metrics": [`
			`"BLEU",`
			`"ROUGE",`
support UniEval and add CHRF metric (#3924) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-08 09:38:47 +00:00			`"BERTScore",`
			`"CHRF"`
			`],`
			`"UniEval": [`
[chat] update config and prompt (#4139) * update config and prompt * update config --------- Co-authored-by: Qianran Ma <qianranm@luchentech.com> 2023-08-21 06:30:25 +00:00			`]`
			`},`
			`"Finance": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`],`
			`"UniEval": [`
			`]`
			`},`
			`"Law": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`],`
			`"UniEval": [`
			`]`
			`},`
			`"Education": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`],`
			`"UniEval": [`
			`]`
			`},`
			`"Medical": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`],`
			`"UniEval": [`
			`]`
			`},`
			`"STEM": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`],`
			`"UniEval": [`
			`]`
			`},`
			`"SocialScience": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`],`
			`"UniEval": [`
			`]`
			`},`
			`"Humanity": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`],`
			`"UniEval": [`
			`]`
			`},`
			`"Other": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`],`
			`"UniEval": [`
			`]`
			`},`
			`"ethics": {`
			`"GPT": [`
			`"relevance",`
			`"correctness"`
			`],`
			`"Metrics": [`
			`],`
			`"UniEval": [`
support evaluation for english (#3880) Co-authored-by: Yuanchen Xu <yuanchen.xu00@gmail.com> 2023-06-05 13:24:21 +00:00			`]`
			`}`
			`}`
			`}`