ColossalAI

Making large AI models cheaper, faster and more accessible

History

Dongruixuan Li a7ae2b5b4c [eval-hotfix] set few_shot_data to None when few shot is disabled (#5422 )		9 months ago
..
__init__.py	[ColossalEval] Support GSM, Data Leakage Evaluation and Tensor Parallel (#5169 )	12 months ago
agieval.py	[eval-hotfix] set few_shot_data to None when few shot is disabled (#5422 )	9 months ago
base.py	[ColossalEval] Support GSM, Data Leakage Evaluation and Tensor Parallel (#5169 )	12 months ago
ceval.py	[ColossalEval] Support GSM, Data Leakage Evaluation and Tensor Parallel (#5169 )	12 months ago
cmmlu.py	[ColossalEval] Support GSM, Data Leakage Evaluation and Tensor Parallel (#5169 )	12 months ago
colossalai.py	[feature] ColossalEval: Evaluation Pipeline for LLMs (#4786 )	1 year ago
cvalues.py	[FEATURE] Add Safety Eval Datasets to ColossalEval (#5095 )	1 year ago
gaokaobench.py	[ColossalEval] Support GSM, Data Leakage Evaluation and Tensor Parallel (#5169 )	12 months ago
gsm.py	[ColossalEval] Support GSM, Data Leakage Evaluation and Tensor Parallel (#5169 )	12 months ago
longbench.py	[feature] ColossalEval: Evaluation Pipeline for LLMs (#4786 )	1 year ago
mmlu.py	[ColossalEval] Support GSM, Data Leakage Evaluation and Tensor Parallel (#5169 )	12 months ago
mtbench.py	Support mtbench (#5025 )	1 year ago
safetybench_en.py	[FEATURE] Add Safety Eval Datasets to ColossalEval (#5095 )	1 year ago
safetybench_zh.py	[FEATURE] Add Safety Eval Datasets to ColossalEval (#5095 )	1 year ago