|
|
|
@ -5,7 +5,7 @@
|
|
|
|
|
ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 [General Language Model (GLM)](https://github.com/THUDM/GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。
|
|
|
|
|
ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。更多信息请参考我们的[博客](https://chatglm.cn/blog)。
|
|
|
|
|
|
|
|
|
|
不过,由于ChatGLM-6B的规模较小,目前已知其具有相当多的[局限性](##局限性),如事实性/数学逻辑错误,可能生成有害/有偏见内容,较弱的上下文能力,以及自我认知混乱。请大家在使用前了解这些问题,以免产生误解。
|
|
|
|
|
不过,由于ChatGLM-6B的规模较小,目前已知其具有相当多的[局限性](#局限性),如事实性/数学逻辑错误,可能生成有害/有偏见内容,较弱的上下文能力,以及自我认知混乱。请大家在使用前了解这些问题,以免产生误解。
|
|
|
|
|
|
|
|
|
|
同时,我们基于千亿基座的[ChatGLM 模型](https://chatglm.cn)正在邀请制内测,后续将逐步扩大内测范围,欢迎申请加入内测。
|
|
|
|
|
|
|
|
|
|