From a10fbd88e1018f19e2f3e56e3f002026d0bc05b4 Mon Sep 17 00:00:00 2001 From: songxxzp Date: Tue, 14 Mar 2023 18:35:35 +0800 Subject: [PATCH 1/2] Add CPU support with less than 16G memory --- README.md | 6 ++++++ 1 file changed, 6 insertions(+) diff --git a/README.md b/README.md index 9350de7..92239e4 100644 --- a/README.md +++ b/README.md @@ -101,6 +101,12 @@ model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).fl ``` CPU上推理速度可能会比较慢。 +以上方法需要32G内存。如果你只有16G内存,可以尝试 +```python +model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).bfloat16() +``` +需保证空闲内存接近16G,并且推理速度会很慢。 + ## ChatGLM-6B示例 以下是一些使用`web_demo.py`得到的示例截图。更多ChatGLM-6B的可能,等待你来探索发现! From cebef2817a49407d76382e68f777f77a38d6b16f Mon Sep 17 00:00:00 2001 From: Ikko Eltociear Ashimine Date: Tue, 14 Mar 2023 21:12:01 +0900 Subject: [PATCH 2/2] Update README.md HuggingFace -> Hugging Face --- README.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/README.md b/README.md index 92239e4..3354bb9 100644 --- a/README.md +++ b/README.md @@ -46,7 +46,7 @@ ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 如果这些方法无法帮助你入睡,你可以考虑咨询医生或睡眠专家,寻求进一步的建议。 ``` -完整的模型实现可以在 [HuggingFace Hub](https://huggingface.co/THUDM/chatglm-6b) 上查看。 +完整的模型实现可以在 [Hugging Face Hub](https://huggingface.co/THUDM/chatglm-6b) 上查看。 ### Demo