ChatGLM-6B/api.py

import datetime
import json

import uvicorn
from fastapi import FastAPI, Request

from utils import load_mode_and_tokenizer

app = FastAPI()


@app.post("/")
async def create_item(request: Request):
    global model, tokenizer
    json_post_raw = await request.json()
    json_post = json.dumps(json_post_raw)
    json_post_list = json.loads(json_post)
    prompt = json_post_list.get('prompt')
    history = json_post_list.get('history')
    response, history = model.chat(tokenizer, prompt, history=history)
    now = datetime.datetime.now()
    time = now.strftime("%Y-%m-%d %H:%M:%S")
    answer = {
        "response": response,
        "history": history,
        "status": 200,
        "time": time
    }
    log = "[" + time + "] " + '", prompt:"' + prompt + '", response:"' + repr(response) + '"'
    print(log)
    return answer


if __name__ == '__main__':
    uvicorn.run('api:app', host='0.0.0.0', port=8000, workers=1)

model, tokenizer = load_mode_and_tokenizer("THUDM/chatglm-6b", num_gpus=1)
多GPU支持, 模型文件夹没有index.json会自动保存模型到multi_gpu_model_cache_dir以支持多GPU 2023-03-26 07:13:44 +00:00			`import datetime`
			`import json`

			`import uvicorn`
Add API.py 2023-03-19 14:03:02 +00:00			`from fastapi import FastAPI, Request`
多GPU支持, 模型文件夹没有index.json会自动保存模型到multi_gpu_model_cache_dir以支持多GPU 2023-03-26 07:13:44 +00:00
			`from utils import load_mode_and_tokenizer`
Add API.py 2023-03-19 14:03:02 +00:00
			`app = FastAPI()`
Add history in API 2023-03-23 13:42:43 +00:00

Add API.py 2023-03-19 14:03:02 +00:00			`@app.post("/")`
			`async def create_item(request: Request):`
Add history in API 2023-03-23 13:42:43 +00:00			`global model, tokenizer`
			`json_post_raw = await request.json()`
			`json_post = json.dumps(json_post_raw)`
			`json_post_list = json.loads(json_post)`
			`prompt = json_post_list.get('prompt')`
			`history = json_post_list.get('history')`
Add API.py 2023-03-19 14:03:02 +00:00			`response, history = model.chat(tokenizer, prompt, history=history)`
			`now = datetime.datetime.now()`
			`time = now.strftime("%Y-%m-%d %H:%M:%S")`
			`answer = {`
Add history in API 2023-03-23 13:42:43 +00:00			`"response": response,`
			`"history": history,`
			`"status": 200,`
			`"time": time`
Add API.py 2023-03-19 14:03:02 +00:00			`}`
Add history in API 2023-03-23 13:42:43 +00:00			`log = "[" + time + "] " + '", prompt:"' + prompt + '", response:"' + repr(response) + '"'`
Add API.py 2023-03-19 14:03:02 +00:00			`print(log)`
			`return answer`

Add history in API 2023-03-23 13:42:43 +00:00
Add API.py 2023-03-19 14:03:02 +00:00			`if __name__ == '__main__':`
Update api.py bug fix 2023-03-24 08:45:24 +00:00			`uvicorn.run('api:app', host='0.0.0.0', port=8000, workers=1)`
Add API.py 2023-03-19 14:03:02 +00:00
多GPU支持, 模型文件夹没有index.json会自动保存模型到multi_gpu_model_cache_dir以支持多GPU 2023-03-26 07:13:44 +00:00			`model, tokenizer = load_mode_and_tokenizer("THUDM/chatglm-6b", num_gpus=1)`