Create multi_user_api.py

多用户独立对话api, 定时刷新历史对话记录
2023-04-14 19:47:44 +08:00 · 2023-04-14 19:47:44 +08:00 · f15816d0d1
parent 8633db1503
commit f15816d0d1
1 changed files with 80 additions and 0 deletions
--- a/multi_user_api.py
+++ b/multi_user_api.py
@ -0,0 +1,80 @@
+# -*- coding: utf-8 -*-
+from transformers import AutoTokenizer, AutoModel
+import json
+from flask import Flask, request, make_response
+from gevent.pywsgi import WSGIServer
+from apscheduler.schedulers.blocking import BlockingScheduler
+import threading
+
+def job():
+    global user_dialogue_record
+    user_dialogue_record = {}
+
+def timer():
+    scheduler = BlockingScheduler()
+    scheduler.add_job(job, 'interval', minutes=30)
+    # scheduler.add_job(job, 'interval', seconds=30)
+    scheduler.start()
+
+
+t_update = threading.Thread(target=timer)
+t_update.start()
+
+user_dialogue_record = {}
+
+app = Flask(__name__)
+@app.route("/chat", methods=['POST'])
+def dialogue():
+    try:
+        args = request.json
+        if 'user_id' not in args or 'query' not in args:
+            raise Exception(400)
+
+        user_id = str(args.get('user_id', ''))
+        query = str(args.get('query',''))
+        clear = str(args.get('clear', False))
+        if query == "":
+            response_t = "你没有输入对话内容，请输入..."
+            result = {"message": response_t}
+            response = make_response(json.dumps(result) + '\r\n')
+            response.mimetype = 'application/json'
+            return response, 200
+
+        if user_id in user_dialogue_record:
+            history = user_dialogue_record[user_id]
+        else:
+            history = []
+            user_dialogue_record[user_id] = history
+
+        if clear:
+            history = []
+            user_dialogue_record[user_id] = history
+
+        response_t, history = model.chat(tokenizer, query, history=history)
+
+        user_dialogue_record[user_id] = history
+
+        result = {"message":response_t}
+        response = make_response(json.dumps(result) + '\r\n')
+        response.mimetype = 'application/json'
+        print(user_dialogue_record)
+        return response, 200
+    except Exception as e:
+        if str(e.__str__()).startswith('4'):
+            response = make_response(json.dumps({'status': 'error'}) + '\r\n')
+            response.mimetype = 'application/json'
+            return response, 400
+        else:
+            response = make_response(json.dumps({'status': 'error'}) + '\r\n')
+            response.mimetype = 'application/json'
+            return response, 500
+
+
+
+if __name__ == "__main__":
+    tokenizer = AutoTokenizer.from_pretrained("./llm_6b", trust_remote_code=True)
+    model = AutoModel.from_pretrained("./llm_6b", trust_remote_code=True).half().cuda()
+    model = model.eval()
+    http_server = WSGIServer(('0.0.0.0', 8018), app)
+    http_server.serve_forever()
+