1 month ago · fb75cbd8a2
--- a/app/routers/chat.py
+++ b/app/routers/chat.py
@@ -108,11 +108,31 @@ def convert_messages_for_api(messages: List[ChatMessage]) -> List[Dict[str, str]
 
				     return [{"role": msg.role, "content": msg.content} for msg in messages]

			
 
				 

			
 
				 

			
 
				+def get_latest_user_message(messages: List[ChatMessage]) -> Optional[ChatMessage]:

			
 
				+    """

			
 
				+    获取消息列表中最后一条user角色的消息

			
 
				+

			
 
				+    在多轮对话中，消息列表可能包含user和assistant的消息，

			
 
				+    流式场景下客户端会预先添加空的assistant消息作为占位符，

			
 
				+    此函数确保获取到最后一条用户发送的消息

			
 
				+

			
 
				+    Args:

			
 
				+        messages (List[ChatMessage]): 消息列表

			
 
				+

			
 
				+    Returns:

			
 
				+        Optional[ChatMessage]: 最后一条user角色的消息，如果不存在则返回None

			
 
				+    """

			
 
				+    for message in reversed(messages):

			
 
				+        if message.role == "user":

			
 
				+            return message

			
 
				+    return None

			
 
				+

			
 
				+

			
 
				 async def generate_stream_response(request: ChatRequest, username: str):

			
 
				     """

			
 
				     生成流式响应的异步生成器

			
 
				 

			
 
				-    这个函数处理流式AI响应，将OpenAI的流式输出转换为SSE格式

			
 
				+    这个函数处理流式AI响应，将Ark API的流式输出转换为SSE格式

			
 
				 

			
 
				     Args:

			
 
				         request (ChatRequest): 聊天请求对象

			
@@ -126,47 +146,115 @@ async def generate_stream_response(request: ChatRequest, username: str):
 
				         客户端需要使用EventSource或类似技术接收流式数据

			
 
				     """

			
 
				     try:

			
 
				-        # 转换消息格式为OpenAI API需要的格式

			
 
				-        api_messages = convert_messages_for_api(request.messages)

			
 
				+        # 获取最后一条user角色的消息

			
 
				+        latest_user_msg = get_latest_user_message(request.messages)

			
 
				+        if not latest_user_msg:

			
 
				+            raise ValueError("请求中没有找到user角色的消息")

			
 
				+

			
 
				+        # 将用户消息添加到历史记录

			
 
				+        user_message = ChatMessage(

			
 
				+            role=latest_user_msg.role,

			
 
				+            content=latest_user_msg.content,

			
 
				+            timestamp=datetime.now()

			
 
				+        )

			
 
				+        chatHistory[username].append(user_message)

			
 
				+

			
 
				+        # 转换消息格式为API需要的格式

			
 
				+        api_messages = [{"role": latest_user_msg.role, "content": latest_user_msg.content}]

			
 
				+

			
 
				+        tools = [{

			
 
				+            "type": "doubao_app",

			
 
				+            "feature": {

			
 
				+                "ai_search": {

			
 
				+                    "type": "enabled",

			
 
				+                    "role_description": "你是浙江云悦有限公司助手，专业解答云悦问题"

			
 
				+                }

			
 
				+            },

			
 
				+            "user_location": {

			
 
				+                "type": "approximate",

			
 
				+                "country": "中国",

			
 
				+                "region": "浙江",

			
 
				+                "city": "杭州"

			
 
				+            }

			
 
				+        }]

			
 
				+

			
 
				+        # 获取上一轮对话的response_id，用于多轮对话的上下文关联

			
 
				+        previous_response_id = None

			
 
				+        if username in chatHistory and len(chatHistory[username]) > 0:

			
 
				+            # 从后往前查找最后一条assistant消息的response_id

			
 
				+            for message in reversed(chatHistory[username]):

			
 
				+                if message.role == "assistant" and message.response_id:

			
 
				+                    previous_response_id = message.response_id

			
 
				+                    break

			
 
				 

			
 
				-        # 调用OpenAI流式API

			
 
				         # stream=True 启用流式输出，API会返回一个迭代器

			
 
				-        stream = client.chat.completions.create(

			
 
				-            model=request.model or config.MODEL_NAME,  # 使用指定模型或默认模型

			
 
				-            messages=api_messages,  # 对话历史

			
 
				-            max_tokens=request.max_tokens,  # 最大token数

			
 
				-            temperature=request.temperature,  # 创造性温度

			
 
				-            stream=True  # 启用流式输出

			
 
				+        stream = client.responses.create(

			
 
				+            model=config.MODEL_NAME,

			
 
				+            input=api_messages,

			
 
				+            tools=tools,

			
 
				+            stream=True,

			
 
				+            store=True,  # 存储当前对话上下文。此字段不存储tools，每次调用仍需给tools赋值。

			
 
				+            previous_response_id=previous_response_id,

			
 
				         )

			
 
				 

			
 
				-        # 用于累积完整的回答内容

			
 
				+

			
 
				+        # 用于累积完整的回答内容和response_id

			
 
				         accumulated_content = ""

			
 
				+        response_id = None

			
 
				 

			
 
				         # 遍历流式响应的每个数据块

			
 
				         for chunk in stream:

			
 
				-            # 检查数据块是否包含有效内容

			
 
				-            if chunk.choices and chunk.choices[0].delta.content:

			
 
				-                # 提取本次数据块的内容

			
 
				-                chunk_content = chunk.choices[0].delta.content

			
 
				-

			
 
				-                # 累积到完整内容中

			
 
				-                accumulated_content += chunk_content

			
 
				-

			
 
				-                # 构建流式响应数据对象

			
 
				-                response_data = StreamResponse(

			
 
				-                    content=chunk.choices[0].delta.content,  # 本次片段内容

			
 
				-                    finished=False,  # 标记为未完成

			
 
				-                    model=request.model or config.MODEL_NAME,  # 使用的模型

			
 
				-                    timestamp=datetime.now()  # 当前时间戳

			
 
				-                )

			
 
				+            # 处理不同类型的流式事件

			
 
				+            chunk_dict = chunk.__dict__ if hasattr(chunk, '__dict__') else {}

			
 
				+            event_type = chunk_dict.get('type', '')

			
 
				+

			
 
				+            # 处理文本内容增量事件（普通文本）

			
 
				+            if event_type == 'response.output_text.delta':

			
 
				+                delta_text = chunk_dict.get('delta', '')

			
 
				+                if delta_text:

			
 
				+                    # 累积到完整内容中

			
 
				+                    accumulated_content += delta_text

			
 
				+

			
 
				+                    # 构建流式响应数据对象

			
 
				+                    response_data = StreamResponse(

			
 
				+                        content=delta_text,  # 本次片段内容

			
 
				+                        finished=False,  # 标记为未完成

			
 
				+                        model= config.MODEL_NAME,  # 使用的模型

			
 
				+                        timestamp=datetime.now()  # 当前时间戳

			
 
				+                    )

			
 
				 

			
 
				-                # 格式化为SSE格式并发送

			
 
				-                # SSE格式: "data: {json_data}\n\n"

			
 
				-                yield f"data: {response_data.model_dump_json()}\n\n"

			
 
				+                    # 格式化为SSE格式并发送

			
 
				+                    # SSE格式: "data: {json_data}\n\n"

			
 
				+                    yield f"data: {response_data.model_dump_json()}\n\n"

			
 
				+

			
 
				+                    # 异步让出控制权，避免阻塞事件循环

			
 
				+                    await asyncio.sleep(0.01)

			
 
				+

			
 
				+            # 处理DoubaoApp调用的文本输出增量事件

			
 
				+            elif event_type == 'response.doubao_app_call_output_text.delta':

			
 
				+                delta_text = chunk_dict.get('delta', '')

			
 
				+                if delta_text:

			
 
				+                    # 累积到完整内容中

			
 
				+                    accumulated_content += delta_text

			
 
				+

			
 
				+                    # 构建流式响应数据对象

			
 
				+                    response_data = StreamResponse(

			
 
				+                        content=delta_text,  # 本次片段内容

			
 
				+                        finished=False,  # 标记为未完成

			
 
				+                        model= config.MODEL_NAME,  # 使用的模型

			
 
				+                        timestamp=datetime.now()  # 当前时间戳

			
 
				+                    )

			
 
				+

			
 
				+                    # 格式化为SSE格式并发送

			
 
				+                    yield f"data: {response_data.model_dump_json()}\n\n"

			
 
				 

			
 
				-                # 异步让出控制权，避免阻塞事件循环

			
 
				-                # 这对于处理大量并发请求很重要

			
 
				-                await asyncio.sleep(0.01)

			
 
				+                    # 异步让出控制权，避免阻塞事件循环

			
 
				+                    await asyncio.sleep(0.01)

			
 
				+

			
 
				+            # 处理响应完成事件，获取response_id

			
 
				+            elif event_type == 'response.completed':

			
 
				+                if 'response' in chunk_dict and hasattr(chunk_dict['response'], 'id'):

			
 
				+                    response_id = chunk_dict['response'].id

			
 
				 

			
 
				         # 流式响应结束后的处理

			
 
				         if accumulated_content:

			
@@ -174,22 +262,27 @@ async def generate_stream_response(request: ChatRequest, username: str):
 
				             final_response = StreamResponse(

			
 
				                 content='',  # 结束信号不包含内容

			
 
				                 finished=True,  # 标记为已完成

			
 
				-                model=request.model or config.MODEL_NAME,

			
 
				+                model= config.MODEL_NAME,

			
 
				                 timestamp=datetime.now()

			
 
				             )

			
 
				 

			
 
				-            # 将完整的AI回复保存到用户的聊天历史中

			
 
				+            # 将完整的AI回复保存到用户的聊天历史中，包含response_id

			
 
				             chatHistory[username].append(

			
 
				                 ChatMessage(

			
 
				                     role="assistant",

			
 
				                     content=accumulated_content,

			
 
				-                    timestamp=datetime.now()

			
 
				+                    timestamp=datetime.now(),

			
 
				+                    response_id=response_id  # 保存response_id用于后续多轮对话

			
 
				                 )

			
 
				             )

			
 
				 

			
 
				+

			
 
				             # 发送结束信号

			
 
				             yield f"data: {final_response.model_dump_json()}\n\n"

			
 
				 

			
 
				+            # 在控制台输出提示

			
 
				+            print("流式内容已全部输出")

			
 
				+

			
 
				     except Exception as e:

			
 
				         # 流式响应过程中的错误处理

			
 
				         # 构建错误响应并发送给客户端

			
@@ -249,14 +342,6 @@ async def chat(
 
				         if request.stream:

			
 
				             # ===== 流式输出处理 =====

			
 
				 

			
 
				-            # 将用户的最新消息添加到历史记录

			
 
				-            user_message = ChatMessage(

			
 
				-                role=request.messages[-1].role,

			
 
				-                content=request.messages[-1].content,

			
 
				-                timestamp=datetime.now()

			
 
				-            )

			
 
				-            # chatHistory[username].append(user_message)

			
 
				-

			
 
				             # 返回流式响应

			
 
				             # StreamingResponse 用于处理SSE协议

			
 
				             return StreamingResponse(

			
@@ -272,21 +357,36 @@ async def chat(
 
				         else:

			
 
				             # ===== 非流式输出处理 =====

			
 
				 

			
 
				+            # 获取最后一条user角色的消息

			
 
				+            latest_user_msg = get_latest_user_message(request.messages)

			
 
				+            if not latest_user_msg:

			
 
				+                raise ValueError("请求中没有找到user角色的消息")

			
 
				+

			
 
				             # 将用户消息添加到历史记录

			
 
				             user_message = ChatMessage(

			
 
				-                role=request.messages[-1].role,

			
 
				-                content=request.messages[-1].content,

			
 
				+                role=latest_user_msg.role,

			
 
				+                content=latest_user_msg.content,

			
 
				                 timestamp=datetime.now()

			
 
				             )

			
 
				             chatHistory[username].append(user_message)

			
 
				 

			
 
				-            # 转换消息格式为OpenAI API需要的格式

			
 
				-            # api_messages = convert_messages_for_api(request.messages)

			
 
				-            api_messages = [{"role": request.messages[-1].role, "content": request.messages[-1].content}]

			
 
				+            # 转换消息格式为API需要的格式

			
 
				+            api_messages = [{"role": latest_user_msg.role, "content": latest_user_msg.content}]

			
 
				 

			
 
				             tools = [{

			
 
				-                "type": "web_search",

			
 
				-                "max_keyword": 2,  # 可选参数，用于限制一轮搜索的最大关键词数量

			
 
				+                "type": "doubao_app",

			
 
				+                "feature": {

			
 
				+                    "ai_search": {

			
 
				+                        "type": "enabled",

			
 
				+                        "role_description": "你是浙江云悦有限公司助手，专业解答云悦问题"

			
 
				+                    }

			
 
				+                },

			
 
				+                "user_location": {

			
 
				+                    "type": "approximate",

			
 
				+                    "country": "中国",

			
 
				+                    "region": "浙江",

			
 
				+                    "city": "杭州"

			
 
				+                }

			
 
				             }]

			
 
				 

			
 
				             # 获取上一轮对话的response_id，用于多轮对话的上下文关联

			
@@ -303,33 +403,40 @@ async def chat(
 
				                 input=api_messages,

			
 
				                 tools=tools,

			
 
				                 stream=False,

			
 
				+                store=True,  # 存储当前对话上下文。此字段不存储tools，每次调用仍需给tools赋值。

			
 
				                 previous_response_id=previous_response_id,

			
 
				             )

			
 
				 

			
 
				             # 检查API响应是否有效

			
 
				             if response.output and len(response.output) > 0:

			
 
				-                # 从output中找到最后一条消息（ResponseOutputMessage类型）

			
 
				-                last_message = None

			
 
				-                for item in reversed(response.output):

			
 
				-                    if hasattr(item, 'type') and item.type == 'message':

			
 
				-                        last_message = item

			
 
				-                        break

			
 
				-

			
 
				-                if last_message and hasattr(last_message, 'content'):

			
 
				-                    # 提取消息内容

			
 
				-                    message_content = ""

			
 
				-                    if isinstance(last_message.content, list):

			
 
				-                        # content是列表，提取所有文本内容

			
 
				-                        for content_item in last_message.content:

			
 
				-                            if hasattr(content_item, 'text'):

			
 
				-                                message_content += content_item.text

			
 
				-                    else:

			
 
				-                        message_content = str(last_message.content)

			
 
				-

			
 
				+                # 从output中提取文本内容

			
 
				+                message_content = ""

			
 
				+

			
 
				+                for item in response.output:

			
 
				+                    # 处理 ItemDoubaoAppCall 类型（包含搜索结果和文本输出）

			
 
				+                    if hasattr(item, 'type') and item.type == 'doubao_app_call':

			
 
				+                        if hasattr(item, 'blocks') and item.blocks:

			
 
				+                            # 从blocks中找到output_text类型的块

			
 
				+                            for block in item.blocks:

			
 
				+                                if hasattr(block, 'type') and block.type == 'output_text':

			
 
				+                                    if hasattr(block, 'text'):

			
 
				+                                        message_content += block.text

			
 
				+

			
 
				+                    # 处理其他类型的消息项

			
 
				+                    elif hasattr(item, 'type') and item.type == 'message':

			
 
				+                        if hasattr(item, 'content'):

			
 
				+                            if isinstance(item.content, list):

			
 
				+                                for content_item in item.content:

			
 
				+                                    if hasattr(content_item, 'text'):

			
 
				+                                        message_content += content_item.text

			
 
				+                            else:

			
 
				+                                message_content += str(item.content)

			
 
				+

			
 
				+                if message_content:

			
 
				                     # 构建AI助手的回复消息，包含response_id用于多轮对话

			
 
				                     assistant_message = ChatMessage(

			
 
				                         role="assistant",

			
 
				-                        content=message_content or "",

			
 
				+                        content=message_content,

			
 
				                         timestamp=datetime.now(),

			
 
				                         response_id=response.id  # 保存response_id用于后续多轮对话

			
 
				                     )

			
@@ -346,6 +453,12 @@ async def chat(
 
				                     )

			
 
				 

			
 
				                     return chat_response

			
 
				+                else:

			
 
				+                    # 没有提取到文本内容的错误处理

			
 
				+                    raise HTTPException(

			
 
				+                        status_code=500,

			
 
				+                        detail="无法从AI响应中提取文本内容"

			
 
				+                    )

			
 
				             else:

			
 
				                 # API返回空响应的错误处理

			
 
				                 raise HTTPException(