news 2026/6/23 10:52:12

Azure AI Search 性能优化实战:从 40 秒到 8 秒的优化之旅

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Azure AI Search 性能优化实战:从 40 秒到 8 秒的优化之旅

背景

我们的知识库问答系统使用 Azure Container Apps + Azure AI Search + Azure OpenAI 构建,架构如下:

用户请求 → Container App → AI Search (向量搜索) → OpenAI (生成回答)

系统上线后,性能表现不佳:

  • P50 响应时间:18 秒
  • P99 响应时间:41 秒
  • 最慢请求:40.9 秒

用户体验极差,需要紧急优化。

问题分析过程

第一次分析:应用层串行执行(部分正确)

查看应用日志,发现单个请求内部执行流程:

00:00:00.000 - 请求开始 00:00:02.000 - get_search_results took 7.053s 00:00:07.000 - get_search_results took 10.068s (5秒后才开始) 00:00:26.000 - get_search_results took 23.689s (19秒后才开始) 00:00:32.000 - get_search_results took 27.646s (6秒后才开始) 00:00:34.000 - combine_content took 40.618s

初步结论:应用层串行执行多次 AI

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/18 16:08:10

飞轮储能系统的建模与 MATLAB 仿真:永磁同步电机作为飞轮驱动电机

飞轮储能系统的建模与MATLAB仿真(永磁同步电机作为飞轮驱动电机)不是模型嘿,各位技术爱好者!今天咱们来聊聊飞轮储能系统的建模以及用 MATLAB 进行仿真的事儿,这里的飞轮驱动电机用的是永磁同步电机。飞轮储能系统可是…

作者头像 李华
网站建设 2026/6/22 16:16:10

车间进度总卡壳?生产小工单的3个必备功能,90%企业都用错了

你有没有过这种时刻?老板微信一问:进度到哪了?你只能回:正在做。干过车间的都懂,这哪是正在做,分明是不知道 。大部分的车间主管都这样:进度全靠猜,Excel堆满桌面,工人填…

作者头像 李华
网站建设 2026/6/22 22:24:57

如何用 ShedLock 让 Spring Boot 的定时任务在多实例环境下只执行一次

执行。原因很简单:默认情况下,Spring 不会在多个实例之间做调度同步。这篇文章就聊聊怎么用 ShedLock,让定时任务在多实例环境下“同一时刻只跑一次”。顺便一提,它也能作为 Quartz 的替代。Maven 依赖先引入 shedlock-spring 这个…

作者头像 李华
网站建设 2026/6/23 6:35:43

基于MPC的永磁同步电机非线性终端滑模控制仿真研究

基于MPC的永磁同步电机非线性终端滑模控制仿真研究 matlab simulink 无参考文件在电机控制领域,永磁同步电机(PMSM)以其高效、高功率密度等优点,广泛应用于工业、交通等诸多领域。为了实现PMSM更加精准、高效的控制,各…

作者头像 李华
网站建设 2026/6/14 8:32:02

ISSA - CNN - BiLSTM多输入单输出回归的Python实现与改进

ISSA多策略改进麻雀优化ISSA-CNN-BiLSTM 多输入单输出回归 python代码 优化参数:filter,unints1,units2,学习率(可添加) 以下是三个主要的改进点: sin混沌映射: sin混沌映射初始化种群,这是一种…

作者头像 李华
网站建设 2026/6/17 18:56:50

Q学习(Q-learning)路径规划算法实战

Q学习(Q-learning)路径规划算法。 matlab代码。 智能体与环境交互来更新Q值表。 可以通过窗口界面方便观察交互过程 非4栅格拓展!智能体可以在一个栅格向8个方向拓展。 代码注释详尽,可以方便替换自己的地图。 #路径规划 #强化学习…

作者头像 李华