首页 关于我们 成功案例 网站营销 电商设计 新闻中心 联系方式
QQ联系
电话联系
手机联系
QQ联系
电话联系
手机联系

当搜索遇上大模型:开发者怎样把传统搜索系统升级成 AI 搜索?

发布时间:2025-11-28 00:00
发布者:花韻仙語
浏览次数:

在生成式 ai 深度融入各类业务场景的当下,搜索系统的定位正经历显著转变。用户不再满足于简单的关键词匹配,而是期待系统具备语义理解、多模态识别以及实时推理的能力。尽管传统全文检索仍是基石,但已难以应对日益复杂的需求,搜索正逐步演变为 ai 应用的核心支撑层。

Elastic 中国首席布道师刘晓国在 GOTC 2025 全球开源技术峰会上指出:在现有技术架构中,如何借助向量搜索、混合搜索、RAG 及 Agentic 技术,打造面向未来的搜索体验,已成为一个亟需解决的实际问题。

随着用户行为模式不断演进,搜索系统面临的挑战也与以往大不相同。词法分析依然有效,但面对更复杂的查询需求,必须引入新的技术手段。语义搜索、跨模态检索、模型重排序和 RAG 架构正逐渐成为主流方案。当前的核心难点集中在两个方面:一是系统能否准确捕捉用户的深层意图,二是模型是否能接入企业内部动态更新的数据。而向量搜索与混合搜索,正是破解这两大难题的关键所在。

混合搜索通过融合 BM25、向量相似度计算以及 RRF 等排序机制,实现了语义召回与关键词匹配的优势互补,显著提升了结果的稳定性与准确性。演讲中还完整拆解了现代搜索系统的构建流程:首先加载 embedding 模型,在数据写入时同步生成向量;查询阶段则同时调用 match 查询与 kNN 向量检索,并支持条件过滤。从 Elasticsearch 8.7 版本起,query_vector_builder 功能可在查询时自动构建向量,极大简化了部署流程。

底层向量引擎的持续优化也是本次分享的重点。硬件加速已覆盖 CPU 指令集优化及 GPU/CAGRA 支持,向量压缩技术(如 int8 和 int4)大幅降低了存储与计算成本,新型向量存储格式 DiskBBQ 提升了高并发下的检索效率,并通过线程协同机制有效降低延迟、提高吞吐量。这些改进使得百万乃至十亿级规模的向量搜索得以在真实业务环境中稳定运行。

搜索技术趋势也正朝着“重排序优先”的方向发展。演讲展示了从 BM25、ANN 快速召回、稀疏检索,到 Query Rescorer、LTR 排序学习,再到 Cohere Rerank、Elastic Reranker 等深度模型重排的完整链路。系统先以高效算法缩小候选集范围,再利用更强的语义模型进行精排,在性能开销与结果质量之间实现良好平衡。

RAG 在企业中的应用正在加速落地,原因在于大模型的知识库是静态冻结的,无法反映企业的实时信息变化,因此必须依赖外部检索系统来补充上下文。在此架构下,混合搜索展现出天然优势。分享中还探讨了不同分块策略对召回效果的影响,并介绍了 Elasticsearch 在自动文本分块和语义字段类型方面的

内置支持能力。未来的发展方向则是 Agentic RAG —— 它将系统功能从问答延伸至任务执行,涵盖规划决策、逻辑判断和工具自主调用等多个层面。演示案例包括使用 MCP server 构建智能代理、在 Kibana 中开发 Agents,以及与 Gemini Enterprise 的 A2A 协议集成,使搜索不再只是数据入口,而是贯穿整个 AI 决策流程的重要环节。

总体来看,搜索的形态正在发生结构性变革:词法搜索提供基础保障,向量搜索增强语义理解,混合搜索实现双轨协同,而重排序与 Agentic 工作流则进一步推动系统向智能化跃迁。对于开发者和技术管理者而言,这一整套技术组合提供了清晰可行的演进路径,让搜索从单纯的信息查找工具,升级为智能行为的触发器,并为下一代 AI 应用打下坚实基础。

完整内容查看:https://www./link/e85d66c6a4f01b134218e39c3bda435f

源码地址:点击下载


# 算法  # 可在  # 优势互补  # 则是  # 工作流  # 一是  # 在此  # 多个  # 这一  # 未来  # 关键词  # embedding  # https  # elasticsearch  # go  # 并发  # 线程  # 架构  # 2025  # gemini  # .net  # 系统升级  # 硬件加速  # 技术趋势  # 压缩技术  # 大模型  # ai  # 工具 


相关文章: 孩子寒假学习就用鸿蒙版少年得到:碰一碰分享好课,|直播|课程智能提醒  未来五年打造10个高端酒店集群,北京推动“酒店+”融合创新  九部门联合发文 打造春节消费盛宴  今晚22点少量现货开售!AMD 锐龙7 9850X3D震撼上市  苹果更新App Store提交最低SDK要求 4月28日起实施  书友过年必囤“细糠”!鸿蒙版七猫免费小说太上头  荣耀方飞谈苹果做折叠手机:不怕任何人 用产品力说话  香港科技大学与英特尔共建联合实验室,聚焦高能效智能计算  REDMI Turbo 5系列发布即开售 首销赠送五年电池保  天玑8500+2亿像素主摄 OPPO Reno16参数配置曝光  京东京造黄金手机壳首批晒单图来了:礼盒包装 金片带证书  胖神皮贵族实战指南:盾反翻滚处决,一套带走!  曝iPhone 18 Pro外观大改 或采用iPhone Air同款模组设计  公开唱反调!《恶意不息》制作人称自家定价更厚道  图灵进化与国家集成电路创新中心达成合作,共推AI算力心片自主创新与产业化  iPhone Air 2加副摄就能热卖?外媒指出定价是关键  告别“空军”!荒诞合作FPS钓鱼游戏《猎鱼达人》今日正式登陆Steam  HyperOS 4或为小米史上最稳定的版本 有望在8月发布  小米17 Pro系列妙享背屏新春AI壁纸登场 2月中旬上线  全栈国产AI Coding上线:摩尔线程+硅基流动+智谱,强强联合!  华为nova 15系列累计销量破百万台 周均销量达15万台  上半年数码产品发布时间曝光:OPPO Find N6即将登场  塔西米刀锋精髓:五段普攻与千变派生全解析  苹果iPhone 18或维持起售价不变 牺牲利润换市场份额  Google财报吓坏分析师!AI资本支出恐飙至1850亿美元 云端业务成最大救星  三年全渠道销售破百亿京东与中兴通讯签署战略合作协议  70%上市率!新三板成旅游企业IPO第一站?  AMD 锐龙7800X3D搭配单条24GB内存将成为装机神级组合  苹果AI硬件蓝图首曝光:库克宣布进军AI终端 无屏眼镜、智能胸针率先落地  马斯克首度鬆口SpaceX牌手机「并非不可能」!有望直连Starlink卫星 


相关栏目: 【 科技资讯38001 】 【 网络动态13059 】 【 技术学堂11871 】 【 网络推广75774 】 【 品牌营销52040 】 【 AI推广53525 】 【 推荐站点126806