OceanBase 发布 seekdb:AI 时代,从「存数据」到「懂数据」
- 电脑攻略
- 2025-12-02
- 8
2025 年 11 月 18 日,2025 OceanBase 年度发布会上,这家已经走过 15 年历程的国产数据库厂商,交出了一份颇具分量的「成绩单」:全球客户数突破 4000 家,连续五年年均增速超 100%。
然而,在亮眼的商业数据之外,整场发布会最引人注目的焦点,却是一个看似「轻量」的新产品——seekdb。作为 OceanBase 发布的首款 AI 原生数据库,seekdb 的诞生并非孤立的技术尝鲜,而是 OceanBase 面对席卷而来的 AI 浪潮所做出的战略性回应。
正如 OceanBase CEO 杨冰在现场所言:「我们一直在做一件事情就是分布式数据库,把它工程化、产品化、规模化。而 seekdb 对我们来说不仅仅是一个新的产品,更多的是面向 AI 时代,让数据更简单、让 AI 更易用的一次回答。」
站在 15 年的新起点上,OceanBase 正试图通过 seekdb,开启从「存储数据」向「理解数据」的范式跃迁。
三行代码的野心:seekdb 是什么?
在发布会现场,OceanBase 正式发布并开源了这款名为 seekdb 的 AI 数据库。如果要用一句话概括它的核心卖点,那就是:三行代码构建 AI 应用,轻量级 AI 混合搜索数据库。
与传统 OceanBase「巨大无比」、支撑双 11 极限流量的厚重形象不同,seekdb 走的是一条极致轻量化的路线。它支持 1 核 CPU、2GB 内存起步(1C2G),能够实现秒级启动。对于开发者而言,这意味着极低的使用门槛——支持 pip install 一键安装,兼容嵌入式与客户端/服务器(C/S)双部署模式,可以轻松集成至智能 Agent 或本地应用中。杨冰强调,seekdb 并非仅仅是一个「玩具」,它是为了让 AI 开发者能够快速创新,将创新底层的成本降下来。
虽然目前市场上向量数据库火热,但 OceanBase 团队明确表示,seekdb 不仅仅是一款向量数据库。OceanBase CTO 杨传辉指出:「AI 数据库的核心不是向量,向量只是其中一部分,核心是混合搜索。」
seekdb 支持在一个查询中融合向量检索、全文搜索、标量过滤以及空间地理数据(GIS)的统一检索。它采用「粗排+精排」的多阶段检索机制,在保证低延迟的同时大幅提升精度。这种能力使得它能够处理结构化(关系数据)、半结构化(JSON)和非结构化(文本、向量)数据的复杂查询,真正满足 AI 时代对数据的多元化需求。
为了融入现有的 AI 开发者生态,seekdb 以 Apache 2.0 协议全球开源,并兼容 Hugging Face、LangChain、Dify 等 30 余种主流 AI 框架及 MCP 大模型协议。同时,OceanBase 还配套开源了 PowerRAG 智能文档解析框架与 PowerMem 分层记忆架构,其中 PowerMem 在 LOCOMO Benchmark 上表现优异,大幅降低了推理成本。
为什么不直接在 OceanBase 主版本中发布这些功能?杨冰解释道,AI 的发展速度极快,基本上每周都会有新变化,为了更快速地响应客户需求和技术迭代,OceanBase 选择将 seekdb 作为一个完全独立的分支推出。
它像是一个先行探路的「先锋军」,通过开源社区与全球开发者共建,快速验证 AI 原生的功能。而 OceanBase 的商业主版本则会随后跟进,将经过验证的能力吸纳进一体化的内核中。
AI 时代,我们需要什么样的数据库?
seekdb 的发布,折射出 OceanBase 对于 AI 时代数据库形态的深度思考。在杨冰和杨传辉看来,AI 浪潮带来的不仅仅是交互方式的改变,更是底层数据架构的一场深刻重构。
杨传辉在沟通会上抛出了一个有趣的观察:AI 正在带来一场前所未有的「技术平权」。过去,数据库是专业程序员手中的工具;而现在,任何一个不懂代码的普通人,都能通过大模型轻松构建自己的智能体。这种变化将引发一场「租户爆炸」——未来的数据库不仅要服务数以万计的企业应用,更要支撑成千上万个并发运行的智能体。这直接颠覆了传统数据库的假设,要求底层必须具备原生多租户隔离和极致的 Serverless 弹性能力。
而这些新诞生的「智能体」用户,对数据库的需求也在变化。大模型天生患有「健忘症」,它们需要数据库来充当「海马体」,管理庞大的上下文与记忆。
这意味着,数据库的负载不再局限于传统的交易(TP)或分析(AP),一种名为「混合搜索」的新核心负载正在崛起。它要求数据库在毫秒级时间内,不仅要处理精准的数据匹配,还要对向量、文本等非结构化数据进行模糊语义理解。正如杨传辉所言:「为 Agent 服务,本质上就是处理基于多模态的混合搜索。」
为了支撑这种海量的、非结构化的「记忆」,传统的数据库架构显得捉襟见肘。杨冰指出,在 AI 场景下,数据库必须拥抱「现代数据架构」。Serverless 和存算分离技术,以前在 TP/AP 场景下可能是「锦上添花」的优化,但在 AI 时代则变成了「雪中送炭」的必需品。只有极低成本地存储海量数据,并能按需弹性伸缩,才能承载起 AI 应用爆发式的数据吞吐。
尽管推出了独立的 seekdb 探索前沿,但 OceanBase 的终极愿景并未改变,依然是「一体化」。在 AI 时代,新负载的出现并不意味着旧负载的消失,交易、分析与 AI 搜索将长期共存。
因此,OceanBase 坚持「一体化 + 多云原生」的策略,在最新发布的 4.4 版本中首次实现了 TP、AP 与 AI 能力的内核级融合。这旨在帮助企业避免陷入新的「数据孤岛」,无需为了 AI 而单独维护一套复杂的异构技术栈。
结语
从 2010 年写下第一行代码,到扛住双 11 的流量洪峰,再到如今发布 seekdb 进军 AI 原生领域,OceanBase 用 15 年时间完成了一次又一次的技术跨越。
seekdb 的推出,不仅是 OceanBase 对 AI 时代技术趋势的一次敏锐捕捉,更是其「工程化」基因在这一波技术浪潮中的延续。
正如杨冰所言,AI 可能会经历泡沫期,但数据库、结构化数据以及现代数据架构的能力是不会变的。通过 seekdb 探索前沿,通过 OceanBase 主版本夯实底座,OceanBase 正试图为全球开发者提供一个通往 AI 时代的坚实入口——让数据不再仅仅是被存储,而是被理解、被智能地使用。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。