OceanBase开发者大会详解Data×AI战略发布首个RAG产品构建强大数据底座与向量数据库未来

OceanBase开发者大会上,OceanBase公司详细解析了其“Data×AI”战略,并发布了首个RAG(检索增强生成)产品——PowerRAG。这款产品为用户提供开箱即用的RAG应用开发能力,标志着OceanBase在AI时代的一次重要探索。

第一段
升级AI战略后的OceanBase迎来了首次开发者大会。5月17日,在OceanBase第三届开发者大会上,OceanBase正式推出面向AI的应用产品PowerRAG。该产品提供开箱即用的RAG应用开发能力,是OceanBase迈向AI时代的又一重要里程碑。CTO杨传辉表示,OceanBase正全力构建“Data×AI”能力,推动一体化数据库向一体化数据底座的战略演进。此前,CEO杨冰已通过全员信宣布公司将全面进入AI时代。

第二段
蚂蚁集团CTO何征宇在会上表示,蚂蚁集团将支持OceanBase在金融、医疗、生活等核心场景中的突破,助力其实现“Data×AI”的理念与架构创新。同时,蚂蚁集团将继续支持OceanBase的开源开放策略,逐步将“Data×AI”的能力开放给行业,为AGI(通用人工智能)的发展贡献力量。

第三段
AI时代带来了新的数据挑战。IDC报告指出,受生成式AI技术驱动,预计到2028年全球新生成数据量将达到393.9ZB,其中企业数据规模和增速尤为显著。对于企业而言,结构化数据存储规模从PB级迈向EB级成为新常态,这对数据存储、管理和分析提出了严峻考验。此外,海量互联网数据虽成就了大模型,但也存在四大挑战:数据获取成本高、行业数据稀缺、多模态数据处理能力不足以及数据质量评估困难。

第四段
面对这些挑战,OceanBase正在积极探索解决方案。杨传辉认为,作为一体化分布式数据库,OceanBase已具备一定的AI时代数据处理能力,如分布式存储计算、多模融合统一处理不同结构数据以及TP/AP一体化实现混合事务和实时分析处理。然而,要真正实现大模型落地的价值,关键在于数据与模型的一体化融合,这也是OceanBase提出构建“Data×AI”能力的核心所在。

第五段
基于这一能力,OceanBase致力于从一体化数据库向一体化数据底座演进。通过一套引擎同时支持TP/AP/AI混合负载,支持向量数据库并实现SQL与AI的混合检索,OceanBase展示了其在Data与AI领域的工程与产品能力。

第六段
此次大会上,OceanBase首次发布面向AI的应用产品PowerRAG。杨传辉介绍,传统RAG应用开发模式存在周期长、维护成本高、性能优化难等问题。而PowerRAG则提供了开箱即用的RAG应用开发能力,打通数据层、平台层、接口层与应用层的全流程,帮助用户快速开发多种AI应用场景,如文档知识库、智能对话、图像比对和数据分析等。

第七段
过去十五年,OceanBase诞生于双11的海量交易场景,并在蚂蚁集团的金融场景中不断磨砺技术。未来,蚂蚁集团将继续向OceanBase开放核心AI场景,助力其进一步提升AI关键能力,实现开放开源,为行业提供更多AI创新服务。

第八段
作为原生分布式数据库,OceanBase在支持AI应用落地的核心基础设施方面表现出色。在向量性能和混合检索等领域,OceanBase持续加强SQL+AI能力。根据基准测试工具VectorDBBench的结果显示,OceanBase的向量性能已达到业内领先水平。此外,OceanBase引入BQ量化算法(HNSW+BQ),大幅降低向量场景的内存需求;针对JSON半结构化数据的压缩能力也显著降低了AI场景中的存储成本。

第九段
目前,OceanBase已在多个AI相关场景中得到应用。例如,联通软研院基于OceanBase打造AI助手,银泰商业则基于OceanBase开发零售业智能问数平台。

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...