鳣痯往吇新闻网
一个月前,OceanBase CEO杨冰通过全员信宣布,公司将周全进入AI时代,打造“Data(数据)×AI(人工智能)”核心本领。5月17日,OceanBase详解了AI战略,并公布了与数据处置惩罚相关的本领和产品,比如AI驱动的开箱即用的RAG(检索增强生成)办事、进一步降低TP负载下存储成本的同享存储等。
依照OceanBase的计划,公司要从一体化数据库转向一体化数据底座。在现场为OceanBase站台的蚂蚁团体CTO何征宇透露表现,蚂蚁团体将支持OceanBase在金融、医疗、生存等蚂蚁AI的核心场景的突破。OceanBase始于2010年,初期办事天猫“双11”,公司自力于2020年,五年后这家以数据处置惩罚起家的公司面临的是一个AI规模化的阶段,有AI带来的天然数据增量、非结构化数据的增长等新红利,也有代价战等老问题。
图片泉源:OceanBase
一些新品
睁开盈余 79 %“传统RAG运用常用开辟形式包含组件森林开辟形式、RAG平台形式等,但存在开辟周期长、保护成本高、灰箱调试困难、性能难以优化等问题”,OceanBaseAI战略一号位的公司CTO杨传辉引见,OceanBase PowerRAG提供开箱即用的RAG运用开辟本领,买通运用开辟数据层、平台层、接口层与运用层的全流程,提供Document(文档)和 Chat(对话)两个核心API接口,帮助用户完成文档学问库、智能对话、图像比对、数据分析等多种AI运用处景的快速开辟。
OceanBase对这款产品的定义是,“OceanBase努力于成为AI时代的一体化数据底座,PowerRAG是OceanBase在运用层面探索的第一步”,杨传辉说。
当天,OceanBase还推出了一款“同享存储”产品,可完成对象存储与事务型数据库(TP)的深度集成,构建存算一体与分离的多云原生架构,能够使TP负载的存储成本最高降低500%。
将存储产品置于分歧的背景下,能更好地理解这款产品。
在云计算时代,对象存储是一种新的数据存储方法,它将数据存储为“对象”,因高可靠、低成本、可无限扩展等特性,被广泛运用于分析型数据库(AP)、企业存贮备份、归档和数据湖等场景。
但在事务型数据库(TP)的生产环境中,因数据计算对低耽误、高性能有极致寻求,广泛采用紧耦合的存算一体架构,是以依赖本地磁盘或云盘,没法支持对象存储的运用。“同享存储”产品解决的就是无同享架构在弹性和成本方面的瓶颈问题。
该产品在云上可被运用于典范TP、历史库及备份库,时序类业务、HBase兼容类业务、流水型业务零碎、OLAP业务等。
先做好数据底座
岂论是PowerRAG还是同享存储,实在都是因时而生的产品,小到产品,大到公司战略同样如此。
杨冰分享了本身看到的企业诉求,他把OceanBase的目标企业分红两类,“一类是想通过通用的AI给本身助力的企业,比如通过通用大模型。企业把大模型拿过去要结合内部的数据做后训练,否则没法用,数据这时会成为企业内部的学问库,成为企业全部上层AI运用的基础,这大概涉及到存储层,所以我们研发了向量化、融合检索,OceanBase的产品就是这么来的,因为这些需求是刚需”。
“另一类是一些SaaS(软件即办事)企业,或像阿里、蚂蚁都提出要用AI周全重构,这些企业的动作更大”,杨冰说,“它们大概要的就不只是一个学问库,是要把AI的种种本领拆分之后融入。”
在OceanBase分享的一张图中,提到了公司的未来,后期会从数据产生到训练、未来运用的全链条。“OceanBase还处在初期布局阶段,我们现在要把数据底座先做好”,杨传辉分享了OceanBase大致的发展节拍。
这也是OceanBase在一个月前公开的战略。根据IDC呈报,受生成式AI等技能驱动,2028年全球重生成数据量规模估计将达到393.9ZB,其中企业数据规模和增速明显。对付企业而言,数据仓库的容量已完成质的飞跃,结构化数据存储规模“突破PB级迈向EB级”成为新常态,这给数据存储、管理与分析带来严肃挑衅。
何征宇也在分享中指出,海量的互联网数据造诣了今天的大模型,但大模型幻觉问题的泉源也是数据问题。数据决定着大模型的本领下限,且仍旧有四个挑衅:数据的获取成本显著增加;严谨的行业数据稀缺且流动困难;多模态数据必要更强的处置惩罚本领;数据的质量评价难。
“较长的路”
关于大模型幻觉问题,杨传辉这么解释:“素质上,出现幻觉要么是缺数据,要么是缺高质量的数据,幻觉是永远不大概消失的,但能够无穷地切近亲近于0”,他站在企业的角度说,“一方面等着大模型拿私有数据改进它的算法、数据质量,如许能逐步把精确率变高;另一方面能够把本身企业的数据,大概掌握的部分行业公共数据,结合到大模型里从而获得更好的办事,现在的难点在于结合,Data×AI的融合是极为难的。”
PowerRAG解决的就是第二个问题。杨传辉也坦言,“RAG这个方向其他也有很多挑衅,还有一段对照长的路要走,整个行业都有对照长的路要走”。
事实上,“数据库行业的代价合作很激烈”,比达分析师李锦清告诉北京商报记者,“国产数据库市场中,很多企业都是基于开源技能的二次开辟,产品功能高度重叠,中小厂商通过低价策略争夺市场份额,致使毛利率不高。国际厂商市场份额逐步下落。国内云厂商通过云办事定阅形式降低成本,也是在以代价优势抢占市场。”
杨冰没有避讳代价,“性价比是数据库领域永恒的话题,但在IT软件这个领域,性价比往往意味着更高的质量,是设定一个代价但具有更好的本领。OceanBase是在迭代中提拔本领,技能的创新也确实让企业在成本上完成了下落”。
北京商报记者 魏蔚
公布于:北京市