来自IDC分析师的洞悉:企业应尽快转型搭建AI-Ready的数据架构
2025年7月26日-29日,天下东说念主工智能大会暨东说念主工智能全球解决高等别会议在上海无际举办,在“AI x Data = Future:星环赋予数据无尽可能”分论坛中,特邀嘉宾、IDC高等分析师李浩然以《从数据工程化来看AI-Ready数据架构缔造——企业走向援救、智能、及时》为主题进行共享,以其对阛阓的出奇洞悉,为咱们张开AI-Ready数据架构缔造以及相干的阛阓洞悉。
演讲摘抄:40%的企业高管认为搭建AI-Ready的数据架构是2025年重心职责,包括数据当代化底座缔造、数据解决和应用策略升级、数据智能平台开辟以及面向GenAI的全进程跟踪。本次演讲将聚焦于阛阓的需求变化和趋势演进,分析Data+AI的工夫变化和才气升级,提议潜在契机点和风险挑战,以供阛阓参考。
没罕有据就莫得AI,数据底座升级是2025年企业最关怀的问题之一

2022年OpenAI推出GPT后,在2023-2024年这两年里,许多企业把大部分IT预算参加到AI应用缔造方面,比如智能搜索、智能问答等。关联词,从2024年底运行的调研扫尾标明,企业在初步落地这些AI应用之后,下一步IT预算将会主要参加在两个方面:一是握续参加算力;二是需要通过AI来生成更准确的扫尾。若何通过AI来生成更准确的扫尾,需要回尽头来望望数据底座缔造若何去完结援救的数据料理。已往许多企业通过开源Hadoop体系或者通过多个数据烟囱来构建数据底座,这些齐莫得目的来完结援救的数据料理。把柄IDC阐较着示,33.3%的亚太企业示意将IT预算用于数据PaaS投资,包括数据库、数仓和分析。
此外,从本岁首运行,一些全球IT巨头运行收购相干的数据库以及数据相干的居品来增强他们Data+AI的才气,举例Databricks收购数据迁徙公司BladeBridge、Neon数据库、Snowflake收购Crunchy数据库、Salesforce收购Infromatica等,这些头部厂商齐但愿通过丰富的生态来更快地匡助企业客户构建Agent应用。
全球数据量较着增长,企业数据料理需求承压

数据量显耀增长:把柄IDC数据坐蓐量测算,2025年全球将产生213.56ZB数据,到2029年将增长一倍以上达到527.47ZB。其中,中国阛阓2025年将产生51.78ZB数据,到2029年增长至136.12ZB,复合年均增长率将达到26.9%。
云表数据将大幅增长:2029年约有43%的数据径直在云表生成,高于2024年的24%和2019年的13%。企业数据量越来越大、料理老本也会越来越高,会有更多企业会遴荐公用云或者特有云的方式来完结底层数据的料理,星环科技早些年推出的Data Cloud平台也与此阛阓发展趋势相一致,这种方式会让更大量据科学家把他们的重心元气心灵参加到数据挖掘和数据分析方面。
GenAI面前产生的数据量较小但增长很快:AI阛阓很火热,但把柄IDC统计,适度2025年,GenAI每年生成的数据量占新数据总量的比例不到1%,现时GenAI主要作用为重塑内容的创建和处理方式,咱们认为在畴昔这方面的增速还吵嘴常快的,瞻望到2029年会接近10%-15%。
数据部门靠近多重挑战,要乞降定位也在不断变化

面前数据团队的功能和职责愈加复杂,其最大的组织挑战即是没目的料理AI预期。许多客户在采购工夫供应商的AI后发现不成齐备达到替代东说念主的需求。我合计有两个方面,一个是AI工夫自身莫得视觉模子的才气,第二方面是数据问题。而工夫方面,料理动态数据、料理数据多源的散播环境等这些齐是企业更关怀的问题。举例数据动态料理方面,业内的主流居品齐在增强动态及时数据料理才气,咱们许多访谈的客户示意,关于指点层或者方案层料理动态数据会愈加骨子,企业更需要及时数据分析来匡助方案。

数据团队不单是是对接业务需求作念分析,当今也需要率领和结合IT部门结合来裁减数据检修或者数据识别,无论是从MLOps,照旧DeveOps旅途来看,数据工程师、数据科学家齐饰演一个特殊热切的变装。

企业应尽快转型搭建AI-Ready的数据架构

IDC本年2月份提议了AI-Ready Data Architechures,全球40%的受访者认为搭建AI-Ready的数据架构是他们本年的重心标的,与之重心相干的投资缔造标的包括数据智能、数据解决和秘密、数据当代化和数据合成,这亦然为什么全球巨头一直在丰富我方的数据底座,来完结数据援救料理的原因。IDC行将发布《中国面向生成式AI的数据基础递次厂商评估》讲明,咱们从才气和战术角度评估了中国阛阓24家代表厂商,星环科技在居品贪图和行业应用方面上风显耀,位于指点者位置。
完结GenAI着力的关节因素是数据,数据解决不错裁减AI输出风险,要是数据信息源不准确,质地不高或者容量不大,而况与盘算问题虚浮细致酌量,那么该模子在方案或业务缓助方面很可能险些毫无须处。因此,构建AI-Ready的数据架构吵嘴常必要的。此外,把柄IDC首席数据官的调研扫尾标明,AI-Ready数据架构完结了5倍的客户留存,1.6倍的利润提高,1.5倍的运营着力提高以及1.2倍的营收提高。
数据和会,企业数据料理走向智能化

现时企业在股东数据料理分析与生成式AI应用过程中,相干工夫可分为四大类:数据分析(Data Analytics)、数据平台(Data Platform)、方案自动化(Decision Automation)以及数据流料理(Data Flow Agent)。

咱们合计最热切照旧左测的Data Flow Agent和智能方案。企业可能有几百个或者上千个Agent,不可能针对每个Agent去开辟和调用数据,因此数据之间的流动是愈加的热切,通过Data Flow Agent的方式不错把跨部门不同的数据完结更快的集成。同期,关于企业客户来说并不单是需要生成一个看板,更需要业务提供方案,即通过仿真模拟或者蚁合事件模子或者更大量据工夫来匡助率领下一步的手脚,这亦然企业更关怀的。
咱们通过通盘过滤挑战来从数据层、数据料理层、数据开辟层以及业务层,分析了不同的数据挑战产生了不同的Agent供各人参考(右边蓝色的浅深代表工夫落地的难度)。同期提示各人需要提前关注AgentOps,因为畴昔会有更多Agent出现,奈何通过Agent Operation来料理各个Agent之间的关系,八成作念到随时的切换,这个是愈加热切的事情。AgentOps的不雅念里DataOps需要以数据为主体,通过通盘数据时刻线的维度来进行。数据即是数据,需要冲破之前不同部门之间进程分散,不是数据会聚部门、数据业务部门来分析数据,而是需要围绕数据构建援救的建模和多层投影。

及时数据料理需求增速超20%

及时数据料理需求增长很快,进步74%的企业依然将及时数据应用于骨子坐蓐行动,包括传统AI、GenAI和Agentic AI。这些及时数据不一定齐是秒级数据,因为完结秒级的老本照旧相对较高的,企业也不是通盘场景齐需要秒级数据,有些场景达到分钟级或者小时级也够用了,关联词比拟传统T+1,当今是T+0.5或者T+0,时效性大幅提高。从及时数据处理分析需求的行业占比来看,互联网、金融、零卖铺张、动力/制造占比较大,同期咱们预测本年通盘及时数据料理需求的增速会进步20%。
给工夫供应商和客户的建议

1. 企业必须守往事件驱动的数据架构,以握续提供高质地、多模态和场景化的数据居品;
2. 确保及时数据的可用性和可走访性;
3. 愚弄向量数据、全文检索的夹杂方式料理高维数据;
4. 必须守旧数据居品的开辟和集成,以完结AI Agent之间的无缝切换;
5. 在数据居品中镶嵌Agent功能,特别是数据质地、分析、集成;
6. 必须公开与应用格局数据和数据处理相干的元数据,以确保援救数据目次和常识料理;
7. 数据即是数据,数据之间格局领域正在覆没。
