计算机行业周观察:数据仓库与数据库、数据湖有何不同?

类别:行业 机构:招商证券股份有限公司 研究员:刘玉萍/石恺 日期:2022-09-26

随着星环科技即将上市,以及其他数据库企业陆续申报上市材料,我们对数据仓库赛道发展进行了全面解析。不同于数据库与数据湖,数据仓库核心是将孤立的业务库进行集中存储,并将业务与分析解耦,使客户在不影响业务的同时,对历史数据进分析,为企业决策提供支撑,并为BI 提供数据与技术支持。

    数据仓库因数据分析需求涌现而诞生。数据仓库不同于数据库与数据湖:数据库主要面向业务系统,数据湖则负责存储所有原始数据;数据仓库的诞生主要是由于企业对数据价值挖掘需求的涌现,传统OLTP 事务型数据库存在部门间数据难以打通的问题,产生数据孤岛,为挖掘数据价值带来阻碍。数据仓库将来自不同来源的数据聚合到集中且一致的数据存储系统中,解决传统关系型数据库无法跨库操作的问题,并结合数据挖掘、人工智能 (AI) 和机器学习等技术发掘数据价值,以支持企业经营决策;并使其作为BI 的技术底座,满足客户的数据分析和决策支持。

    数据仓库市场有望受益于BI 需求增长,海内外云巨头份额保持领先。数仓作为BI 的技术底座,有望受益于BI 需求增长,据研究机构Modor Intelligence 预计,全球数仓规模将与BI 增长保持一致,2020 年全球数仓规模约为70.6 亿美元,预计2026 年将达到133.2 亿美元,2021-2026 年复合增长率为11.17%,其中亚洲地区将是主要增长驱动力。海外市场方面,Microsoft、Amazon、Google 等老牌龙头企业的数据仓库与自身完善的生态体系结合,凭借深厚的技术底蕴与协同效应不断在数仓赛道加码;以Snowflake 为代表的新兴厂商凭借其多云支持、算储分离的创新架构带来的弹性收费模式等创新力优势,抢占传统厂商份额,与龙头企业形成竞争与合作并存的发展逻辑。国内方面,云厂商占据主要份额,根据IDC2021H1 大数据平台软件市场中,包括公有云以及私有化部署在内,华为云以18.5%的市场份额位居市场第一,其次是阿里云、亚马逊云科技、腾讯云、浪潮集团、新华三、星环科技等。云厂商依托完善的云生态实现快速发展,21H1 华为云在政企市场诸如政务大数据、运营商、金融以及能源等行业拿下众多大单,阿里云则在公有云上积累了大批互联网行业用户,也在政务等领域取得较大进展。亚马逊云科技则依托智能湖仓一体、全面丰富的数据管理及分析产品组合在中国市场获得大批公有云用户。其中国内大部分厂商努力攻关的技术方向大致相同:存算分离、智能湖仓、交互式分析、数据治理、实时处理等。

    信创加速推进。我们对9 月以来的部分信创招标进行了梳理,其中银行等金融信创陆续展开:云南省人民银行、秦皇岛银行、中国人民银行呼和浩特中心支行、乌鲁木齐银行、四川梓潼农村商业银行、四川仁寿农村商业银行等均发布信创相关采购项目。此外,根据国家税务总局公布的9 月税务系统IT 类产品采购结果来看,9 月总批采规模约2914.87 万元,金额较8 月实现大幅增长,同时采购均为国产自主品牌,涉及芯片包括:龙芯、飞腾、兆芯、海光;操作系统为麒麟和统信。

    随着国内信创生态持续完善,信创产品正从“能用”向“好用”转变,在当前IT国产化需求迫切性持续提升的背景下,信创有望保持加速推进。

    投资建议:IT 国产化迫切性持续提升,信创有望加速推进,重点推荐金山办公、海光信息(招商电子联合覆盖)、恒生电子、中控技术、用友网络、顶点软件,建议关注中国软件、诚迈科技、海量数据、卓易信息。

    风险提示:政策落地不及预期;技术发展不及预期;行业竞争加剧。