数据库行业发展报告
证券分析师:
钱劲宇 执业证书编号: S0210522050004证券研究报告
行业评级 强大于市
2022 年10月
请务必阅读报告末页的重要声明核心观点 :
•数据库应用的发展趋势: 混合事务分析处理 (HTAP)
针对OLTP 和OLAP 单独的数据应用需求 ,如果由各自专有系统处理 ,一般来说性能将比混合通用系统性能高
一到两个数量级 ,但未来整合的趋势更明显 ,客户需要可以满足混合需求的通用系统 ,HTAP 基于一体化架构
高度融合 ,在事务支持和数据时效上更有保证 ,同时减少专有系统数据迁移处理下的同步成本 。
•数据库架构的发展趋势: 分布式架构
分布式数据库继承了传统单机数据库的核心特性 ,同时还拥有分布式系统的处理能力 ,具有可水平扩展 、高
性能、高可用 、混合负载 、更安全等优点 。原生分布式架构数据库直接改变底层结构 ,因此性能不受底层数
据库制约 ,也天然契合云原生理念 。
•数据库部署的发展趋势: 云原生部署
云原生数据库结合云原生与分布式特点 ,最大限度实现资源池化 、弹性变配 、超高并发等能力 ,可实现 随时
随地的多前端访问 ,提供云服务的计算节点 ,并且能够灵活及时调动资源扩缩容 ,助力企业降本增效 ,国内
云原生数据库虽起步晚 ,但发展迅速 。
投资建议 :国内数据库相关软件企业国内处于早期快速发展阶段 ,建议关注相关拟上市或筹备上市公司 。
风险提示 :技术发展不及预期 、相关公司上市情况不及预期 。投资要点目
录
3Part 1 数据库行业介绍及发展趋势
P04-P13
Part 2 国外数据库市场主要玩家
P14-P18
Part 3 国内数据库市场及竞争格局
P19-P32•
关系型数据库 :存储格式可直观反映实体间的关系
,和常见的表格类似 。我国数据库产品数量分布仍
以关系型数据库为主 ,占比60%左右。
•
NoSQL
数据库
:分布式 、非关系型 、不保证遵循
ACID 原则。随着数据量及数据结构复杂度提升 ,大
量的NoSQL数据库出于简化结构 、避免冗余目的被
设计,支持海量数据的存储和高并发读写 。
•
NewSQL
数据库
:现代关系型 DBMS 。分布式架构
基因,兼具关系型数据库的 ACID 保证和 NoSQL的
强 可 扩 展 性 。如Google Spanner 、Amazon
Aurora 。
ACID —为了保证数据库一致性 ,事务必须满足 以下四个原则:
原子性 (Atomic) :事务中任何操作的失败会导致整个事务的失败
一致性 (Consistent) :事务结束后系统状态都是一致的
隔离性 (Isolated) :并发执行的事务彼此操作互不影响
持久性 (Durable) :事务完成后所做的改动都会被持久化
数据库 (DBS) 是一个按数据结构来存储和管理数据的
计算机软件系统 。
数据库管理系统 (DBMS) 是数据库系统 (DBS) 的核心组
成部分 ,主要完成对数据库的操作与管理功能 ,实现
数据库对象的创建 、数据库存储数据的查询 、添加、
修改与删除操作和数据库的用户管理 、权限管理等
关系型
数据库NoSQL
数据库NewSQL
数据库
资料来源:公开资料整理,华福证券研究所数据库基本概念及分类关系型
数据库按部署分类 按架构分类
本地部署
需要大量维护
成本集中式 单机共享所有计算资源( CPU、RAM 、Disk)和数据。
不支持高并发场景,扩展难、数据迁移难、运维难。
分布式分布式
中间件 +单机Shared -disk:通过数据在逻辑层的线性切割实现性能和存
储的扩展。能力受单机数据库自身能力的制约。
云部署
云部署与分布
式架构天然高
度契合 。分布式存储Shared -nothing :非对称计算节点 +共享存储 (存储和计算
未分开 ),如Netezza/Teradata/Redshift 均采用此架构 。
原生分布式
数据库Multi -cluster, Shared data :对称计算节点提供对等的读
写服务 (存储和计算彻底分离 ),如Snowflake/TiDB 均采用
此架构 。数据库 常见有 三种分类 :
•按模型可分为 :关系型 、非关系型 (包括键值型 、文档型 、图、列簇型 、时序、空间等 );
•按架构可分为 :单机、集中式 、分布式;
•按部署形态可分为 :本地部署 、云部署 。
据中国信通院 数据,截止2021 年6月,我国数据库产品共有 135款,其中关系型数据库 81个,占比60%。
资料来源:公开资料整理,华福证券研究所关系型数据库是中国主流的数据库产品NoSQL
数据库键值型数据库支持高 扩展、高并发 ,但数据无结构化,只被当做字符串或二进制数据,只能通
过键来查询值 。国外有 Redis ,国内有 TcaplusDB ,Tendis ;
宽列存储数据库适用分布式数据存储与管理,以列族式存储,高扩展,查找简单快速,但不支持
事务强一致性。国外有 HBase ,Cassandra ,国内有 GeminiDB ,iBASE ;
文档数据库适用存储面向文档或近似半结构化的数据 ,数据结构灵活 ,可以根据 value 构建
索引,缺乏统一查询语法 。国外有 MongoDB 、CouchDB ,国内目前还没有;
图形数据库适用于社交网络 ,专注构建关系图谱 ,支持复杂图形算法 ,但复杂性高只支持一
定数据规模 。国外有 Neo4j,国内有 TGDB ,Alibaba GDB,GeaGraph ;关系型数据库的不足 :
•高并发读写性能低 :关系型数据库的性能和访问承载能力 ,在面向单一数据节点的企业级应用时代无可挑
剔。但随着数据量和节点急剧提升 ,已很难 继续支撑 巨大的规模系统 ,甚至成为应用系统的瓶颈;
•不适合储存半结构和非结构类型数据 :二维表格数据模型不能有效地处理多维数据 ,不能有效处理互联网
应用中半结构化和非结构化的海量数据 ,如Web页面、电子邮件 、音频、视频等;
•容量有限 :当一个应用系统的用户量和访问量与日俱增的时候 ,传统的关系型数据库却没有办法简单地通
过添加更多的硬件和服务节点来扩展性能和负载能力 。
NoSQL 的出现并非为了取代关系型数据库 ,而是指 NotOnly SQL,提供了在 SQL之外的另一种选择 。
资料来源:公开资料整理,华福证券研究所NoSQL数据库是对关系型数据库的有益补充数据库诞生于 20C60s,前后经历了网状数据库 、层次数据库 、关系型数据库 、云数据库 、云原生数据库 。
•网状数据库 :1964 年,通用电气公司发布世界上 第一个网状数据库系统 IDS(Integrated Data Storage 集
成数据存储 ),IDS是网状数据库 ,奠定了数据库发展的基础 。
•层次数据库 :1968 年,IBM发布世界上 第一个层次数据库系统 IMS(Information Management System
信息管理系统 ),是第一个大型商用的数据库系统 。
•关系型数据库 :1978 年,第一个关系型数据库 Oracle 1.0诞生,后续几十年中关系型数据库一直占据市
场主导地位 ,直至移动互联网时代到来 。
•NoSQL数据库 :随着 WEB 2.0网站兴起 ,NoSQL 数据库应运而生 ,解决了大规模数据集合和多种数据类
型的处理挑战 。
New SQL既有NoSQL相同的可扩展性 ,又保证了事务的 ACID 特性,既基于传统关系模型保留了 SQL作为查
询语言 ,又天生具有分布式架构基因 (传统的 SQL架构设计基因中是没有分布式的 ,而New SQL生于云时代
天生就是分布式架构 )。
•NewSQL 在SQL数据库 的基础上 集成了 NoSQL 强大的可扩展性 ;
•NewSQL 在NoSQL 的发展中增强 了对SQL、OLTP 的支持 ;
关系型
数据库No SQL
数据库New SQL
数据库
资料来源:公开资料整理,华福证券研究所NewSQL 集成了 NoSQL和关系型数据库的优点联机事务处理 /数据库
OLTP(On-Line Transaction Processing )联机分析处理 /数据仓库
OLAP(On-Line Analytical Processing )
应用场景 面向交易的处理系统(业务系统) 分析驱动,面向信息的分析过程
典型应用 银行交易系统 数据仓库
特征业务在数据库联机的日常操作,通常是对记
录进行查询、修改,用户关心快速响应、数
据的安全性、完整性和并发支持的用户数等一般针对某些主题的历史数据进行分析,支
持管理决策
数据量每次交易涉及的数据量很小;
对响应时间要求非常高;
总体数据量相对较小。每次查询涉及数据量很大 (常涉及多表联结 );
响应时间与具体查询有很大关系;
总体数据量相对较大。
数据 来源于系统中交易本身产生的数据 不产生数据,数据来源于生产系统操作数据
使用人员 操作人员 管理人员
用户数量 极多 较少
交互载体 SQL为交互载体 以SQL为主要载体,也支持其他语言交互
设计重点 尽量避免冗余,为捕获数据而设计 有意引入冗余,为分析数据而设计
资料来源:公开资料整理,华福证券研究所数据库的两大应用场景: OLTP和OLAP
华福证券 - 2022.10 - 数据库行业发展报告
文档预览
中文文档
37 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共37页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2023-05-03 01:08:12上传分享