1. 信创中国首页
  2. 信创中国观察

国产数据库发展,基于全球数据库技术演绎

 

1、数据库与数据库管理系统

数据库上游主要包括计算机硬件设备、软件等产品。主要包括:小型机、微型机、存储设备、交换机、路由器和物联网感知设备等。数据库下游已经广泛应用到各个行业,政府及金融、能源、教育、交通等领域。

 
国产数据库发展,基于全球数据库技术演绎

数据库可分为两大类,分别为关系型数据库非关系型数据库

关系型数据库(Rational Database),是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据。该模式便于用户理解,关系型数据库这一系列的行和列被称为表,一组表组成了数据库。用户通过查询来检索数据库中的数据,而查询是一个用于限定数据库中某些区域的执行代码。关系模型可以简单理解为二维表格模型,而一个关系型数据库就是由二维表及其之间的关系组成的一个数据组织。

 
国产数据库发展,基于全球数据库技术演绎

NoSQL,泛指非关系型的数据库。随着互联网web2.0 网站的兴起,传统的关系数据库在处理web2.0网站,特别是超大规模和高并发的SNS 类型的web2.0 纯动态网站已经显得力不从心,出现了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL 数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。

国产数据库发展,基于全球数据库技术演绎

NoSQL 有如下优点:易扩展,NoSQL 数据库种类繁多,但是一个共同的特点都是去掉关系数据库的关系型特性。数据之间无关系,这样就非常容易扩展。无形之间也在架构的层面上带来了可扩展的能力。大数据量,高性能,NoSQL 数据库都具有非常高的读写性能,尤其在大数据量下,同样表现优秀。这得益于它的无关系性,数据库的结构简单。

国产数据库发展,基于全球数据库技术演绎

数据库管理系统(Database Management System,简称DBMS)是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。它对数据库进行统一的管理和控制,以保证数据库的安全性和完整性。

数据库管理系统是一个能够提供数据录入、修改、查询的数据操作软件,具有数据定义、数据操作、数据存储与管理、数据维护、通信等功能,且能够允许多用户使用。另外,数据库管理系统的发展与计算机技术发展密切相关。而且近年来,计算机网络逐渐成为人们生活的重要组成部分。

 
国产数据库发展,基于全球数据库技术演绎

DBMS 总是基于某种数据模型,因此可以将DBMS 看成是某种数据模型在计算机系统上的具体实现。DBMS 的工作模式如下:

  • (1)接受应用程序的数据请求和处理请求;
  • (2)将用户的数据请求(高级指令)转换成复杂的机器代码(低层指令);
  • (3)实现对数据库的操作;
  • (4)从对数据库的操作中接受查询结果;
  • (5)对查询结果进行处理(格式转换);
  • (6)将处理结果返回给用户。

根据数据模型的不同,DBMS 可以分成层次型、网状型、关系型、面向对象型等。在不同的计算机系统中,由于缺乏统一的标准,即使同种数据模型的DBMS,在用户接口、系统功能等方面也常常是不相同的。用户对数据库进行操作,是由DBMS 把操作从应用程序带到外部级、概念级,再导向内部级,进而通过操作系统(OS 操纵存储器中的数据。同时,DBMS 为应用程序在内存开辟一个DB 的系统缓冲区,用于数据的传输和格式的转换。而三级结构定义存放在数据字典中。

2、数据库的前世与今生
 

数据库起源于国外,国内在后续将其引进,因此国内外数据库的发展具有非常大的差异。国外数据库的发展历程大致可以分为三个阶段加新动态。三个阶段分别为导航型数据库,关系型数据库,非关系型数据库,而新动态则是自治数据库的出现。数据库领域的不断创新,不断优化,也使国外数据库向一个又一个新阶段发展。

 
国产数据库发展,基于全球数据库技术演绎
第一阶段:导航型数据库(Navigational Database)
 

60年代,一系列为解决数据访问复杂性的系统涌现。1964年,查尔斯·巴赫曼为通用电气开发了第一代网状数据库IDS(Integrated Data Store),并参与了后来数据库界面标准的制定。1966 年,IBM 公司为阿波罗登月计划发展了自己的层状数据库,称作“信息管理系统”(IMS)。这种通过数据记录之间的直接指引并提供引导式访问路径的数据库被称为导航型数据库,受制于当时的硬件条件,其没有涉及复杂的数据结构和转换。

第二阶段:关系型数据库(RDBMS)
 

1970 年,IBM 研究员埃德加·科德(Edgar F. Codd)提出基于集合论和谓词逻辑的关系模型,从此关系型数据库开始发展起来。1974 年,Ingres 原型诞生。同年,IBM 完成了第一版关系数据库System R,在开发结构化查询语言(SQL)后进而发布了商品化系统Database 2(简称DB2)。

1978 年,Oracle 第一版发布。80 年代,关系型数据库进入商业化年代。1980 年,关系型数据库公司(RTI,现名Actian)成立以销售Ingres。1987 年,国际标准组织(ISO)对SQL 进行了标准化,并在后来数次更新。90 年代,面向对象的数据库出现,但是没有商业运用成功案例。1991 年,微软发布Access。1994 年,基于Ingres 的Postgres95 诞生,后被命名为PostgreSQL。1995 年,MySQL 在瑞典发行,开发了第一个面向互联网的数据库应用(2010 年,甲骨文公司收购了MySQL 母公司)。

第三阶段:非关系型数据库(NoSQL)和NewSQL
 

早在1998 年,Carlo Strozzi 就创造了NoSQL 一词,当时他用来命名自己没有采用标准SQL 界面的关系型数据库。2009 年,在Johan Oskarsson 开源分布式数据库的讨论中,来自Rackspace 的Eric Evans重提NoSQL 这个概念,指代非关系型的分布式数据储存系统。NoSQL 访问速度快,适宜处理互联网时代容量大、多样性高、流动性强的数据。著名的NoSQL 包括Amazon DynamoDB,MongoDB,Apache Cassandra 和Redis。

NewSQL 是指为在线事务处理(OLTP)提供NoSQL 扩展的数据库。许多处理重要数据的企业系统(例如,财务和订单处理系统)对于关系型数据库而言太大,但是具有事务性和一致性要求又无法通过NoSQL完成,这时NewSQL 就应运而生。NewSQL 的另一个特点是使用SQL 作为其主要接口的关系数据模型(包括ACID 一致性)。

新动态:自治数据库(Self-Driving Database Management System)
 

2017 年,卡耐基·梅隆大学Peloton 项目组提出自治数据库的概念。该系统由集成的计划组件控制,可以优化当前工作负载,预测未来的工作量趋势,可以通过深度学习算法提升硬件能力。同年,Oracle Open World 大会上,甲骨文总裁拉里·埃里森公布Oracle 自治数据库云,集成人工智能和自适应的机器学习技术,实现全面自动化。现阶段,自治数据库仍处在早期。而国内数据库的发展相对落后,引入的时间较晚。直到1978 年,国内才开始接触数据库的概念。目前国内数据库的发展水平大致处于国外数据库发展的第二三阶段,但是也呈现出非常强的阶段性特征。大量数据并发,安全可靠等要求的出现推动数据库向云数据阶段迈进。

3、数据库的市场规模及成长空间
 

据Gartner统计,2018 年全球数据库软件市场规模461 亿美元,预计2021 年将达到549 亿美元,预计年复合增速9.1%。在全球数据库企业中,Oracle 稳居第一,Microsoft 位于第二位。而中国的云厂商成绩同样耀眼,阿里巴巴位列第9,华为和腾讯分别位列第11、13 位。

我国数据库软件市场规模扩张发展迅速,预计2020 年数据库软件市场达到200 亿元。2009 年我国数据库软件市场规模为35.03 亿元,2018 年我国数据库软件市场规模增长至149.91 亿元。在这期间,我国数据库软件市场始终保持平稳增长,年均复合增长率为17.86%,且增速呈现递增趋势。表明我国数据库软件市场需求开始增加,具备成长空间。根据中研产业研究院估计,到2020 年,我国数据库软件市场规模预计达到200 亿元。

国外数据库企业长期占据市场,国内数据库企业积极抢占,市场份额占比逐步提升。我国数据库软件市场大部分被国外数据库企业占据,其市场份额居高不下。2017 年,我国120.22 亿元数据库软件市场规模中,仅有17.15 亿元为中国数据库企业,其余103.07 亿元均为国外数据库企业。

 

另一方面,虽然国外企业市场份额较高,但这主要是源于其抢先进入国内市场,市场基础好。在2009 年,国内数据库企业市场份额仅为4.03%,而在2017 年,国内数据库企业市场份额已经增长到14.27%。这也表明国产数据库正在提高自身市场份额,积极抢占市场,确保在重要领域及部门实现数据库国产化。

国产数据库发展,基于全球数据库技术演绎

在数据库领域,数据库技术门槛较高,国外数据库企业Oracle、IBM 和微软三家厂商占据市场份额近六成。其中Oracle 占比最高,为40.1%,而IBM 和微软紧随其后,分别为11%和8.30%。而在我国数据库市场中,国产数据库市场份额为14.27%。其中,南大通用和武汉达梦市场份额相对较高,为18%和13%。其余国产数据库企业如山东瀚高,爱可生,人大金仓,神舟通用等在国产数据库市场份额中占比均不超过5%,可见国产数据库存在相对激烈的竞争,不同企业都在致力于提高市场份额。

我国数据库需求市场主集中在消费品,装备,原材料等领域,国产数据库机遇与挑战并存,生态体系是赢得市场的关键。

 
国产数据库发展,基于全球数据库技术演绎

4、数据库行业领导者盘点

DB-Engines根据数据库管理系统受欢迎程度对其进行排名,每月更新一次。在2020年03月最新排名中,Oracle 位列第一,MySQL 和Microsoft SQL Server 紧随其后,分别为第二和第三名。在中国市场份额较大的IBM DB2 位列第六名,SAP 的HANA 和Adaptive Server 则分别处于第十八和二十名。

国产数据库发展,基于全球数据库技术演绎

Gartner 数据库魔力象限的评选标准包括全球市场份额、产品能力、客户反馈等。2013 年Gartner 首次推出数据库魔力象限评估,对全球所有数据库管理软件进行综合评估。在2018 年,领导者象限仅有亚马逊、微软、Oracle、SAP 和IBM。

国产数据库发展,基于全球数据库技术演绎

而阿里云成为数据库领域最大黑马,以国内数据库市场份额第一的身份,首次入选并且进入远见者(Visionaries)象限,这是中国科技企业首次进入该榜单。在2019 年,阿里云再次入选魔力象限,并进入挑战者象限,而IBM 则从领导者落入远见者象限。在两年的魔力象限中,均只有一个国产数据库企业,在数据库领域,国产企业仍需继续追赶,争取进入世界前沿。

5、数据库上云为大势所趋
 

在Gartner 多年的数据库魔力象限中,虽然领导者企业变化不大,但是行业内企业整体升降变化十分频繁。Gartner认为,这种变化背后反映整个数据库行业云化趋势显著。Gartner预计,到2021年,云数据库在整个数据库市场中的占比将首次达到50%;而到2023 年,75%的数据库要跑在云平台之上。

云数据库是部署和虚拟化在与计算环境中的数据库。云数据库是在云计算的大背景在发展起来的一种新兴的共享基础架构的方法,他极大地增强了数据库的存储能力,消除了人员、硬件、软件的重复配置,让软、硬件升级变得更加容易。云数据库具有高可扩展性、高可用性,采用多租形式和支持资源的有效分发等特点。

 

国产数据库发展,基于全球数据库技术演绎

从数据模型的角度上看,云数据库并非一种全新的数据库技术,而只是以服务的方式提供数据库功能,云数据库并没有自己专属的数据模型,云数据库所采用的数据模型可以是关系型数据库所使用的关系模式,即关系型数据库服务(Rational Database Service,RDS),也可以是NoSQL 数据库所采用的非关系模型。

国产数据库发展,基于全球数据库技术演绎

行业分析师指出,在全面上云的大背景下,商业数据库因其昂贵、高运维难度、以及低扩展性和可用性受到挑战。而云数据库则因天然为云定制,具备云计算的弹性能力,兼具开源数据库的易用、开放特点,及传统数据库的管理和处理性能等优势,成为企业的最佳选择。

本文来自,本文观点不代表信创中国立场,若有侵权请联系删除。

发表评论

登录后才能评论