欢迎来到加倍考研网! 北京 上海 广州 深圳 天津
微信二维码
在线客服 40004-98986
推荐适合你的在职研究生专业及院校
Gartner研究报告:腾讯云数据库增速国内第一半路上

Gartner研究报告:腾讯云数据库增速国内第一

近日,国际研究机构Gartner公司发布《The Future of the Database Management System (DBMS) Market Is Cloud》研究报告显示,腾讯云数据库市场份额增速达123%,位列国内所有数据库厂商之首,在全球范围内保持了连续两年增速前三的迅猛势头。就在不久前,另外一家国际机构最新发布的《The Forrester Wave: Database-As-A-Service, Q2 2019》中,腾讯云数据库首次入选即被评为“实力竞争者”。技术水平支撑产品研发腾讯基于强大的技术研发水平以及业务支撑,诞生众多明星产品,不仅技术层面达到业内领先水平,成本层面也得到大幅降低。腾讯云数据库产品分布去年11月,单节点读性能达到130万QPS的云原生数据库CynosDB发布,超过业内目前最高100万QPS水平。该数据库融合了传统数据库、云计算和新硬件的优势,支持无限量存储、百万级查询和秒级的故障恢复,而价格只为市面上商业数据库的1/15。云原生数据库CynosDB产品架构图另外,随着5G时代的到来,针对物联网、大数据等海量时序数据的场景,腾讯云推出时序数据库CTSDB,不仅可以降低数据存储成本也能简化日常运维工作。作为一款分布式、高性能时序数据库,CTSDB在高并发写入、冷热数据、物联网等场景等做了大量优化。作为腾讯唯一的时序数据库,CTSDB 支撑了腾讯内部20多个核心业务,包括微信彩票、财付通、云监控、云数据库、云负载等。足以证明CTSDB可以稳定支撑物联网的海量数据场景。除此之外,针对日益火爆的小游戏市场,腾讯云自研文档数据库是国内唯一提供表级监控的云厂商,也是国内唯一提供库表回档服务的云数据库,为客户提供更细粒度回档服务。目前,腾讯云自研文档数据库已经支撑数款日活峰值2000w且流水上亿的微信小游戏。用户规模增速呈加速态势过去几年,基于在云数据库领域的技术、产品、生态积累,越来越多的企业选择将核心业务系统托付给腾讯云数据库。目前,腾讯云数据库业务基本覆盖电商、金融、游戏、O2O等全行业,微众银行、小红书、猎豹、每日优鲜、听云、搜狐畅游、蘑菇街、猫眼等大中型企业都大量使用了腾讯云数据库服务。以微众银行为例,作为国内首家互联网银行,在腾讯云多项技术能力的支持下,微众银行在2015年成功打造出国内首个基于云计算技术和分布式数据库的银行分布式核心系统架构,该架构实现了多项行业创新。微众银行测试环境和开发环境部署在腾讯云提供的金融合规云机房里,可以按需使用,按量付费,生产环境的机房则采用了腾讯云的计算机服务,有效地达到控制成本的目的。数据库则采用了腾讯云金融级数据库TDSQL,光是这一项支出,相比传统数据库就节约了50%以上的成本。腾讯云数据库地域分布开放和自主可控兼备Gartner报告明确指出,当下云是管理数据的默认平台,内部部署的传统模式已成为过去式,云增长极大地改变了供应商的排名。在各大企业逐渐加速上云的背景下,云数据库作为企业IT基础设施,重要性不言而喻。腾讯云数据库在核心技术能力上,基于自主研发,兼容最主流的开源技术,让企业可以选择自己的技术路线,支持联合创新。同时,重视和提升数据价值,从数据的保护和挖掘方面,围绕数据构建全链路的数据应用及服务能力。除了数据库之外,腾讯云目前在整体云计算市场的拓展呈现加速态势,在最新的云原生、边缘计算、大数据、人工智能、物联网等领域呈现整体爆发态势。

办砸了

Gartner报告:阿里云进入全球数据库领导者象限

24日,国际行业研究机构Gartner公布2020年度全球数据库魔力象限评估结果,作为中国科技公司代表,阿里云首次挺进全球数据库第一阵营——领导者(LEADERS)象限,这也是中国数据库40年来首次进入全球顶级数据库行列。(第一财经)

说卫灵公

Gartner最新报告:阿里云进入全球数据库领导者象限

11月24日,国际知名行业研究机构 Gartner 公布 2020 年度全球数据库魔力象限评估结果,阿里云首次挺进全球数据库第一阵营——领导者(LEADERS)象限。数据库与芯片、操作系统并列为全球技术三大件,也是企业IT系统必不可少的核心技术,银行、电信、制造、互联网等主要行业都依赖于数据库技术。“阿里云拥有丰富的数据库种类覆盖度和完善的产品布局,为用户提供了多种关系型和非关系型数据库产品,还提供了混合云环境部署,同时集成了备份、数据迁移与同步等能力。”Gartner分析师在报告中指出。阿里云在数据管理及数据分析领域都拥有深厚的技术积累,比如云原生分布式数据库PolarDB既解决了传统数据库容量有限、扩缩容时间长等问题,又提供了分钟级扩容、弹性变配、超高并发等能力。今年双11,PolarDB再度刷新了数据库处理峰值纪录,高达1.4亿次/秒。数据分析方面,阿里云MaxCompute和E-MapRece提供了安全、稳定、高性能的计算平台,并融合生态,提供流批一体、机器学习、数据洞察等多种分析引擎与工具Gartner分析师评价道:阿里云在产品上具备强大的创新能力,其数据库PolarDB已全面应用于零售、电信、物流、金融等多个行业。例如,中国邮政引入分布式数据库PolarDB-X和数据仓库AnalyticDB,在订单业务峰值超过1亿件的情况下,系统平滑稳定运行;中国联通通过PolarDB-X等重构了其核心IT架构,实现对3.6亿用户的无缝“广覆盖”,成为全球最大的云上BSS系统。最新数据显示,阿里云已经位居全球云数据库市场份额第三位以及中国市场第一位。Gartner 预计,到2023年全球75%的数据库都会跑在云上。

两对半

从Gartner报告看中国数据库:差距虽在,“狼性”凸显

【IT168 评论】基础软件在软件产业中的地位就如同一座建筑的地基,其重要程度可见一斑,但中国基础软件市场却长期被国外软件巨头所垄断,国内企业和用户不仅在使用和成本方面会受到国外厂商的掣肘,在信息安全方面更是存在着很多隐患。因此,如何摆脱对国外基础软件的依赖、研发国产优秀基础软件就成为了人们关注的焦点。近日,Gartner发布了2018年的数据库系列报告,《数据库魔力象限》、《数据库核心能力》和《数据库推荐报告》。在这一系列报告中,我们看到了5家国产数据库厂商的身影,分别为阿里云、华为、巨杉数据库、腾讯云和星环科技。从0到5,国产数据库的Gartner之路经历了什么?从冲入Gartner报告中的数据库厂商中,我们可以提炼出哪些关键词?与Gartner预测的发展趋势相比,国内数据库发展现状如何?从0到3,从3到5,中国数据库的Gartner之路Gartner是全球权威的IT研究与顾问咨询公司,每年都会推出IT行业的各种报告以及众人皆知的Gartner魔力象限。Gartner数据库报告由来已久,但是直到2017年中国数据库厂商才第一次出现在报告中。Gartner 2017年的数据库系列报告中共出现了3个国产数据库,即AsparaDB、GBase和SequoiaDB,对应的厂商分别为阿里云、南大通用和巨杉数据库,而在今年的Gartner数据库系列报告中,我们发现上榜的数据库厂商已经增至5家,其中有两家是我们熟悉的阿里云和巨杉数据库,剩下的3家分别为腾讯云、华为和星环科技。为什么中国数据库厂商是在2017年这个时间节点才出现在报告中呢?众所周知,中国数据库起步较晚,且数据库的技术要求很高,Oracle、IBM、微软等老牌厂商凭借先发优势在市场份额中占据了有利位置,此情境下中国数据库想要突围必定需要一个机会点。而云大物智等新技术和新场景的适时出现恰好点燃了中国数据库的发展,巨大的市场和庞大的用户群体及需求给了国产数据库发展的土壤,Gartner看到了中国数据库技术在过去几年的快速发展,才决定在2017年首次将中国数据库厂商纳入到调查中。“从0到3,从3到5”,这只是中国数据库Gartner之路的开始。事实上,随着去“IOE”和数据安全等话题的持续发酵,中国数据库领域的初创企业和跨界选手很多,而在这其中的“能力者”也并不在少数。鉴于Gartner是刚刚将中国纳入调查范围以及调查的复杂性(包括技术先进性、产品成熟度、市场规模、营收状况、企业应用案例和全球化布局等维度),很多厂商都来不及准备参评,相信在今后的报告中我们可以看到更多中国数据库厂商。面对Gartner严格的评选标准和复杂的评选流程,巨杉数据库虽然已经是连续两次入选Gartner数据库报告了,但是CTO王涛在接受采访时也忍不住“吐苦水”,“光是准备参评Gartner报告的资料就要花费大量的时间和精力,实在是一场‘大工程’啊!”细读Gartner数据库报告,我们可以提炼出哪些关键词?从整个数据库发展历程来看,中国的数据库发展起步虽晚,但发展速度很快,并且中国有很多催生数据库技术发展的场景是国外所不具有的,例如双十一。如果我们横向去看此次入围Gartner报告的5家厂商,有很多关键字就跃然纸上。关键词一:原创据相关数据显示,在过去的几年中,数据库领域的新厂商和产品已经有数百个。而从国内的情况来看,整个数据库研发的热情也是很高涨的,不仅有专注于数据库的厂商,也有大数据、云计算厂商跨界。从入选Gartner报告的数据库产品来看,超过90%都是从零开始研发的。如果我们把目光聚焦在入选的5家国内厂商,巨杉数据库的金融级分布式数据库SequoiaDB和阿里云的新一代关系型数据库POLARDB 都是完全自研的。关键词二:开源Gartner在评选产品时并未规定DBMS必须是闭源产品,商业支持的开源 DBMS 产品也被包含在内,所以我们在报告中也看到了很多提供开源数据库商业支持的厂商,例如各大云计算厂商提供的多种数据库服务。当然,也有很多自研数据库的厂商选择将自己的产品开源,SequoiaDB就是其中之一。那么开源数据库是否只在技术方面有长足发展,盈利能力如何呢?对此,Gartner也给出了评价,“到 2020 年,以开源为基础的 DBMS 产品会占 DBMS 总收益的 20%以上,同时对主流买家的吸引力也会提升。”关键词三:客户评价客户评价是Gartner评选产品或厂商的重要维度。笔者认为这里的客户评价可以分为两个部分来讨论,一个部分是产品的丰富度是否足够客户选择,另一个是部署之后,产品和服务是否能够获得客户的高度评价。一般来说,云计算厂商提供的数据库服务都会相对比较丰富,以阿里云为例,Gartner在其优势中明确写道:“广泛的产品组合,阿里云是在MagicQuadrant 中拥有最大DBMS 服务组合的云服务提供商(CSP)。”可以说,阿里云能够入选,丰富的数据库服务绝对占据了重要功劳。而第二种客户评价,Gartner往往会根据厂商提供的客户名单做回访,回访中会向客户提问诸多详细的内容,并依此进行评分。这方面的典型厂商就是巨杉数据库,据Gartner报告中的描述,SequoiaDB在所有供应商中获得了对终端用户培训质量的最高调查分数,而且几乎所有调查得分都高于平均值,获得了整体客户满意度的第三最高分。在2017年Gartner对巨杉数据库的评价中也着重描述了客户评价的部分。关键词四:云今年Gartner数据库报告中的一个显著特点就是云计算厂商整体地位上升,Oracle等传统数据库厂商受到挑战。如果从国内角度出发,云计算厂商的数据库研发热情确实高涨,此次上榜的阿里云、腾讯云和华为其提供的数据库服务均在数十种左右。正是因为云的出现,才给了中国数据库突破现有数据库格局的机会。云数据库按需扩展、按需计费等特征使其获得了中小企业及互联网企业客户。而这种客户和行业的切入,也会反向推动数据库技术的发展。狼性 VS 差距,Gartner预测是否符合国内数据库的发展?针对数据库的未来发展,Gartner给出了四大规划假设:·到2019年,为云数据库管理系统架构所设计的存储和计算分离将作为服务模型(dbPaaS)成为主流数据库平台,也会开始出现本地服务。·到2020年,以开源为基础的DBMS产品会占DBMS总收益的 20%以上,也将会提升对主流买家的吸引力。·到2020年,关系型技术将继续用于至少70%的新应用和项目。·到2023 年75%的数据库都会在云平台上,这一变化将彻底更改DBMS供应商格局。对于这四大规划假设在国内的情况,笔者向巨杉数据库CTO王涛进行了求证:首先,巨杉数据库产品SequoiaDB本身就采用了存储和计算分离的架构,可以说存储-计算分离的架构在中国已经出现本地服务;其次,对于开源DBMS产品的收益和关系型技术的应用的预测,王涛认为如果是在国内场景下达到这个比例不需要到2020年,也许会提前完成;第三,数据库上云更多的是依照每个企业的服务客户群体和发展规划,但不可否认,上云会是数据库厂商的一个新的增长点。如果把中国市场和Gartner的市场预测来对比,中国数据库的技术和应用发展明显更具“狼性”,突破速度更快,但是由历史积淀下来的“差距”也仍然存在。·海外市场份额匮乏:这是中国数据库厂商的通病,厂商绝大多数的业务都是在中国,虽然也有在国外建设数据中心的厂商,但整体在国外的市场份额很低,且有很多在中国提供的产品和功能,并未在全球范围内提供;·自研能力仍弱:数据库技术壁垒高不可否认,但国内数据库厂商自研技术能力还需修炼也是事实。Gartner评价腾讯云主要提供的其他供应商的产品,而不是它自有的;·功能和成本支持:国内云计算厂商在数据库服务种类丰富性的支持方面与国外巨头仍有差距,且在成本方面也没有那么符合期待。在Gartner调查中也有受访者提出了高成本和不均衡的支撑。总体来看,国产数据库虽然在市场份额方面还难以与国际大厂抗衡,但是其发展速度和在部分场景下的技术实力已经处于领先水平,此次入选Gartner数据库报告就是一个很好的例证。附:Gartner报告对国内数据库厂商评价阿里云是一家全球云计算公司,总部位于中国杭州,其国际业务位于新加坡。 它提供了各 种各样的服务,例如用于 MySQL 的 RDS(关系数据库服务)的 ApsaraDB(基于 AlibabaCloud AliSQL),SQL Server 和 PostgreSQL; 云数据库 Redis 版;POLARDB; MySQL 和 PostgreSQL 的 HybridDB;ElasticMapReceforHadoop。 此外,ApsaraStack 还提供本地私有云设施。华为总部位于中国深圳,公司价值数十亿美元,为MySQL、Microsoft SQL Server、PostgreSQL、Memcached、Redis和文档数据库服务(DDS)提供华为云数据库服务。 DDS虽然不符合入选Magic Quadrant的跨地分布要求,但华为在中国市场扩张迅速且已经开始开拓其他地区的市场。在接受调查的客户中,DDS很少与除AWS和Oracle以外的非亚洲供应商产品展开竞争。DDS在用户调查中获得了高分数,定价方法、集成和部署、服务和支持以及培训方面均得分很高。除此之外,在自动数据分配、高速数据获取和事务处理方面也获得了最高分。巨杉数据库 SequoiaDB 总部位于中国广州,提供开源、高可用性、分布式多模的 DBMS(基于文档[JSON]存储模型),旨在能够进行规模分布和弹性扩展。 SequoiaDB支持用于内容管理用例的块存储引擎,支持完整的SQL引擎,完美兼容 MySQL 和 PostgreSQL,支持 JSONAPI。SequoiaDB在北美成立了实验室,并开始了全球市场的扩张。在所有入选厂商中,SequoiaDB许多项得分都高于平均值,并获得了企业客户评价的第三高分,客户特别赞赏其分布式和数据管理的能力。腾讯云总部位于中国深圳,提供腾讯云数据库服务,包括部署 MySQL,MariaDB, SQLServer,PostgreSQL,Redis,Memcached,MongoDB,CTSDB,TiDB 和 Greenplum。此外,它计划提供 Oracle、SQLServer 和 Db2 迁移工具和兼容。由于腾讯提供了其他供应商的产品,而不是它自有的,所以腾讯没包含在今年的 MagicQuadrant 中。尽管腾讯云在北美、南美、欧洲、日本和澳大利亚设有数据中心,但其绝大部分业务都在中国。接受调查的客户对腾讯云的整体满意度、价值、产品能力、最终用户培训(有些评论称数据迁移服务的文档需要改进),以及编程的简易性的评分都低于平均值。在定价方法,集成和部署的得分达到了平均分数。受访者对其定价、服务和支持(通常被认为是“免费”)、 专业服务、安全性能和高速事务处理给出了积极评价。星环科技总部位于中国上海,它提供 Hyperbase,一种多模可操作的 DBMS,支 持 JSON 或 XML 中的文档数据类型,以及空间数据类型和对象存储。构建在 Apache HBase 之上的 Hyperbase 还包括一个能部分兼容 OraclePL/SQL 的SQL引擎。 Hyperbase是Transwarp数据中心的一部分,它包括多种数据管理技术,如流媒体、搜索和分析型 DBMS。客户对 Transwarp 的整体评价非常高,尤其是易于操作和编程以及专业服务方面。

审时

Gartner发布最新云数据库报告,华为云入选魔力象限

日前,国际研究机构Gartner发布2020年全球云数据库魔力象限报告《Magic Quadrant for Cloud Database Management Systems》,华为云凭借GaussDB系列数据库产品入选魔力象限。报告中,Gartner从几个维度重点提到华为云GaussDB数据库的主要优势:金融、电信、政企市场优势:报告提到,“华为云数据库业务在亚太地区,尤其是中国市场实现规模化部署,其中超过一半的客户来自公共管理、电信、金融保险等行业。”华为云GaussDB基于华为在金融、电信、政企市场深耕10年+的数据库内核研发优化能力及对客户高可靠高性能诉求的理解,结合云的技术打造,满足各种严酷的企业级场景需求。云产品组合和生态的广度:报告指出,“华为云专注于提供全面的混合堆栈,构建了全面、稳健的产品组合,能够满足跨云和本地环境的全方位数据管理用例,其许多产品与云基础架构紧密集成,以提供增强的性能和可靠性。”依托华为云公有云服务及华为云Stack,2020年华为云陆续发布了一系列数据库新品,完成了GaussDB系列数据库产品布局,为金融、政企客户打造传统商业数据库一站式上云解决方案。行业实力:报告评价称,“华为在全球电信和网络行业有很强的影响力,很多为管理华为全球行业业务而构建的数据管理能力,面向政企行业普遍可用。”华为在数据库产品上战略投入超过13年,支撑华为7大产品线近40个产品,为电信运营商提供的在全球部署的3万套设备所需网管与计费软件均使用华为数据库。目前,华为囊括全球1000+数据库专业人才,在华为全球7大研究所从事数据库基础研究。华为云GaussDB系列数据库产品广泛应用于金融、泛政府、电信、能源、交通、医疗、物流、电商等行业,能满足客户对智能时代高并发事务实时处理、海量数据高效分析等全方位需求,持续加速客户数字化转型进程。

孔雀羽

2018年中国大数据BI行业分析报告

前言近年来,随着人们的数据意识和数据素养不断提升,商业智能和数据分析领域迎来了快速发展期,据Gartner商业智能报告统计,到2020年全球的商业智能市场容量预计将达到228亿美元。同时,大数据、人工智能、机器学习、深度学习等技术的快速发展,也促进了商业智能和数据分析产品的新一轮进化。Gartner分析师认为,到2020年,自然语言生成和人工智能将是90%的新BI平台的标准特征,50%的分析查询将使用搜索、自然语言处理,或语音生成,或将自动生成。但我们必须认识到,我国商业智能的市场特征、企业需求、关注点、发展阶段均与国外有所不同,以Gartner为代表的分析机构并不能准确描述我国商业智能行业的实际状况。针对这一问题,帆软数据应用研究院调研了规模不一的216家企事业单位,了解到他们的大数据BI应用状态、需求情况、对大数据BI产品功能的期待,同时基于帆软数据应用研究院对行业的长期观察和思考,形成了该篇报告。主要预测:2018年,中国大数据 BI 产品将主要在自助分析的可操作性和功能丰富度、平台的安全性、数据管理能力、分析的共享能力、数据挖掘能力、大数据处理能力六大功能模块进行提升。一、2018年中国商业智能行业发展分析(一) 行业总体形势向好在当前经济环境下,企业盈利的压力和难度不断增加,越来越多的企业,尤其是一、二线稍具业务规模的企业,其高层都希望通过精细化运营提升市场竞争力,降低企业的运营成本。这些企业绝大多数都已经在2008年~2015年间上线了各种业务系统,存储了大量管理和运营数据,具备应用大数据BI进行数据分析和数据化管理的各种条件,这些需求将在2018年~2022年继续爆发。值得注意的是,艾瑞咨询在《2017年中国商业智能行业研究报告》中指出,我国已经进入商业智能领域第一方阵,成为发展最快的国家之一,但和美国还有比较大的差距。所以未来中国大数据BI行业总体将呈现加速度增长,市场容量将不断扩大。(二) 大数据BI厂商马太效应显现马太效应是指强者越强,弱者越弱的现象,国内BI行业的马太效应已经显现。据帆软品牌部调研数据显示,处于行业第一梯队的帆软、Tableau、微软PowerBI的品牌知名度和市场份额与其他厂商进一步拉大。帆软2017年全年营收2.77亿,远超其他国内厂商之和。同时帆软销售部反映,2017年度销售跟单中遇到的竞品种类和数量均较2016年有相当大幅度的下降。BI行业出现马太效应实属必然,综合实力强大的厂商更能投入资源做好产品、服务,解决更多用户的需求和问题。可以预见,2018年中国BI行业马太效应将进一步增强,逐步淘汰掉实力弱、规模小、产品差的企业。(三) 新型自助式BI与传统型BI平分秋色得益于敏捷、自助的特征,从2013年起新型自助式BI迎来了高速发展期,这一时期也是传统型BI的衰退期。2017年,传统型BI与新型自助式BI在国内市场中平分秋色。受访企业中,约50.2%的企业仍然在使用传统型BI,其中最典型的需求是企业常规日报、月报等汇总分析报告。约49.8%的企业应用新型自助式BI,通过报表平台+自助式BI+大数据底层平台的解决方案,来解决企业综合的数据展示和分析需求,形成经营和战略决策。在调研中我们注意到,约有18%的企业引进了新型自助式BI,部分或全部替代了传统BI。虽然传统型BI尤其自身优势和应用场景,但随着新型自助式BI的不断发展,传统型BI必将逐渐退出历史舞台,从国际传统BI巨头积极调整产品结构可见一斑。二、2017年中国商业智能用户状况分析根据企业的IT人员和业务人员在数据分析中的工作量和投入程度占比,我们将BI用户(企业)划分为5大类型,即BI应用金字塔模型,以更好的统计、分析企业的BI应用状况。(一) BI应用金字塔模型1. IT完全主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的所有相关工作,完成95%以上的BI分析页面(注:主要是指用于生产、经营、管理会议所需要的数据分析页面,下同)的开发。业务人员仅负责前端数据查看,完成查看报表时相关联动钻取操作。调研中我们发现,处于“IT完全主导型”这一等级的企业,约有93.2%都在使用传统型BI工具,企业的业务人员基本没有能力,也没有需求去自主完成数据分析的工作。这些企业的业务变革并不剧烈,企业管理层认为当前的日常数据报告能够满足企业管理和决策的需要,相对缺少变革的动力。2. IT强主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的所有相关工作,完成80%~95%数量的BI分析页面。业务人员完成低于20%数量的BI分析页面。从调研数据来看,这类企业中,67.5%的企业认为当前业务人员不具备数据分析的能力。而企业需要快速完成部分数据分析工作,所以选择让IT人员更多承担工作。这类企业中普遍认为,商业智能产品本身并非能够快速上手,且业务人员仍需要统计学基础,阻碍数据分析工作从IT人员向业务人员的转移。3. 业务强主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的所有相关工作,完成前期示例不超过20%数量的BI分析页面。业务人员完成超过80%数量的BI分析页面。从调研数据来看,这类企业中,超过80.2%是曾经推行传统BI的企业,并且部分业务人员是有较高学历和能力的,能够学习和掌握商业智能工具和数据分析技能,并愿意在工作中积极使用;从帆软数据应用研究院的实地走访的部分企业来看,这些企业普遍行业排名靠前,公司从高层就重视数据分析工作。4. 业务完全主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的部分相关工作。业务人员完成95%以上数量的BI分析页面和相当部分BI工具层面的数据模型处理。相比于第三类使用人群(业务强主导型),这类用户的一大特点是业务变革十分迅速,从事业务工作的人员学历普遍较高,业务经营和发展需要企业快速做出决策。而基于数据分析得出的业务判断相比个人历史经验准确度更高,是这类企业基本共识。比如在新兴的互联网企业,或者新零售领域,这个特点尤为突出。5. 智能自助型其典型特征为,IT人员只做底层数据仓库、数据连接、数据字典相关工作。业务人员处理所有BI工具层面的数据处理,以及所有BI分析页面。IT人员搭建数据中心,业务人员完全自主处理和分析数据,这类企业有着明显的资源密集型的特点,业务人员更多的是偏向运营相关的工作。当然,因为此类受访企业占比较少,原因分析的可信度还有待进一步调研来核实。(二) BI用户状况分布基于BI应用金字塔模型,2017年企业分布如下;从调研数据中,我们可以得出两大结论。1、IT人员主导企业数据分析的模式仍占据主流,也就是IT驱动仍是2017年企业商业智能平台应用现状。从数据调研的受访企业来看,有高达60.5%的企业的数据分析工作仍是第二类型(IT强主导型),甚至有21.5%的企业的数据分析工作处在第一类型(IT完全主导型),这显然和业务人员自助数据分析的目标距离遥远。2、新型自助BI正在成为商业智能市场的主流。17.5%的企业是在2017年上线了新型自助BI,实现了让少部分业务人员自助完成BI数据分析的目标。三、2018年商业智能用户需求分析(一) 企业多级部门数据分层次IT权限和平台管控,占受访企业97.6%需求描述:BI工具支持企业的多级部门的数据/分析页面权限管控,使得不同层级的部门机构只能看到本部门机构和辖属部门机构的数据/分析页面。需求产生的原因:有的信息中心为释放压力,放权给业务部门使用数据,一旦口子打开,数据缺口就会像洪水一样泛滥,就又会走向另外一个极端,导致放权下的数据管理混乱,数据口径不统一,部门之间的数据壁垒等等问题就会出现,同时这将给企业带来极大的数据安全隐患。满足该需求对企业的价值和意义:在满足业务部门BI数据自助分析的同时,兼顾企业的数据权限管控,形成企业以IT部门集中管理下的良性数据分析风貌,杜绝企业数据安全隐患。(二) 业务人员可通过BI工具进行自助数据分析,占受访企业94.5%。需求描述:业务人员可以在浏览器前端,对自己权限范围内的数据进行多维拖拽探索和自助分析,发掘隐含在数据中的业务价值。需求产生的原因:企业的传统信息化建设中,IT信息中心对公司数据进行高度集中的管控,来自企业各职能部门的数据处理以及报表就会全部由IT人员来输出,一旦业务部门需求集中扎堆,就会造成响应不足,业务部门怨声载道。信息中心自身成员熬夜加班做报表,成就感却很低。满足该需求对企业的价值和意义:通过高效灵活的BI工具,业务人员对自己权限范围内感兴趣数据进行多维拖拽探索和自助分析,以工具简单易上手的低学习成本,让真正对分析业务价值最熟悉的业务人员实现自助数据分析探索,最大化业务数据的分析维度和分析效率,灵活发掘数据中可能潜在的业务价值,同时也解放了IT人员的劳动力,降低企业人力成本。(三) 可快速搭建型自助BI业务数据模型,占受访企业87.5%。需求描述:数据库表中的数据需要基于业务分析主题进行分类管理,相关数据表之间支持手动/自动构建关联模型,同时建立的关联模型支持灵活应用,无需反复编辑修改或创建新的模型,一次建立即可灵活满足多重业务场景进行数据分析使用。需求产生的原因:传统BI工具创建的底层数据关联相互独立,无法重复利用,一旦遇到新的业务数据计算分析场景,数据关联就需要修改或重新创建,极为麻烦,非常不利于IT人员维护。满足该需求对企业的价值和意义:通过BI工具快速构建的新型自助式BI业务数据模型,较传统BI工具针对不同业务分析场景需要多次、重复建模的应用痛点,极大地提高了BI工具的企业中业务数据分析应用的效率,解放了以往IT人员对数据维护的压力。(四) OLAP多维分析:上卷、下钻、旋转、切片、联动、跳转等,占受访企业84.5%需求描述:BI工具支持强大的页面OLAP多维分析功能,包括分析视角的上卷、下钻,维度的旋转切换,指标的切换,分析数据的切片过滤,组件之间的联动过滤、页面超级链接跳转等。需求产生的原因:随着业务发展的复杂化,单一角度的数据分析往往难以再发掘出更多有价值的潜在业务信息,取而代之的是需要BI工具能够满足强大的页面OLAP多维分析功能。满足该需求对企业的价值和意义:通过BI工具强大的OLAP多维分析功能,以实现多角度、多关联数据之间的数据无限层次探索分析,发掘出数据中潜在的业务价值。(五) 大数据处理性能处理能力达到十亿数据秒级响应,占受访企业63.6%需求描述:BI工具可支撑处理亿级以上大数据分析计算的秒级响应,提供多维加速引擎对传统关系型数据仓库(SQLServer、Oracle、Mysql等)进行数据提速处理,同时也支持实时对接企业大数据平台(Vertical、Kylin、Greenplum等)进行数据分析计算。需求产生的原因:一方面,传统关系型数据库在面对上亿级别以上数据量时,容易出现性能瓶颈,长时间的查询等待往往会导致业务数据分析效率太低。另一方面,当今信息化水平飞速发展,越来越多的企业已经有了自己的高性能大数据平台,对于这部分企业来说,拥有一款能够直接对接大数据平台进行数据分析的工具尤为总要。满足该需求对企业的价值和意义:BI工具提供的强大数据计算处理引擎,能够降低企业数据查询等待时间成本,提高业务数据分析效率。同时,通过直接对接企业大数据平台,还可满足企业实时数据分析的需求。(六) 业务人员可完成工具层面的零代码数据加工处理工作,占受访企业57.5%。需求描述:BI工具可通过快速易上手的交互方式,让业务人员也能完成工具层面的零代码数据加工处理工作,例如例如表合并、分组统计、结构数据分层、过滤、增加列、同比环比、累计值、所有值、公式运算等数据清洗和数据处理方法,实现对数据的无限层次多维透视分析统计。需求产生的原因:当业务需求相对偏复杂时,简单的维度和指标统计往往无法直接计算出业务所需要的计算结果,以往的处理方式往往可能是业务部门提需求给IT,然后IT经过SQL或者代码对底层数据表加工处理,然后最终导出一张excel数据表给业务部门,期间的反复沟通和等待时间往往降低了企业的业务数据分析应用效率。满足该需求对企业的价值和意义:通过BI工具,使得业务人员也能快速实现对数据的无限层次多维透视分和析加工统计,降低了传统模式下的沟通成本和等待时间,提高了企业业务数据分析的应用效率。(七) 移动端数据分析查看支持,占受访企业44.9%需求描述:BI工具支持移动端数据分析多维分析查看功能(兼容PC端的上卷、下钻、旋转、切片、联动、跳转等),对于BI工具的应用app支持便捷的扫码登陆、离线查看、批注、分享等功能,同时满足某些社区平台如微信、钉钉的企业公众号集成。需求产生的原因:在当今这个移动设备便捷时代,仅仅PC端的数据分析已经不能满足某些特定时间和场所的业务分析需求了,而BI对移动端的支持已经成了必然要满足的功能点。满足该需求对企业的价值和意义:通过移动端的BI分析查看,使得数据分析不仅仅局限于PC端,较大地增强了数据分析的便捷性。同时微信和钉钉的集成接入,让业务通过社区平台也能直接查看想要的数据分析页面,更是为移动端数据分析锦上添花。四、中国大数据BI产品功能预测结合用户需求调研,和我国BI厂商的产品计划研究,2018年如下六个大的功能模块将会得到增强。(一) 提升自助分析的可操作性和功能丰富度为满足业务人员可通过BI工具进行自助数据分析的需求,中国大数据BI产品需要改善自助分析的功能和可操作性,包括图表的丰富性。前端布局自定义搭配,让业务人员随心所欲布置。比如仪表板自由布局,可快速拖拽生成所需要分析的页面;在全面支持常见的柱状图、条形图等图形基础上,增加支持中国(世界)地图、GIS地图、桑基图等大数据图表;为了适应更加多样的用户,大数据BI平台需要支持强大的OLAP多维分析功能,包括分析视角的上卷、下钻,维度的旋转切换,指标的切换,分析数据的切片过滤,组件之间的联动过滤、页面超级链接跳转等。业务人员在OLAP多维分析的基础上,能够在数据分析查看时,再次对所有维度进行二次的维度指标加工,并无限层次多维透视分析统计,全面开放业务人员对数据的处理和分析操作,以满足当前中国用户多个视角、多个层级的分析需求,把传统业务分析的智慧充分沉淀到数据分析系统中来。为了给不同用户提供个性化的视觉体验,大数据BI平台支持表格动态数值预警功能和图形设置动态警戒线,支持图表样式风格自由拖拽调整。同时,也需要大数据BI平台智能自动设置预警值和样式风格等。(二) 提升平台的数据挖掘能力为满足企业业务人员自助数据分析和自动挖掘的需求,中国大数据BI产品需要在已有的数据可视化和数据分析的功能基础上,增强数据自动挖掘能力,使业务人员在能够掌握挖掘基本概念的基础上,深入挖掘分析业务数据,为业务运营提供数据结论支持。大数据BI平台需要支持嵌入式高级分析功能,用户能够轻松使用平台内置的高级分析功能,也可以通过导入和集成外部开发的高级分析模型。比如平台内含数据挖掘常见算法(如线性预测、时序预测、聚类、分类等),或者提供外接其他数据挖掘平台和工具的可视化接口(如R语言或者Python语言),甚至内含适合特定业务场景的挖掘模型 。(三) 提升平台大数据处理能力为满足企业对大数据BI平台实时响应的需求,中国大数据BI产品需要将当前大数据处理能力提升一个量级,达到10亿数据量秒级响应水平,同时支持丰富多样的数据源。大数据BI平台需要支持丰富的数据源,如企业主流的关系型数据库、大数据平台、NOSQL数据库以及多维数据库,需要支持实时对接数据平台和分布式引擎拓展,同时支持跨数据源关联,同时支持对较大级别数据量进行数据抽取和索引建模,提高数据分析效率。(四) 提升平台的数据管理能力为了满足中国企业业务人员用户对数据处理的需求,中国大数据BI平台需要提升自身的元数据管理能力、数据的ETL处理能力、数据存储能力。提高元数据管理能力,使得用户能够集中管理元数据,包括对元数据进行检索、提取、处理、存储、分享复用和对外发布。中国企业的业务人员将需要在数据分析的过程中,直接操作经过IT人员标准化处理的元数据。近几年来,中国数据分析人才迅速增加,企业中也成长出一批有一定数据分析能力的业务人才,这些中国企业业务人才更多的是需要对数据进行ETL处理和存储,这就需要平台功支持用于查询、提取、转换和加载的功能,具有索引、管理、调度数据的能力。(五) 提升平台分析的共享能力随着ERP、OA、MES、HIS等常见业务系统的完善,企业少则数十套IT系统,多则上千套系统。新型自助BI需要能够与多个系统同时融合,全面分析企业的业务数据。这就需要中国大数据BI产品需要加强产品与不同软件系统的集成融合能力,这是中国企业面临的共同难题。大数据BI平台需要支持嵌入式部署,如主流的应用服务器,支持跨平台的权限集成和页面集成。大数据BI平台不同用户创建的分析页面,可以方便地分享给其他成员。同时,在企业的分析用户设计仪表板时,可以复用仪表板中的图表、维度、指标等,支持用户分享指定页面进行给其他部门成员,便于互动沟通交流。为满足企业人员实时办公、互通信息的需要。大数据BI平台还需要支持移动端上共享和查看分析结果,支持在移动端对分析结果进行数据层级钻取穿透、联动等。(六) 提升平台的安全性为了满足企业多级部门同时使用、不同权限的功能,中国大数据BI产品除了要提供灵活丰富的用户管理功能、权限控制功能,还需要内置强大的用户行为监控与分析功能,确保企业的数据安全和信息保密。大数据BI平台将支持持批量导入用户,支持同步企业统一权限管理数据库中的用户,以企业IT系统统一的用户管理方式进行用户管理。支持用户以企业IT系统统一的用户权限认证方式进行权限管理。同时,需要支持短信平台功能,并可用于用户账号身份验证等,多种用户和权限管理方式,来满足广大中国企业的不同的安全级别要求和安全管理策略。随着大数据BI在中国的发展,中国企业自身的大数据BI平台已有众多员工账号。这就对大数据BI平台提出新的挑战,除了要拦截非法用户,还要对大数据BI平台有效用户进行有效监控。2018年,大数据BI平台需要支持监控用户的操作行为,支持监控页面被访问的频次、访问来源,甚至是支持监控访问到的数据范围。为了保证大数据 BI平台系统持续支持企业经营管理,需要大数据BI平台支持系统数据迁移到企业数据库,支持对系统进行备份与还原,备份可以手动或设置周期定时备份。同时,支持云端服务器部署和本地服务器部署,支持多机热备,达到企业的灾备要求。此外,为了有效避免BI平台出现严重异常,还需要支持监控自身的运行性能,遇到系统性能风险,提前给出系统预警信号。

盛衰之杀

Gartner最新报告:腾讯云数据库增速国内第一

近日,国际权威研究机构Gartner公司发布《The Future of the Database Management System (DBMS) Market Is Cloud》研究报告显示,腾讯云数据库市场份额增速达123%,位列国内所有数据库厂商之首,在全球范围内保持了连续两年增速前三的迅猛势头。就在不久前,另外一家国际权威机构最新发布的《The Forrester Wave: Database-As-A-Service, Q2 2019》中,腾讯云数据库首次入选即被评为“实力竞争者”。明星产品层出不穷腾讯基于强大的技术研发水平以及业务支撑,诞生众多明星产品,不仅技术层面达到业内领先水平,成本层面也得到大幅降低。腾讯云数据库产品分布去年11月,单节点读性能达到130万QPS的云原生数据库CynosDB横空出世。超过业内目前最高100万QPS水平,全面领先国内其他同类产品。该数据库融合了传统数据库、云计算和新硬件的优势,支持无限量存储、百万级查询和秒级的故障恢复,而价格只为市面上商业数据库的1/15。云原生数据库CynosDB产品架构图另外,随着5G时代的到来,针对物联网、大数据等海量时序数据的场景,腾讯云推出时序数据库CTSDB,不仅可以降低数据存储成本也能简化日常运维工作。作为一款分布式、高性能时序数据库,CTSDB在高并发写入、冷热数据、物联网等场景等做了大量优化。作为腾讯唯一的时序数据库,CTSDB 支撑了腾讯内部20多个核心业务,包括微信彩票、财付通、云监控、云数据库、云负载等。足以证明CTSDB可以稳定支撑物联网的海量数据场景。除此之外,针对日益火爆的小游戏市场,腾讯云自研文档数据库是国内唯一提供表级监控的云厂商,也是国内唯一提供库表回档服务的云数据库,为客户提供更细粒度回档服务。目前,腾讯云自研文档数据库已经支撑数款日活峰值2000w且流水上亿的微信小游戏。用户规模增速呈加速态势过去几年,基于在云数据库领域的技术、产品、生态积累,越来越多的企业选择将核心业务系统托付给腾讯云数据库。目前,腾讯云数据库业务基本覆盖电商、金融、游戏、O2O等全行业,微众银行、小红书、猎豹、每日优鲜、听云、搜狐畅游、蘑菇街、猫眼等知名大中型企业都大量使用了腾讯云数据库服务。腾讯云数据库产品用户就拿微众银行来说,作为国内首家互联网银行,在腾讯云多项技术能力的支持下,微众银行在2015年成功打造出国内首个基于云计算技术和分布式数据库的银行分布式核心系统架构,该架构实现了多项行业创新。微众银行测试环境和开发环境部署在腾讯云提供的金融合规云机房里,可以按需使用,按量付费,生产环境的机房则采用了腾讯云的计算机服务,有效地达到控制成本的目的。数据库则采用了腾讯云金融级数据库TDSQL,光是这一项支出,相比传统数据库就节约了50%以上的成本。腾讯云数据库地域分布开放和自主可控兼备Gartner报告明确指出,当下云是管理数据的默认平台,内部部署的传统模式已成为过去式,云增长极大地改变了供应商的排名。在各大企业逐渐加速上云的背景下,云数据库作为企业IT基础设施,重要性不言而喻。腾讯云数据库在核心技术能力上,基于自主研发,兼容最主流的开源技术,让企业可以选择自己的技术路线,支持联合创新。同时,重视和提升数据价值,从数据的保护和挖掘方面,围绕数据构建全链路的数据应用及服务能力。除了数据库之外,腾讯云目前在整体云计算市场的拓展呈现加速态势,在最新的云原生、边缘计算、大数据、人工智能、物联网等领域呈现整体爆发态势。

浪荡儿

国产数据库专题报告:黄金赛道龙头,十倍成长空间

如需报告请登录【未来智库】。1、数据库:是基础软件核心之一,是“IT 重构”必争之地1.1 数据库与数据库管理系统 数据库是基础软件核心之一,是 IT 产业基础软件三驾马车之一,是“IT 重构”必争之地。它产生于二十世纪六十年代,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。数据库上游主要包括计算机硬件设备、软件等产品。主要包括:小型机、微型机、存储设备、交换机、路由器和物联网感知设备等。数据库下游已经广泛应用到各个行业,政府及金融、能源、教育、交通等领域。数据库可分为两大类,分别为关系型数据库和非关系型数据库。 关系型数据库(Rational Database),是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据。该模式便于用户理解,关系型数据库这一系列的行和列被称为表,一组表组成了数据库。用户通过查询来检索数据库中的数据,而查询是一个用于限定数据库中某些区域的执行代码。关系模型可以简单理解为二维表格模型,而一个关系型数据库就是由二维表及其之间的关系组成的一个数据组织。NoSQL,泛指非关系型的数据库。随着互联网 web2.0 网站的兴起,传统的关系数据库在处理 web2.0网站,特别是超大规模和高并发的 SNS 类型的 web2.0 纯动态网站已经显得力不从心,出现了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL 数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。NoSQL 有如下优点:易扩展,NoSQL 数据库种类繁多,但是一个共同的特点都是去掉关系数据库的关系型特性。数据之间无关系,这样就非常容易扩展。无形之间也在架构的层面上带来了可扩展的能力。大数据量,高性能,NoSQL 数据库都具有非常高的读写性能,尤其在大数据量下,同样表现优秀。这得益于它的无关系性,数据库的结构简单。数据库管理系统(Database Management System,简称 DBMS)是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。它对数据库进行统一的管理和控制,以保证数据库的安全性和完整性。数据库管理系统是一个能够提供数据录入、修改、查询的数据操作软件,具有数据定义、数据操作、数据存储与管理、数据维护、通信等功能,且能够允许多用户使用。另外,数据库管理系统的发展与计算机技术发展密切相关。而且近年来,计算机网络逐渐成为人们生活的重要组成部分。1.2 数据库的前世与今生(略)1.3 数据库的市场规模及成长空间据 Gartner 统计,2018 年全球数据库软件市场规模 461 亿美元,预计 2021 年将达到 549 亿美元,预计年复合增速 9.1%。在全球数据库企业中,Oracle 稳居第一,Microsoft 位于第二位。而中国的云厂商成绩同样耀眼,阿里巴巴位列第 9,华为和腾讯分别位列第 11、13 位。我国数据库软件市场规模扩张发展迅速,预计 2020 年数据库软件市场达到 200 亿元。2009 年我国数据库软件市场规模为 35.03 亿元,2018 年我国数据库软件市场规模增长至 149.91 亿元。在这期间,我国数据库软件市场始终保持平稳增长,年均复合增长率为 17.86%,且增速呈现递增趋势。表明我国数据库软件市场需求开始增加,具备成长空间。根据中研产业研究院估计,到 2020 年,我国数据库软件市场规模预计达到 200 亿元。国外数据库企业长期占据市场,国内数据库企业积极抢占,市场份额占比逐步提升。我国数据库软件市场大部分被国外数据库企业占据,其市场份额居高不下。2017 年,我国 120.22 亿元数据库软件市场规模中,仅有 17.15 亿元为中国数据库企业,其余 103.07 亿元均为国外数据库企业。另一方面,虽然国外企业市场份额较高,但这主要是源于其抢先进入国内市场,市场基础好。在 2009 年,国内数据库企业市场份额仅为 4.03%,而在 2017 年,国内数据库企业市场份额已经增长到 14.27%。这也表明国产数据库正在提高自身市场份额,积极抢占市场,确保在重要领域及部门实现数据库国产化。在数据库领域,数据库技术门槛较高,国外数据库企业 Oracle、IBM 和微软三家厂商占据市场份额近六成。其中 Oracle 占比最高,为 40.1%,而 IBM 和微软紧随其后,分别为 11%和 8.30%。而在我国数据库市场中,国产数据库市场份额为 14.27%。其中,南大通用和武汉达梦市场份额相对较高,为 18%和13%。其余国产数据库企业如山东瀚高,爱可生,人大金仓,神舟通用等在国产数据库市场份额中占比均不超过 5%,可见国产数据库存在相对激烈的竞争,不同企业都在致力于提高市场份额。我国数据库需求市场主集中在消费品,装备,原材料等领域,其中消费品领域数据库软件 2017 年需求达到 20.76 亿元,装备 18.24 亿元,原材料 14.61 亿元,政府采购 13.75 亿元。而除了需求最高的九个行业,其他行业 2017 年需求加总仅为 6.45 亿元,占比 5.37%,表明数据库需求市场集中性较强。国产数据库机遇与挑战并存,生态体系是赢得市场的关键。国产数据库的发展机遇已经从“无序竞争”到“市场引导”,从“垄断竞争”到“换道超车”。国产数据库的挑战就是,由“简”入“繁”,由“局部”到“全面”。从性能和功能上来看,国产数据库已经能满足市面上绝大多数应用。甚至有些功能是超出国外产品,有一些自己的特点。但是赢得市场的主要因素是生态,即与国产软硬件之间的融合问题。以及海量市场形成后,国产数据库的服务体系和服务布局。从技术目标和市场目标两个角度来看,希望国产数据库,实现数据库产品的自主可控,保障国家信息安全;另外一个层面,能够为全球客户提供数据库产品与服务,实现国际领先。1.4 数据库行业领导者盘点 DB-Engines 根据数据库管理系统受欢迎程度对其进行排名,每月更新一次。在 2020 年 03 月最新排名中,Oracle 位列第一,MySQL 和 Microsoft SQL Server 紧随其后,分别为第二和第三名。在中国市场份额较大的 IBM DB2 位列第六名,SAP 的 HANA 和 Adaptive Server 则分别处于第十八和二十名。Gartner 数据库魔力象限的评选标准包括全球市场份额、产品能力、客户反馈等。2013 年 Gartner 首次推出数据库魔力象限评估,对全球所有数据库管理软件进行综合评估。在 2018 年,领导者象限仅有亚马逊、微软、Oracle、SAP 和 IBM。而阿里云成为数据库领域最大黑马,以国内数据库市场份额第一的身份,首次入选并且进入远见者(Visionaries)象限,这是中国科技企业首次进入该榜单。在 2019 年,阿里云再次入选魔力象限,并进入挑战者象限,而 IBM 则从领导者落入远见者象限。在两年的魔力象限中,均只有一个国产数据库企业,在数据库领域,国产企业仍需继续追赶,争取进入世界前沿。1.5 数据库上云为大势所趋 在 Gartner 多年的数据库魔力象限中,虽然领导者企业变化不大,但是行业内企业整体升降变化十分频繁。Gartner 认为,这种变化背后反映整个数据库行业云化趋势显著。Gartner 预计,到 2021 年,云数据库在整个数据库市场中的占比将首次达到 50%;而到 2023 年,75%的数据库要跑在云平台之上。云数据库是部署和虚拟化在与计算环境中的数据库。云数据库是在云计算的大背景在发展起来的一种新兴的共享基础架构的方法,他极大地增强了数据库的存储能力,消除了人员、硬件、软件的重复配置,让软、硬件升级变得更加容易。云数据库具有高可扩展性、高可用性,采用多租形式和支持资源的有效分发等特点。从数据模型的角度上看,云数据库并非一种全新的数据库技术,而只是以服务的方式提供数据库功能,。云数据库并没有自己专属的数据模型,云数据库所采用的数据模型可以是关系型数据库所使用的关系模式,即关系型数据库服务(Rational Database Service,RDS),也可以是 NoSQL 数据库所采用的非关系模型。行业分析师指出,在全面上云的大背景下,商业数据库因其昂贵、高运维难度、以及低扩展性和可用性受到挑战。而云数据库则因天然为云定制,具备云计算的弹性能力,兼具开源数据库的易用、开放特点,及传统数据库的管理和处理性能等优势,成为企业的最佳选择。1.6 数据库开源技术之必然博弈 开源数据库是免费的社区数据库,其源代码可供公众使用,并且可以在其原始设计中进行修改或使用。截至 2020 年 6 月,在全球 356 种数据库中有 50.4%采用商业授权;49.6%使用开源协议。全球开源数据库使用较为广泛的包括 MySQL,PostgreSQL 和 MongoDB 等。根据 2019 年 DB Engines Ranking 发布的权威数据库排行,公认最为活跃的 10 款典型内存数据库与各项指标对比如表 3 所示。在前 10 款活跃度最高的内存数据库中,有 5 款为开源产品。数据库的数据结构与 ACID 支持情况如表中所示。在开源产品中,Redis 和 Memcached 是最受欢迎的两款键值对内存数据库;而 SQLite 是最受欢迎的关系型内存数据库。现今在国际上形成了从商用数据库到开源数据库的发展与迁移趋势。而在开源使用的过程中,大体企业利用了多种数据库种类来满足人群的应用程序需求,热门商业数据库与开源数据库一起使用的趋势愈发明显。在这一混合使用的过程中,多语言的持久性与商业数据库向开源数据库使用的迁移势头也愈发显著。下图为数据库流行度统计图表。深蓝色代表的商业数据库从 2013 年 65%左右的使用率下降到 2019年 50%水平,并存在流行度下行可能性;浅蓝色代表的开源数据库经过近年来不断技术更新、综合使用简易成本低廉等特点,已有追赶、超过商业数据库流行程度的趋势。时至今日,数据库中 Wide Cloumn开源占比 81.8%,时序数据库开源占比 80.7%,文档存储类开源占比 80.0%,Key-Value 存储开源占比72.2%,图数据库开源占比 68.4%,搜索引擎开源占比 65.3%;这些数据库类别均已实现开源数据库使用度超越商业数据库。而在传统的关系型数据库中,商业产品仍高达 60.5%。全球大型企业商业数据库积极追求开源并行使用的策略为国内开源数据库的发展点亮明灯。下图表示正在迁移到开源数据库的商业数据库用户情况。Oracle 是世界上排名第一的数据库,图表中反映 Oracle占有超过 2/3 的和开源数据库组合商业数据库的份额;微软 SQL Server 与 IBM Db2 分列第二三位,分别占与开源相结合的商业数据库使用量的 22%与 11%。从国际大趋势来看,商业数据库与开源数据库的结合是主要潮流,无论是甲骨文、微软或是 IBM,用户使用中都在积极追求开源的应用。在全球市场上开源数据库的表现为开源国产化发展之路提供前车之鉴。在国内,开源人数不断增长,中国持续研发突破走向自主可控。根据 GitHub 的相关数据显示,从 2017年到 2018 年开源发生了规模级的攀升,开源人员从 2400 万上升为 3000 万+,企业和组织从 150 万上升为 200 万+,代码库 6000 万上升为 9600 万+。而中国截止 2018 年,成为了 GitHub 贡献排名第二的国家,排名仅此于美国。同时,中国自主研发的开源项目也正积极与国际接轨。目前,国内共有 22 个项目贡献给了国际顶级基金会,包括 Linux 基金会、Apache 基金会等,目前成功完成的项目有 9 个,包括 Kylin、HAWQ、Eagle、CarbonData、RocketMQ、Griffin、 SOFAStack 、Caliper、TiDB。国内开源许可授权模式对开源国产化适宜。按照开源 License 的授权模式,图 3 中三角形越往下开源管理越宽松。图 3 右侧对应各项开源授权要求。如 MySQL 属于 GPL,在互联网行业用户较多;而PostgreSQL 属于 BSD 授权;国内有不少数据库公司的产品就是基于 Postgre,开源授权管理宽松,无开发者声明、授权限制要求。目前中国的开源企业主要有两种服务模式。一是提供基于开源项目的商业解决方案,例如阿里、腾讯、华为等;二是开源服务模式,将社区版本的开源项目打包测试通过订阅模式、按需收费提供给用户。不同的开源主体使用开源的方式会有所不同,面临的风险也会不同。根据中国信通院副主任郭雪介绍,开源的模式主要包含三个方面:基础设施、开源主体和开源规则。如果从大的方面来看,开源风险可以分为四大类,技术及运维风险、合规及知识产权风险、安全及数据风险、管理风险。大部分中国企业认可开源技术并有所应用。根据中国信通院披露,通过对互联网、政府、金融、医疗、软件及信息技术服务、制造、电信、交通及物流、科教文卫和能源等行业在内的企业调查发现,超过八成的企业是认可开源技术的。在选择开源技术时,技术成熟度、功能丰富度、应用部署时间和成本是企业关心的重要因素。而缺少合适的解决方案、安全性、现有技术不够成熟是企业尚未采用开源技术的关键原因。在具体应用时,最受企业关注的解决方案类型包括规划设计、产品选型、实施路径和运维管理;企业对开源解决方案关注的重要指标包括功能性及易用性、服务安全性、异构化系统的兼容性、技术支持能力、行业适用性等;在开源技术应用方向,企业更侧重于存储、数据分析、数据库、网络和中间件。2. 国内传统数据库,各巨头细分差异明显(详见报告原文)2.1 中国数据库测评近期情况 根据中国信通院披露,2020 年 6 月 17 日至 6 月 23 日期间,第十批大数据产品能力评测结果评审会圆满结束。共计 40 家企业的 68 款产品通过了本次测试评审。目前为止,通过中国信通院大数据产品能力评测的测试数量累计达到 304 个,涵盖了分布式分析型数据库、分布式事务型数据库、关系型云数据库等数据库的数据流通产品以及可信数据服务。经过 6 年的发展,“中国信通院大数据产品评测”已经成为权威的大数据及数据库产品评测体系,成为厂商产品研发和用户采购选型的风向标。下一步,中国信息通信研究院作为标准制定和评测的牵头单位,将以 CCSA TC601 为平台,与学术界、产业界和领域用户紧密合作,不断完善大数据产品技术标准体系,推动我国大数据产品技术水平不断提升,为数据强国提供强有力的基础支撑。本次的数据库产品是通过评测的第十批;分布式数据库的事务型、分析型基础能力评测如下表所示。目前来看,国产传统数据库厂商竞争格局已初显端倪。从市场份额角度分析武汉达梦和南大通用作为第一梯队地位稳固。而随着我国数据库行业的不断成长,一批国产优秀数据库纷纷涌现。2017 年 Gartner报告首次入选了三家中国数据库厂商,阿里云、SequoiaDB(巨杉数据库)以及 Gbase(南大通用)。其中,巨杉数据库主要应用于金融领域,尤其是大型商业银行,其许多场景的应用类型和技术要求远高于海外同类金融企业。2018 年入选的国产数据库厂商达到 5 家,分别是阿里云、腾讯云、华为、星环科技(Transwarp)、巨杉数据库。考虑到目前尚缺专注国产数据库的上市公司,加之数据库具有使用的惯性,如此一来,有强大股东背景、禀赋充足、市场与技术基础扎实的厂商在未来或能迅速实现价值转化。国内数据库中有背后上市公司或企业支持的数据库厂商主要有武汉达梦、神舟通用和人大金仓。2.2 中国软件(持股武汉达梦) 2.3 太极股份(子公司人大金仓)2.4 神舟通用2.5 科蓝软件2.6 优炫软件2.7 瀚高软件2.8 东方国信2.9 海量数据2.10 天玑科技2.11 亚信科技(通信行业覆盖)2.12 南威软件2.13 创意信息(子公司万里开源)2.14 东软集团 2.15 中兴通讯(通信行业覆盖)2.16 紫光股份(子公司新华三集团)3. 云计算加持,数据库上云成为行业转折云数据库是指被优化或部署到一个虚拟计算环境中的数据库,可以实现按需付费、按需扩展、高可用性以及存储整合等优势。根据数据库类型一般分为关系型数据库和非关系型数据库(NoSQL 数据库)。云数据库的特性有:实例创建快速、支持只读实例、读写分离、故障自动切换、数据备份、Binlog 备份、SQL 审计、访问白名单、监控与消息通知等。3.1 阿里云数据库 过去 7 年的持续发展,2018 年阿里云首次进入 Gartner 的数据库魔力象限,能够入选 Gartner,这是中国数据库厂商的一次突破。在 2018 年 6 月,阿里云还曾入选 Forrester 全球数据库报告,跻身―强劲表现者‖阵营。这充分说明,在新一波技术浪潮之上进行创新,才可能做出突破。据 Gartner 统计,在 2017年,阿里云位居全球云数据库市场份额第四名,而在 2018 年已上升至第三,年增速在 115%。同期 AWS增速为 74%、Oracle 为 66%.云数据库已经不仅仅是简单地完成数据库在云资源中的搭建,数据库曾经是 IT 系统中最昂贵的投入之一,对企业高管(CEO、CFO、CTO、CIO 等)而言,更加灵活的生命周期管理,可以实现成本的合理投入及灵活管理。对 DBA 技术人员而言,更高的安全性、更全面的监控能力、更便捷的运维方式,将改变DBA 在企业的工作模式及地位。阿里云始终致力于从全方位提高云数据库的性能,在 2018 年,阿里云进行了重点功能提升,这些能力几乎覆盖企业 IT 系统生命周期的所有场景的自主化管理,进一步便捷企业高管、DBA 技术人员等各岗位的工作人员。目前,阿里云拥有国内最强大和丰富的云数据库产品家族,涵盖关系型数据库、非关系型数据库、分析型数据库及迁移工具等,可以满足用户不同的数据库应用开发需求。其中,PolarDB 是国内首个云原生数据库,采用存储计算分离、软硬一体化设计,满足大规模应用场景需求。历经十年技术积累,阿里云正在引领多个前沿技术领域,帮助企业解决核心业务上云的难题。目前已有约 40 万个数据库迁移到阿里云上。 云原生数据库技术:PolarDB 通过 IO 路径旁路化、创新的一致性协议、物理复制等技术,实现了领先的云原生数据库能力,性价比是传统数据库的 10 倍。 智能化数据库技术:DBaaS 平台具体多方面的自动化能力,基于人工智能技术,实现了参数自调优、内存使用自调优、故障自处理等。 数据库安全技术:国内首家提供 BYOK 的云数据库服务商,从用户连接、数据传输,到数据存储,提供了完整的全链路加密。 分析数据库技术:AnalyticDB 是最快的实时分析数据库,在全球权威分析型基准试 TPC-DS 榜单中位列第一名。 关系型分布式云原生数据库PolarDBPolarDB 是阿里巴巴自主研发的下一代关系型分布式云原生数据库,目前兼容三种数据库引擎:MySQL、PostgreSQL、高度兼容 Oracle 语法。 计算能力最高可扩展至 1000 核以上,存储容量最高可达 100T。经过阿里巴巴双十一活动的最佳实践,让用户既享受到开源的灵活性与价格,又享受到商业数据库的高性能和安全性。PolarDB 广泛应用于新零售、游戏、互联网金融、社交直播等行业客户。可以轻松应对高并发的应用场景,在促销、秒杀等流量峰值的场景中实现秒级扩容,支持企业应对大规模数据分析的读写需求。实现海量数据低成本存储、快速弹性扩容,保障数据库集群可用性。能够解决以下传统数据库面临的问题。 数据量瓶颈:传统 MySQL 数据库,数据增长过 TB 后需要定期扩容、迁移、拆表,开发成本高,还可能造成业务中断。太大的实例将是运维的灾难。 扩展难:传统读写实例和只读实例各自拥有一份独立的数据,新建只读实例需要重新拷贝数据,极大影响只读实例的快速扩展。 数据一致性和可用性难保证:传统读写实例和只读实例通过增量数据同步,主备延迟非常普遍,影响应用从备库读取数据的一致性,也影响切换任务和集群可用性。 与蚂蚁金融合作云数据库 OceanBaseOceanBase 是阿里巴巴和蚂蚁金服 100% 自主研发的金融级分布式关系数据库,在普通硬件上实现金融级高可用,在金融行业首创“三地五中心”城市级故障自动无损容灾新标准,同时具备在线水平扩展能力,创造了 4200 万次/秒处理峰值的业内纪录,在功能、稳定性、可扩展性、性能方面都经历过严格的检验。2019 年 10 月,数据库领域最权威的国际机构国际事务处理性能委员会(TPC,TransactionProcessing Performance Council)在官网发表了最新的 TPC-C 基准测试结果。金融级分布式关系数据库 OceanBase 以两倍于 Oracle(甲骨文)的成绩,打破数据库基准性能测试的世界记录,成为全球数据库演进史的重要里程碑。中国工程院院士、计算机专家李国杰点赞了此次成果。他表示,OceanBase打破了由甲骨文保持了 9 年之久的 TPC-C 基准性能测试的世界纪录,“是我国基础软件取得的重大突破”。OceanBase 作为一款原生的分布式关系数据库,通过扩容节点就能够获得计算以及存储的水平扩展。一般在分布式系统或者分库分表架构中,由于架构的复杂度通常放弃了全局索引、全局一致性等,用户需要付出额外的成本来关注这些问题,为了更好的解决这些问题,OceanBase 通过持续可用的全局时间戳,在全局范围内实现了―快照隔离级别‖和―多版本并发控制‖的能力,并在此基础上实现了全局索引,用户可以像使用单机关系数据库一样来使用 OceanBase。OceanBase 凭借自身性能优势及解决方案的全面性,与各银行持续发生业务往来,如南京银行,西安银行,网商银行等;同时满足阿里巴巴的数据需求,如支付宝,阿里妈妈,淘宝收藏夹等。在金融领域具有自己的独特市场,并持续将这一优势扩展到其余各领域。 南京银行:OceanBase 与南京银行共建―鑫云+‖互联网金融平台 网商银行:网上银行选择 OceanBase 三地五中心部署架构 支付宝:OceanBase 连续多年稳定支撑支付宝―双 11‖大促 阿里妈妈:OceanBase 满足了广告业务对存储系统扩展性的要求 西安银行:OceanBase 帮助西安银行完成分布式数据库的应用改造 常熟银行:OceanBase:OceanBase 助力常熟银行构建下一代数字银行 淘宝收藏夹:OceanBase 助力淘宝收藏夹业务的快速发展3.2 腾讯云数据库 腾讯云数据库(TencentDB)是腾讯提供的高可靠、高可用、可弹性伸缩的云数据库服务产品的总称。可轻松运维主流开源及商业数据库(MySQL、Redis、MongoDB、MariaDB、SQL Server、PostgreSQL等),它更拥有容灾、备份、恢复、监控、数据传输服务、安全服务、灾备和智能 DBA 等全套服务。2019 年 6 月,国际权威研究机构 Gartner 公司发布《The Future of the Database Management System(DBMS) Market Is Cloud》研究报告显示,腾讯云数据库市场份额增速达 123%,位列国内所有数据库厂商之首,在全球范围内保持了连续两年增速前三的迅猛势头。同样在 2019 年,另外一家国际权威机构最新发布的云数据库报告中,腾讯云数据库首次入选即被评为“实力竞争者”。腾讯云数据库产品线涵盖了业内主流的数据库产品,包括开源数据库 MySQL、MariaDB、MongoDB、Redis;商业数据库 Oracle、SQL Server;自研数据库 TDSQL、TBase 满足 OLTP、OLAP 及 HTAP 等多场景需求。同时,腾讯云去年还结合新硬件和云的特性提供了计算和存储分离的 NewSQL 数据库CynosDB,该数据库也是国内首家 100%兼容 PostgreSQL 和 MySQL 协议的自研数据库。腾讯云提供总计 20 多种数据库服务,并且每年还发布 5 个大产品,50 多个新功能的节奏在递增。腾讯云数据库目前已经为数十万企业级用户提供服务。腾讯内部众多的明星产品包括 QQ、微信、财付通、腾讯视频、腾讯新闻、腾讯游戏背后都使用了腾讯云数据库。基于领先的产品实力,腾讯云数据库也收获海量外部用户的认可,越来越多的企业选择将核心业务系统托付给腾讯云数据库。众多知名大中型企业比如小红书、猎豹、每日优鲜、听云、搜狐畅游、微众银行、蘑菇街、猫眼等等都选择腾讯云数据库提供的服务。应用场景上,已经覆盖电商、金融、游戏、O2O 等全行业。以微众银行为例,作为国内首家互联网银行,在腾讯云多项技术能力的支持下,微众银行在 2015 年成功打造出国内首个基于云计算技术和分布式数据库的银行分布式核心系统架构,该架构实现了多项行业创新。微众银行测试环境和开发环境部署在腾讯云提供的金融合规云机房里,可以按需使用,按量付费,生产环境的机房则采用了腾讯云的计算机服务,有效地达到控制成本的目的。数据库则采用了腾讯云金融级数据库 TDSQL,光是这一项支出,相比传统数据库就节约了 50%以上的成本。 云数据库 MySQL:全球最受欢迎开源数据库腾讯云数据库 MySQL(TencentDB for MySQL)为用户提供安全可靠,易于维护的数据库服务。MySQL是世界上最流行的开源关系数据库,通过腾讯云数据库 MySQL,您可实现分钟级别的数据库部署和弹性扩展,不仅经济实惠,而且稳定可靠,易于运维。云数据库 MySQL 提供备份恢复、监控、容灾、快速扩容、数据传输等全套解决方案,为您简化数据库运维工作,使您能更加专注于业务发展。 云数据库 CynosDB:企业级云原生数据库腾讯云数据库 CynosDB(TencentDB for CynosDB) 是腾讯云自研的新一代高性能高可用的企业级分布式云数据库。融合了传统数据库、云计算与新硬件技术的优势,100%兼容 MySQL 和 PostgreSQL,实现超百万级 QPS 的高吞吐,128TB 海量分布式智能存储,保障数据安全可靠。应用场景 1:高性能高可用企业应用 商用数据库级别的高性能高可靠,1/15 的成本使得 CynosDB 成为企业 Mission Critical(关键业务)的最佳选择。 定制开发的多项内核优化以及企业级特性,使得您的业务性能强劲,运行稳定,让研发人员专注于业务逻辑的开发,无后顾之忧。 完全兼容开源数据库 MySQL 和 PostgreSQL 更助力企业平滑上云应用场景 2:互联网和游戏企业 敏捷灵活的弹性扩展,无需预先购买存储,可根据需要弹性升降级,分钟级快速扩容,128TB 海量存储按存储量计费,轻松应对业务峰值。 可实现多区同服,免去合区合服的繁琐操作。 秒级的快照备份和快速回档能力是互联网和游戏行业的最佳选择。3.3 百度云数据库 百度云数据库 RDS (Relational Database Service)提供高性能、高可靠的关系型数据库服务。支持MySQL/SQL Server/Postgre SQL 引擎,提供单机基础版、双机高可用版及 Raft 金融版三种系列。云数据库 RDS 默认支持标准的数据库协议,实现监控、故障自动切换、数据备份与恢复、实例管理等多种功能。跨地域热活实例组是由多个 RDS 实例组成的高可用集群,并且允许以上实例分布在不同的地域和可用区,因此能够实现跨地域容灾。RDS 提供 Web 界面进行配置、操作数据库实例,还提供可靠的数据备份和恢复、完备的安全管理、完善的监控、轻松扩展等功能支持。相对于自建数据库,RDS 具有更经济、更专业、更高效、更可靠、简单易用等特点。3.4 中国电信 TeleDB 云数据库(通信行业覆盖) 中国电信拥有全球规模最大的宽带互联网络和技术领先的移动通信网络,目前用户总量达到 7 亿户。过往使用的 Oracle 数据库,已无法应对日益增长的业务需求。需自主研发出一个高性能、可扩展、高可靠的云化系统,基于云数据库 TeleDB、云操作系统、云主机组合的系统因此诞生。云数据库 TeleDB 是由 MySQL MHA + ZooKeeper 架构组成,属于分布式数据库,和淘宝自研的数据库相似,既能应对日常的业务需要,更能应对如双 11 等重大节日,解决海量交易情况下数据库的性能瓶颈问题。中国电信云数据库 TeleDB,是国内顶尖的分布式数据库,应对海量交易,数据量达 PB 级,广东省作为试点单位,中国电信将在全国 31 大省,逐渐以云数据库 TeleDB 替换国外的 Oracle 数据库。3.5 360 云数据库 三六零安全科技股份有限公司(以下简称“公司”或“三六零”)是中国最大的互联网和移动安全产品及服务提供商。在中国互联网协会、工信部联合发布的 2019 年中国互联网企业百强榜单中,三六零位列第九,是其中排名最高的 A 股上市公司和安全公司。三六零主要从事互联网安全技术的研发和网络安全产品的设计、开发、运营,依托互联网产品积累的广泛用户基础,开展互联网广告及服务、互联网增值服务、智能硬件等业务,并将这些业务所积累的核心安全能力应用到政企安全、城市安全等领域。360 云基于多年数据库产品和运维经验,推出云数据库服务,让用户实现一键创建,性能可控,无需考虑运维高可用问题,降低用户构建业务系统的难度,包括 MySQL、Redis、MongoDB。云数据库 MySQL 是 360 安全云提供的关系型数据库服务,基于全 SSD 磁盘提供 IOPS 最高 25600 的性能保障。数据库实例采用主从结构以保障高可用,同时提供数据备份、多维度快速数据恢复、监控报警、灵活扩容、数据传输等功能服务;云数据库 Redis 是 360 安全云提供的高性能内存数据库服务,支持丰富的多数据结构,主从热备,提供数据持久化、数据备份、故障迁移、监控报警、动态扩容等数据库服务;云数据库 MongoDB 服务 100%完全兼容 MongoDB 协议,支持 ReplicaSet 和 Sharding 两种部署架构,提供数据备份恢复、快速数据扩容、多维度监控报警等多种功能。拥有完善的高可用体系和管理平台,为文档型业务需求助力。3.6 金山云分布式数据库 金山云创立于 2012 年,是中国前三的互联网云服务商,2020 年 5 月 8 日在美国纳斯达克上市(股票代码:KC),业务范围遍及全球多个国家和地区。据 IDC 公有云报告统计,2019 年 H1 金山云在中国公有云市场排名第六,市场份额约 5.2%,相比 2018 年 H2 的 4.8%提升了 0.4pct。金山云互联网业务部分的营收稳步增长,其中政企行业营收暴增近 5 倍,金融行业业务激增 10 倍,增速行业第一,金山云继续保持互联网云服务商前三地位。金山云数据库是金山云公有云服务最早的产品之一,面向电商、互联网金融、网络游戏、在线教育等多种行业客户,提供涵盖关系型、非关系型、云原生等丰富的 PaaS 层数据库服务。通过稳定可靠的高性能产品,智能化高质量的配套服务,使企业客户更加专注于应用本身的同时满足灵活的业务需求。金山云已经在公有云平台上运行了多年数据库产品,包括单体、分布式架构的关系型数据库,并服务了一些重要头部客户。金山云数据库产品线涵盖了业内主流的数据库产品。基于这些实践,金山云数据库产品不断的更新迭代,并重磅推出了 DragonBase 数据库产品。金山云 DragonBase 是金山云自主研发的新一代分布式云原生数据库,旨在打造具备弹性扩容、高性能、高可用、安全合规的数据库系统,有效解决海量存储、高并发访问、数据一致性等问题,目前已大量应用于金融、互联网及政府企业的多种关键业务场景中。金山云 DragonBase 采用计算存储分离的架构,拥有计算、存储、管理三大引擎,目前已适配主流国产服务器、操作系统,如鲲鹏芯片、UOS、深度 OS、中标麒麟 OS,以及东方通、金碟等中间件。金山云 DragonBase 依托金山云公有云服务实践之上,极大地保证了数据库高可用、高性能等特性,从而为用户提供稳定可靠的数据服务。4. 数据库产业相关上市公司及投资策略及组合(详见报告原文)……(报告观点属于原作者,仅供参考。报告来源:东兴证券)如需报告原文档请登录【未来智库】。

关于爱

Gartner发布全球云数据库报告 中国企业首次挺进全球数据库第一阵营

00:18封面新闻记者 张越熙11月24日,国际知名行业研究机构 Gartner 公布 2020 年度全球数据库魔力象限评估结果,来自中国的三家数据库企业入选,分别是阿里云、腾讯云、华为云。而阿里云也是首次挺进全球数据库第一阵营——领导者(LEADERS)象限,这也是中国数据库40年来首次进入全球顶级数据库行列。腾讯云和华为云则被评为“特定领域者”。“阿里云拥有丰富的数据库种类覆盖度和完善的产品布局,为用户提供了多种关系型和非关系型数据库产品,还提供了混合云环境部署,同时集成了备份、数据迁移与同步等能力。”Gartner分析师在报告中指出。Gartner报告指出,腾讯云数据库在传统交易和运营智能方面表现出了独特的优势,并基于腾讯在金融、支付、社交、游戏、智慧零售、广告等领域的领先优势,腾讯云数据库广泛增强了其高可用能力。数据库与芯片、操作系统并列为全球技术三大件,也是企业IT系统必不可少的核心技术,银行、电信、制造、互联网等主要行业都依赖于数据库技术。Gartner预计,到2023年全球75%的数据库都会跑在云上。IDC数据显示,2022年全球数据库市场规模将超过400亿美金,市场空间巨大。随着企业数字化进程的加快,中国云计算市场竞争火热,各家企业都在加大数据库投入。最新数据显示,阿里云已经位居全球云数据库市场份额第三位以及中国市场第一位。IDC中国企业软件市场高级分析师王楠表示,当前,基于大数据、移动互联网、人工智能的业务创新不断涌现,基于新兴技术的系统和应用正在飞速发展,这将驱动对关系型数据库需求的继续增长。中国关系型数据库的主要市场需求正向着云服务、分布式、分析型过度,国内厂商在这些领域与国外厂商的产品和技术差距并不大,甚至与国外厂商处于同一水平。未来,无论在宏观环境还是数据库市场需求发展方面都将利好本土厂商。

加工厂

2018年中国大数据BI行业报告:自然语言生成和人工智能成为新标准特征

图片来自“123rf.com.cn”近年来,随着人们的数据意识和数据素养不断提升,商业智能和数据分析领域迎来了快速发展期, 据Gartner商业智能报告统计,到2020年全球的商业智能市场容量预计将达到228亿美元 。同时,大数据、人工智能、机器学习、深度学习等技术的快速发展,也促进了商业智能和数据分析产品的新一轮进化。 Gartner分析师认为,到2020年,自然语言生成和人工智能将是90%的新BI平台的标准特征,50%的分析查询将使用搜索、自然语言处理,或语音生成,或将自动生成。 但我们必须认识到,我国商业智能的市场特征、企业需求、关注点、发展阶段均与国外有所不同,以Gartner为代表的分析机构并不能准确描述我国商业智能行业的实际状况。针对这一问题,帆软数据应用研究院调研了规模不一的216家企事业单位,了解到他们的大数据BI应用状态、需求情况、对大数据BI产品功能的期待,同时基于帆软数据应用研究院对行业的长期观察和思考,形成了该篇报告。主要预测: 2018年,中国大数据BI产品将主要在自助分析的可操作性和功能丰富度、平台的安全性、数据管理能力、分析的共享能力、数据挖掘能力、大数据处理能力六大功能模块进行提升。 一、2018年中国商业智能行业发展分析 (一)行业总体形势向好 在当前经济环境下,企业盈利的压力和难度不断增加,越来越多的企业,尤其是一、二线稍具业务规模的企业,其高层都希望通过精细化运营提升市场竞争力,降低企业的运营成本。这些企业绝大多数都已经在2008年-2015年间上线了各种业务系统,存储了大量管理和运营数据,具备应用大数据BI进行数据分析和数据化管理的各种条件,这些需求将在2018年-2022年继续爆发。值得注意的是,艾瑞咨询在《2017年中国商业智能行业研究报告》中指出,我国已经进入商业智能领域第一方阵,成为发展最快的国家之一,但和美国还有比较大的差距。所以未来中国大数据BI行业总体将呈现加速度增长,市场容量将不断扩大。 (二)大数据BI厂商马太效应显现 马太效应是指强者越强,弱者越弱的现象,国内BI行业的马太效应已经显现,综合实力强大的厂商更能投入资源做好产品、服务,解决更多用户的需求和问题。可以预见,2018年中国BI行业马太效应将进一步增强,逐步淘汰掉实力弱、规模小、产品差的企业。 (三)新型自助式BI与传统型BI平分秋色 得益于敏捷、自助的特征,从2013年起新型自助式BI迎来了高速发展期,这一时期也是传统型BI的衰退期。2017年,传统型BI与新型自助式BI在国内市场中平分秋色。受访企业中,约50.2%的企业仍然在使用传统型BI,其中最典型的需求是企业常规日报、月报等汇总分析报告。约49.8%的企业应用新型自助式BI,通过报表平台+自助式BI+大数据底层平台的解决方案,来解决企业综合的数据展示和分析需求,形成经营和战略决策。在调研中我们注意到,约有18%的企业引进了新型自助式BI,部分或全部替代了传统BI。虽然传统型BI有其自身优势和应用场景,但随着新型自助式BI的不断发展,传统型BI必将逐渐退出历史舞台,从国际传统BI巨头积极调整产品结构可见一斑。 二、2017年中国商业智能用户状况分析 根据企业的IT人员和业务人员在数据分析中的工作量和投入程度占比,我们将BI用户(企业)划分为5大类型,即BI应用金字塔模型,以更好的统计、分析企业的BI应用状况。 (一)BI应用金字塔模型 1.IT完全主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的所有相关工作,完成95%以上的BI分析页面(注:主要是指用于生产、经营、管理会议所需要的数据分析页面,下同)的开发。业务人员仅负责前端数据查看,完成查看报表时相关联动钻取操作。调研中我们发现,处于“IT完全主导型”这一等级的企业,约有93.2%都在使用传统型BI工具,企业的业务人员基本没有能力,也没有需求去自主完成数据分析的工作。这些企业的业务变革并不剧烈,企业管理层认为当前的日常数据报告能够满足企业管理和决策的需要,相对缺少变革的动力。2.IT强主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的所有相关工作,完成80%~95%数量的BI分析页面。业务人员完成低于20%数量的BI分析页面。从调研数据来看,这类企业中,67.5%的企业认为当前业务人员不具备数据分析的能力。而企业需要快速完成部分数据分析工作,所以选择让IT人员更多承担工作。这类企业中普遍认为,商业智能产品本身并非能够快速上手,且业务人员仍需要统计学基础,阻碍数据分析工作从IT人员向业务人员的转移。3.业务强主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的所有相关工作,完成前期示例不超过20%数量的BI分析页面。业务人员完成超过80%数量的BI分析页面。从调研数据来看,这类企业中,超过80.2%是曾经推行传统BI的企业,并且部分业务人员是有较高学历和能力的,能够学习和掌握商业智能工具和数据分析技能,并愿意在工作中积极使用;从帆软数据应用研究院的实地走访的部分企业来看,这些企业普遍行业排名靠前,公司从高层就重视数据分析工作。4.业务完全主导型其典型特征为,IT人员做底层数据仓库,以及BI工具层面的数据模型处理的部分相关工作。业务人员完成95%以上数量的BI分析页面和相当部分BI工具层面的数据模型处理。相比于第三类使用人群(业务强主导型),这类用户的一大特点是业务变革十分迅速,从事业务工作的人员学历普遍较高,业务经营和发展需要企业快速做出决策。而基于数据分析得出的业务判断相比个人历史经验准确度更高,是这类企业基本共识。比如在新兴的互联网企业,或者新零售领域,这个特点尤为突出。5.智能自助型其典型特征为,IT人员只做底层数据仓库、数据连接、数据字典相关工作。业务人员处理所有BI工具层面的数据处理,以及所有BI分析页面。IT人员搭建数据中心,业务人员完全自主处理和分析数据,这类企业有着明显的资源密集型的特点,业务人员更多的是偏向运营相关的工作。当然,因为此类受访企业占比较少,原因分析的可信度还有待进一步调研来核实。 (二)BI用户状况分布 基于BI应用金字塔模型,2017年企业分布如下;从调研数据中,我们可以得出两大结论。1、 IT人员主导企业数据分析的模式仍占据主流,也就是IT驱动仍是2017年企业商业智能平台应用现状 。从数据调研的受访企业来看,有高达60.5%的企业的数据分析工作仍是第二类型(IT强主导型),甚至有21.5%的企业的数据分析工作处在第一类型(IT完全主导型),这显然和业务人员自助数据分析的目标距离遥远。 2、新型自助BI正在成为商业智能市场的主流。 17.5%的企业是在2017年上线了新型自助BI,实现了让少部分业务人员自助完成BI数据分析的目标。 三、2018年商业智能用户需求分析 (一)企业多级部门数据分层次IT权限和平台管控,占受访企业97.6% 需求描述:BI工具支持企业的多级部门的数据/分析页面权限管控,使得不同层级的部门机构只能看到本部门机构和辖属部门机构的数据/分析页面。需求产生的原因:有的信息中心为释放压力,放权给业务部门使用数据,一旦口子打开,数据缺口就会像洪水一样泛滥,就又会走向另外一个极端,导致放权下的数据管理混乱,数据口径不统一,部门之间的数据壁垒等等问题就会出现,同时这将给企业带来极大的数据安全隐患。满足该需求对企业的价值和意义:在满足业务部门BI数据自助分析的同时,兼顾企业的数据权限管控,形成企业以IT部门集中管理下的良性数据分析风貌,杜绝企业数据安全隐患。 (二)业务人员可通过BI工具进行自助数据分析,占受访企业94.5% 需求描述:业务人员可以在浏览器前端,对自己权限范围内的数据进行多维拖拽探索和自助分析,发掘隐含在数据中的业务价值。需求产生的原因:企业的传统信息化建设中,IT信息中心对公司数据进行高度集中的管控,来自企业各职能部门的数据处理以及报表就会全部由IT人员来输出,一旦业务部门需求集中扎堆,就会造成响应不足,业务部门怨声载道。信息中心自身成员熬夜加班做报表,成就感却很低。满足该需求对企业的价值和意义:通过高效灵活的BI工具,业务人员对自己权限范围内感兴趣数据进行多维拖拽探索和自助分析,以工具简单易上手的低学习成本,让真正对分析业务价值最熟悉的业务人员实现自助数据分析探索,最大化业务数据的分析维度和分析效率,灵活发掘数据中可能潜在的业务价值,同时也解放了IT人员的劳动力,降低企业人力成本。 (三)可快速搭建型自助BI业务数据模型,占受访企业87.5% 需求描述:数据库表中的数据需要基于业务分析主题进行分类管理,相关数据表之间支持手动/自动构建关联模型,同时建立的关联模型支持灵活应用,无需反复编辑修改或创建新的模型,一次建立即可灵活满足多重业务场景进行数据分析使用。需求产生的原因:传统BI工具创建的底层数据关联相互独立,无法重复利用,一旦遇到新的业务数据计算分析场景,数据关联就需要修改或重新创建,极为麻烦,非常不利于IT人员维护。满足该需求对企业的价值和意义:通过BI工具快速构建的新型自助式BI业务数据模型,较传统BI工具针对不同业务分析场景需要多次、重复建模的应用痛点,极大地提高了BI工具的企业中业务数据分析应用的效率,解放了以往IT人员对数据维护的压力。 (四)OLAP多维分析:上卷、下钻、旋转、切片、联动、跳转等,占受访企业84.5% 需求描述:BI工具支持强大的页面OLAP多维分析功能,包括分析视角的上卷、下钻,维度的旋转切换,指标的切换,分析数据的切片过滤,组件之间的联动过滤、页面超级链接跳转等。需求产生的原因:随着业务发展的复杂化,单一角度的数据分析往往难以再发掘出更多有价值的潜在业务信息,取而代之的是需要BI工具能够满足强大的页面OLAP多维分析功能。满足该需求对企业的价值和意义:通过BI工具强大的OLAP多维分析功能,以实现多角度、多关联数据之间的数据无限层次探索分析,发掘出数据中潜在的业务价值。 (五)大数据处理性能处理能力达到十亿数据秒级响应,占受访企业63.6% 需求描述:BI工具可支撑处理亿级以上大数据分析计算的秒级响应,提供多维加速引擎对传统关系型数据仓库(SQLServer、Oracle、Mysql等)进行数据提速处理,同时也支持实时对接企业大数据平台(Vertical、Kylin、Greenplum等)进行数据分析计算。需求产生的原因:一方面,传统关系型数据库在面对上亿级别以上数据量时,容易出现性能瓶颈,长时间的查询等待往往会导致业务数据分析效率太低。另一方面,当今信息化水平飞速发展,越来越多的企业已经有了自己的高性能大数据平台,对于这部分企业来说,拥有一款能够直接对接大数据平台进行数据分析的工具尤为总要。满足该需求对企业的价值和意义:BI工具提供的强大数据计算处理引擎,能够降低企业数据查询等待时间成本,提高业务数据分析效率。同时,通过直接对接企业大数据平台,还可满足企业实时数据分析的需求。 (六)业务人员可完成工具层面的零代码数据加工处理工作,占受访企业57.5% 需求描述:BI工具可通过快速易上手的交互方式,让业务人员也能完成工具层面的零代码数据加工处理工作,例如例如表合并、分组统计、结构数据分层、过滤、增加列、同比环比、累计值、所有值、公式运算等数据清洗和数据处理方法,实现对数据的无限层次多维透视分析统计。需求产生的原因:当业务需求相对偏复杂时,简单的维度和指标统计往往无法直接计算出业务所需要的计算结果,以往的处理方式往往可能是业务部门提需求给IT,然后IT经过SQL或者代码对底层数据表加工处理,然后最终导出一张excel数据表给业务部门,期间的反复沟通和等待时间往往降低了企业的业务数据分析应用效率。满足该需求对企业的价值和意义:通过BI工具,使得业务人员也能快速实现对数据的无限层次多维透视分和析加工统计,降低了传统模式下的沟通成本和等待时间,提高了企业业务数据分析的应用效率。 (七)移动端数据分析查看支持,占受访企业44.9% 需求描述:BI工具支持移动端数据分析多维分析查看功能(兼容PC端的上卷、下钻、旋转、切片、联动、跳转等),对于BI工具的应用app支持便捷的扫码登陆、离线查看、批注、分享等功能,同时满足某些社区平台如微信、钉钉的企业公众号集成。需求产生的原因:在当今这个移动设备便捷时代,仅仅PC端的数据分析已经不能满足某些特定时间和场所的业务分析需求了,而BI对移动端的支持已经成了必然要满足的功能点。满足该需求对企业的价值和意义:通过移动端的BI分析查看,使得数据分析不仅仅局限于PC端,较大地增强了数据分析的便捷性。同时微信和钉钉的集成接入,让业务通过社区平台也能直接查看想要的数据分析页面,更是为移动端数据分析锦上添花。 四、中国大数据BI产品功能预测 结合用户需求调研,和我国BI厂商的产品计划研究,2018年如下六个大的功能模块将会得到增强。 (一)提升自助分析的可操作性和功能丰富度 为满足业务人员可通过BI工具进行自助数据分析的需求,中国大数据BI产品需要改善自助分析的功能和可操作性,包括图表的丰富性。前端布局自定义搭配,让业务人员随心所欲布置。比如仪表板自由布局,可快速拖拽生成所需要分析的页面;在全面支持常见的柱状图、条形图等图形基础上,增加支持中国(世界)地图、GIS地图、桑基图等大数据图表;为了适应更加多样的用户,大数据BI平台需要支持强大的OLAP多维分析功能,包括分析视角的上卷、下钻,维度的旋转切换,指标的切换,分析数据的切片过滤,组件之间的联动过滤、页面超级链接跳转等。业务人员在OLAP多维分析的基础上,能够在数据分析查看时,再次对所有维度进行二次的维度指标加工,并无限层次多维透视分析统计,全面开放业务人员对数据的处理和分析操作,以满足当前中国用户多个视角、多个层级的分析需求,把传统业务分析的智慧充分沉淀到数据分析系统中来。为了给不同用户提供个性化的视觉体验,大数据BI平台支持表格动态数值预警功能和图形设置动态警戒线,支持图表样式风格自由拖拽调整。同时,也需要大数据BI平台智能自动设置预警值和样式风格等。 (二)提升平台的数据挖掘能力 为满足企业业务人员自助数据分析和自动挖掘的需求,中国大数据BI产品需要在已有的数据可视化和数据分析的功能基础上,增强数据自动挖掘能力,使业务人员在能够掌握挖掘基本概念的基础上,深入挖掘分析业务数据,为业务运营提供数据结论支持。大数据BI平台需要支持嵌入式高级分析功能,用户能够轻松使用平台内置的高级分析功能,也可以通过导入和集成外部开发的高级分析模型。比如平台内含数据挖掘常见算法(如线性预测、时序预测、聚类、分类等),或者提供外接其他数据挖掘平台和工具的可视化接口(如R语言或者Python语言),甚至内含适合特定业务场景的挖掘模型。 (三)提升平台大数据处理能力 为满足企业对大数据BI平台实时响应的需求,中国大数据BI产品需要将当前大数据处理能力提升一个量级,达到10亿数据量秒级响应水平,同时支持丰富多样的数据源。大数据BI平台需要支持丰富的数据源,如企业主流的关系型数据库、大数据平台、NOSQL数据库以及多维数据库,需要支持实时对接数据平台和分布式引擎拓展,同时支持跨数据源关联,同时支持对较大级别数据量进行数据抽取和索引建模,提高数据分析效率。 (四)提升平台的数据管理能力 为了满足中国企业业务人员用户对数据处理的需求,中国大数据BI平台需要提升自身的元数据管理能力、数据的ETL处理能力、数据存储能力。提高元数据管理能力,使得用户能够集中管理元数据,包括对元数据进行检索、提取、处理、存储、分享复用和对外发布。中国企业的业务人员将需要在数据分析的过程中,直接操作经过IT人员标准化处理的元数据。近几年来,中国数据分析人才迅速增加,企业中也成长出一批有一定数据分析能力的业务人才,这些中国企业业务人才更多的是需要对数据进行ETL处理和存储,这就需要平台功支持用于查询、提取、转换和加载的功能,具有索引、管理、调度数据的能力。 (五)提升平台分析的共享能力 随着ERP、OA、MES、HIS等常见业务系统的完善,企业少则数十套IT系统,多则上千套系统。新型自助BI需要能够与多个系统同时融合,全面分析企业的业务数据。这就需要中国大数据BI产品需要加强产品与不同软件系统的集成融合能力,这是中国企业面临的共同难题。大数据BI平台需要支持嵌入式部署,如主流的应用服务器,支持跨平台的权限集成和页面集成。大数据BI平台不同用户创建的分析页面,可以方便地分享给其他成员。同时,在企业的分析用户设计仪表板时,可以复用仪表板中的图表、维度、指标等,支持用户分享指定页面进行给其他部门成员,便于互动沟通交流。为满足企业人员实时办公、互通信息的需要。大数据BI平台还需要支持移动端上共享和查看分析结果,支持在移动端对分析结果进行数据层级钻取穿透、联动等。 (六)提升平台的安全性 为了满足企业多级部门同时使用、不同权限的功能,中国大数据BI产品除了要提供灵活丰富的用户管理功能、权限控制功能,还需要内置强大的用户行为监控与分析功能,确保企业的数据安全和信息保密。大数据BI平台将支持持批量导入用户,支持同步企业统一权限管理数据库中的用户,以企业IT系统统一的用户管理方式进行用户管理。支持用户以企业IT系统统一的用户权限认证方式进行权限管理。同时,需要支持短信平台功能,并可用于用户账号身份验证等,多种用户和权限管理方式,来满足广大中国企业的不同的安全级别要求和安全管理策略。随着大数据BI在中国的发展,中国企业自身的大数据BI平台已有众多员工账号。这就对大数据BI平台提出新的挑战,除了要拦截非法用户,还要对大数据BI平台有效用户进行有效监控。2018年,大数据BI平台需要支持监控用户的操作行为,支持监控页面被访问的频次、访问来源,甚至是支持监控访问到的数据范围。为了保证大数据BI平台系统持续支持企业经营管理,需要大数据BI平台支持系统数据迁移到企业数据库,支持对系统进行备份与还原,备份可以手动或设置周期定时备份。同时,支持云端服务器部署和本地服务器部署,支持多机热备,达到企业的灾备要求。此外,为了有效避免BI平台出现严重异常,还需要支持监控自身的运行性能,遇到系统性能风险,提前给出系统预警信号。本文来自亿欧,创业家系授权发布,略经编辑修改,版权归作者所有,内容仅代表作者独立观点。