• 34
阿里云发布新一代数据库产品POLARDB,跑分超越AWS Aurora
统计 阅读时间大约10分钟(3907字)

2017-09-21 阿里云发布新一代数据库产品POLARDB,跑分超越AWS Aurora

实力对标亚马逊云服务。

【猎云网(微信:ilieyun)北京】9月21日报道(文/都保杰)

今天下午,阿里云升级发布了旗下最新一代的数据库产品POLARDB, 据悉,阿里云数据库产品目前覆盖包括:关系型数据库、混合分析数据库、搜索与时序数据库、NoSQL数据库以及数据库服务于工具等诸多领域,已成为全球数据库产品线最齐全的云计算厂商,今天整体数据库产品再次升级,旨在为企业提供面向未来的能力。

据了解,POLARDB采用第三代分布式共享存储架构,将IO操作减少50%,100%向下兼容MySQL5.6,性能是MySQL的6倍。它把创建只读副本进程从按小时计算缩减到现在几分钟就能完成,支持3分钟创建全球范围的容灾实例,现场跑分测试,该产品写性能实现13万TPS,读性能高达100万QPS,超越国际竞争对手AWS Aurora。本数据库产品会推出基础版、高可用版和金融版等,全方面使能中小企业、独角兽、金融企业和大型企业的数据库建设需求。

插图1

发布会上,阿里云数据库产品负责人张云杨、阿里云数据库总负责人余峰、阿里云金融事业部总经理徐敏分别做了主题演讲,对阿里云数据库产品的发展历程、技术水平、应用前景进行了介绍。

以下是演讲实录,猎云网(微信:ilieyun)整理节选:

 张云杨:今天大家都是在期待最新一代的POLARDB的发布,但在此之前我向大家先讲述一下整个产品的设计理念以及我们的技术积累还有重大的更新。

毫无疑问,现在是一个全新的时代,业务在爆炸、数据在爆炸,因此对于后端的数据库技术要求需求也在不断的涌现出来。而对于这些需求,阿里云数据库团队一直在耐心的聆听,去总结用户的痛点。这些在线上线下都出现的痛点,在今年发布会之后大家都会有一个全新的认识,将会帮大家省去非常多的时间,这些问题都一并被我们解决了。

阿里云数据库团队已经有七年历史,从2011年开始我们一直不断在努力进行非常快速的迭代。目前仍然处于快速增长期,我们从2011年开始每年都会发布两到三个非常重量级的产品,会发布一到两个非常大的功能更新。而实际上我们在连续五年时间里面,每一年都有超过1000项以上功能优化,在2015年实际上发布了1100项功能的优化,而在2016年这个数字是1800项,今年还没有过完,相信应该会突破3000项。

我们支撑的业务也在越来越大越来越广,不仅仅是集团内部的“双11”,也包括外部的初创公司,非常庞大的物联网公司。在2012年第一个产品RDS就已经开始接入阿里巴巴“双11”活动,到了2014年所有“双11”电商流量全部会经过RDS;而2013年我们推出的金融云支撑了蚂蚁余额宝业务;2016年大家知道视频直播业务爆发的非常迅速,一直播、映客上了我们阿里云数据库,在2017年O2O巨头饿了么也接入阿里云数据库产品。

如今阿里云数据库产品已经覆盖了所有数据库领域流行的数据库引擎,其中包括最常用的关系型数据库,包括Mysql、Redis,还有一些场景化的产品搜索、时序,除此之外也通过数据迁移、数据管理的工具帮用户打通所有的数据,阿里云上已经有超过10万个数据库实例正在运行!

插图2

阿里云数据库产品负责人张云杨

我们在今年已经做的三个非常重大的升级,分别是可靠性、场景化、性价比。我们推出了第三代的可靠性方案,将会成为未来所有企业核心业务的首选方案;其实有很多的业务场景是全新出现的,不仅仅在一些新的行业,在老的行业也会有全新的业务和全新的场景出来。这些场景在云上进行了很长时间的沉淀,我们在以下三个场景上面推出了数据库产品。

第一个是OpenSearch,它能提供千亿级数据查询,十万量级数据更新,支持智能查询语义分析,可以广泛应用到视频搜索、新零售产品搜索,对客户需求猜测上面,这个是经过了阿里巴巴、“双11”多年认证的一个产品。

第二个是HITSDB,它是一个时序性的数据库,可以支持非常大的写入,每秒达到千万级别,可以兼顾海量监控,以及LD行业,不管客户终端有多少,终端设备有多少个,都可以完美的支持写入,并且有非常高效的压缩算法,能让成本下降90%。

第三个是HybridDB,能够帮助用户决策过程,以前的分析基本从事情发生到决策需要一天的时间,HybridDB能够解决的事情是这一天的时延,通过HybridDB海量数据是在线的,通过TBS的支持输出各种分析报表,都能够在企业决策者需要的时候及时提供。

然后是一个非常大的改进是数据库版本,也是我们部署的形态,因为从初创企业到今年级的企业,甚至说一个企业从小到大它的生命周期过程中,对于数据库的需求往往是不同的。对于初创企业他们可能更加关注的是一个最低的投入,这个投入包括硬件的投入,包括人力投入,以最低的投入发展它的业务,能让它的业务变得高速增长,这是它最原始的诉求。

今年我们推出的数据库基础版本,能够满足初创企业以及大的企业测试环节要求,以服务器的价格来给用户提供包含的几十项功能的PaaS服务,这应该是云计算厂商中最便宜的,而且最最适合初创企业的一个版本。

第二版本高可用版,这是在2011年第一次RDS发布之后就已经上线的版本,这个版本在今年有了非常大的改进。首先补全了所有52项的管理功能;其次推出了免费的读写分离功能,以后用户再也不需要买了一个数据库之后,自己再去搭建分布分表,再也不去搭建读写分离的中间环节,这个大大给用户减少了付费成本。我们为所有的阿里云客户开放包年实例支持实时升降配置,这个费用能原封不动退还给客户账户上,能让客户以非常低的成本来度过他预期的业务。

还有一个版本是金融版,它适用的场景不仅仅是金融,包括大企业的核心应用,其实应该使用金融版。金融版完全基于第三代可靠性方案,在保证可用性和可靠性平衡基础上,我们还提供了一些增值服务。其中包括30天的SQL审计,包括秒级的高频监控等。

今天主角是POLARDB,大家迫不及待想看一下我们最新一代的产品POLARDB到底是什么样子的产品?所以,我把大部分的内容留到10月11日的云栖大会再发布,到时候会公布我们技术红利的升级,会有新开源的方案,会宣布已有老成员的巨大变化,请大家期待10月11日的云栖大会。

插图3

阿里云数据库总负责人余峰

余峰:POLARDB这个产品前面也介绍过了,历经三年几十名工程师的结晶,我们希望POLARDB产品能够支撑未来发展。

它有什么独到的地方吗?我们认为有三点非常重要,这三点可能是最朴素的,但是这三点是最难解决的,解决了这三点就解决了99%问题。

第一个问题是兼容性,大家知道MySQL是数据库市场里占的数据最多,没有之一。而且MySQL社区发展很多年,整个数据库生态是非常完善,怎么样把传统数据库或者是生态迁移到云上,很重要一点就是兼容性。今天我们看到很多的数据库产品和MySQL数据库产品都没有做到100%兼容。我认为兼容性这一点,只有0跟1的区别,要么全兼容要么都不兼容。因为很多的遗留系统它的代码可能已经不见了,维护人员已经不见了,它的系统在核心处在运行,今天再去做任何的修改,谁来做保证。如果我们做到100%兼容,那这些问题就不存在。我认为这是第一点,特别重要。我们在上面做了很多努力,目前向下兼容5.6,很快会支持5.7,5.8。

第二个问题是强大的计算节点,可以看到今天发布的最高规格是64核/512GB,这个是所有云厂商里面目前可得到的最高规格,这么大规格的计算能力,我相信大部分业务天花板是碰不到的,因为我们今天是叫下一代数据库,希望未来几年都碰不到这个天花板,留下时间给我们继续努力。

第三个问题是极大的存储容量。因为MySQL原来是单机板,所有的设计和架构都是围绕单机去做的,在这种业务变化非常快的情况下,怎么去保证容量是非常难的。不知道大家有没有感觉,10TB可能是大部分业务遇到的天花板,我们已经提供的比10TB大一个数量级的存储空间,所以基本也是很难被跨越的。

除了这三点还远远不够,我们是做到了6倍的性能提升,但是没有舍弃已有的功能跟特性。

首先,我认为硬件这个福利非常重要,我们的硬件是什么样的配置?像SkylakeCPU3G,我们今天已经在产品里装了,我们的网络是50Gbps,RDMA网卡,今天是一个数量级的提升。另外磁盘,我们不惜成本用的单盘就能达到32Gb/s吞吐能力。所以在打造下一代数据库产品和硬件上面,我们是不遗余力去做到最好。

单单硬件提升其实是不够,如何把它热起来这是最重要的事情,在这里最重要的一个部件叫POLARSTORE,它把刚才的CPU还有IO能力还有最新操作系统的进步吸收过来,它拥有智慧系统。

除了硬件、存储架构上的优化以外,我们在过去几年里面引擎层面有很大的积累。对于下一代的互联网机构企业级的关系数据库很核心的点,其中一个能不能高并发,我们在高并发上性能提升50%。在单表性能上做了大的改进,比如说在多核里面性能最大的杀手是锁,我们在锁上进行了大量的优化,单表性能提升70%。我们会优化SQL,读性能提升10%。

今天POLARDB整个引擎涉及到网络存储、虚拟化、数据路径、引擎各种模块的优化。其中,我觉得50万到100万的QPS实例非常考验团队和产品的能力,这是很大的分水岭,我相信100万单实例QPS时代会因此开启,后面会有越来越多的人进来,未来会越来越多的更高的数据会被刷新,虽然我们暂时超过了国外厂商,但是我觉得我们还是要向它致敬的,因为它开启了这样一个时代。

插图4

阿里云金融事业部总经理徐敏

徐敏:今天我的分享是“数据库的中国价值”,我不是想把它跟国外产品去比较,而是想看今天在当下中国行业正在发生的变化,这个过程中数据库应该承担什么样的角色?

给大家举一个很熟悉的例子,余额宝。其实余额宝在几个月之前它以过百亿规模超越美国摩根大通成为全球第一大货币基金,在2013年刚上线时第一天用户量只有18万,是6月13日,到了6月30日用户量250万,两周涨了14倍。当时最早是用IOE架构,这个架构从最初用到今天。上周我们在议论众安保险要上市了750亿市值,众安保险从诞生第一天就在阿里云之上,它是RDS的深度用户。他们都是深入使用到互联网优势,是互联网红利的即得利益者,把互联网用到极致,他们的IT都是轻装上阵,自己做直观性的业务,把复杂的业务交给我们做。

阿里云数据库一方面能够满足中小企业的需求,降低了初始采购成本,从第一天开始到成为独角兽你的数据库都能支撑,不需要太多的改变。同时,它能对大企业也可以使用,对大企业通过使用阿里云数据库,一方面获得了像互联网企业的爆发力,随着他们更多业务和互联网结合,会有更多的数据库业务接入进来,这就是整个数据库给整个行业带来的价值,它是一个普惠的能力、普适的能力,谁都可以用。

抛开客户去看行业本身,随着互联网的发展,包括4G、5G、移动互联网、物联网等发现,我们很多活动在线了,因此数据在线了。数据在线带来的结果你的数据量暴涨,这是必然发生的事情。今天来看全世界数据量每9个月翻一番,但是计算能力每18个月翻一番,这两者是不同步的。所以,这个里面就要通过数据库引擎来补。

今天我们归纳起来POLARDB能够让你的架构变得更简单,另外让你的效率变得更快。我们做数据库最重要是叫大道至简,希望提供给客户最简单的用户体验,最简单的数据架构,最小的成本,把复杂性留给自己。

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×