当前,我国数字化发展已然进入快车道。
随着《“十四五”数字经济发展规划》完善顶层设计,明晰数字化发展路径,“东数西算”工程正式全面启动,全国一体化大数据中心体系完成总体布局设计,我国新一代信息技术也正式迈上发展新台阶,数据更是成为基础性战略资源和革命性关键要素。
而数据库作为数据存储与计算的基础软件,对筑牢数字经济底座至关重要。虽然传统数据库领域,仍以Oracle为代表的集中式数据库占据主流,但随着越来越多企业进行数字化转型,庞大的数据处理量应运而生,具备高可用、可扩展,多地域、多部署形态,混合负载,多租户以及透明兼容性的分布式数据库,成为更多企业的优先选择。
OceanBase CEO杨冰在接受采访时也指出:“分布数据库在处理存储海量数据、处理海量并发上面有绝对的优势,我们在2020年正式推出HTAP(混合事务/分析处理),和过去相比,HTAP的事务处理性能提升50%,数据分析性能提升10倍。”
分布式数据库的“长与短”
除了性能大幅提升外,以往的数据库因为颗粒度比较粗,单个数据库内若有20%可用数据和80%废弃数据,不能够准确地剔除废弃数据,只能全盘保留,而分布式数据库却能实现真正的弹性扩缩容。
至于为什么分布式数据库能够更加贴近业务、更安全,主要原因在于它把数据切分成无数个“小”。假设某公司的数据库中存放了10个表格,每个表格中的数据为100个数据量,若该表格缺失了2个数据,将会导致整个数据库的系统无法工作。而分布式则是将每个表格中的100个数据进行分区处理,如每20个为一组,当需要提取某个数据时,不仅能够定位到相应的表格,同时系统也能对同一表格的不同区进行分区读写,大大提高了可用性和效率。
虽然分布式数据库在多方面的表现都非常优秀,但杨冰还表示,其依旧存在生态建设不足和功能不完善的短板。首先在生态上,无论是对接应用层的API(应用程序接口)和访问接口,还是下游来去消费log(日志)数据,都要尽可能国际标准化,因此要做兼容、做开源,把技术生态、人才生态慢慢培养起来,另外在商业生态或者整个产品解决方案生态上面还是需要去突破的。
其次,分布式数据库功能的完善度相比于发展了40多年的Oracle数据库和十几年的MySQL(关系型数据库)还是不够全的,需要时间去弥补。
国产数据库已进入社会场景的关键应用与核心系统
对于国产数据库的崛起与发展,杨冰深有感触,并指明了具体的三个变化:其一,数据库产业现在更讲究自主可控、原创,我们具备“0到1”的根创新能力以及国际化的竞争力;其二,国产数据库开始进入社会场景的关键应用/核心系统里面;其三,中国数据库在很多技术点上正在引领行业的发展,特别是在分布式数据库领域,国内厂商在可扩展同时一致性、数据不丢,这项技术是引领行业的。
不过杨冰也指出,目前我国数据库产业发展太碎片化,同质化竞争很严重,因此他建议可以更加地聚拢一些真正有实力的厂商,把更多的社会化的资源生态构建起来,中国的软件未来还要把SaaS(软件即服务)发展起来,并注重知识产权的保护。
至于未来,杨冰相信基础软件世界一定是构建在“云+开源”之上的,国内的数据库公司基本上都在走“云+开源”的路线,这是一个大的趋势。同时他也希望未来可以更快地往“多云”方向走,也希望监管机构、标准机构或者行业联盟尽快出台一些行业的标准,尽快标准化发展。