海量数据肖枫:坚定融入openGauss生态,逐梦数字时代星辰大海

朱飞
国内对数据库自主研发及技术演进能力从忽视走向重视。过去国内没有认识到数据库领域自主研发的必要性和技术攻关压力,但现在意识到必须要有自主研发及技术演进的能力,基于自己的处理器进行原生开发,构筑CPU、操作系统、数据库体系化的技术竞争力,加快实现国产数据库从非生产系统到核心生产系统的部署演进。

数据库被称为软件行业“皇冠上的明珠”,软件行业中的“重工业”,产业一举一动扣人心弦。尤其是在数字经济高速发展、数字中国建设如火如荼的今天,数据库作为支撑各行各业数字化转型、开展数字业务的核心生产要素,如何承接新一代信息技术与千行百业数字化转型深度融合大机遇,同时打破长期存在的“卡脖子”困局,为我国数字经济高质量发展构筑高性能、安全可靠、自主可控的核心基础设施,意义重大而深远。

12月28日,以“汇聚数据库创新力量逐梦数字时代星辰大海”为主题的openGauss Summit 2021在北京线上线下同步举办,引发社会各界广泛关注。峰会期间,极客网对话了中国唯一以数据库为主营业务的主板上市公司、openGauss社区理事会理事单位之一的海量数据总裁肖枫,听他分享了新时代下国产数据库面临的机遇和挑战,以及海量数据的路径选择和实践经验。

2345截图20211028093243.png

海量数据总裁肖枫

国内数据库产业从混沌走向清晰,从观望走向坚定

在数据库领域拥有22年从业经验的肖枫告诉我们,国产数据库经历探索仿制、国外商业数据库授权、国外开源软件封装、面向企业级应用重构,已逐渐从混沌走向清晰,从观望走向坚定。

一方面,国产数据库的技术路线、开源协议、体系演进都在逐渐明晰。首先,过往对数据库开源软件的协议风险认识不充分,现在越来越多的从业者认识到MySQL采用的GPL开源协议是“悬在头上的达摩克斯之剑”,更加重视潜在风险;其次,过去数据库更多是单打独斗,没有与CPU、操作系统、ISV生态软硬结合去做体系化演进,现在更加注重软硬件生态协同发力。

另一方面,国内对数据库自主研发及技术演进能力从忽视走向重视。过去国内没有认识到数据库领域自主研发的必要性和技术攻关压力,但现在意识到必须要有自主研发及技术演进的能力,基于自己的处理器进行原生开发,构筑CPU、操作系统、数据库体系化的技术竞争力,加快实现国产数据库从非生产系统到核心生产系统的部署演进。

海量数据从成立之初起就一直专注做数据库,2014年开始基于PostgreSQL开发第一代产品,2020年开始基于openGauss开发第二代产品,并紧随openGauss内核升级而逐步迭代。肖枫强调,海量数据选择openGauss正是基于对数据库产业的判断。

首先,openGauss采用了国产开源协议-木兰宽松许可证v2,允许所有社区参与者对代码进行自由修改、使用和引用,非常友好。而且其源代码放在中国,获取非常方便。相比之下,MySQL采用的GPL协议具备传染性,存在分发风险,同时受美国EAR(出口管制条例)管制,存在很大不确定性。另外一个主流开源数据库PostgreSQL虽然协议友好,但实际上也会受EAR管制,同样存在修改开源协议所带来的使用风险。

其次,openGauss具备企业级数据库的创新能力,可以真正实现科技自立自强。openGauss直接基于企业级能力的开源协作,将华为在数据库领域20多年来已经构筑的企业级能力积累向产业界开放,能够面向数字基础设施提供安全、稳定、高效、智能的数据管理能力。

再次,openGauss已经支持多样性算力,在鲲鹏、X86等不同硬件平台上均表现出色,尤其在鲲鹏计算平台上,因为技术根源于华为,与鲲鹏、欧拉的结合构成软硬协同的独特竞争力,再加上ISV(Independent software vendor,独立软件开发商),整体打造出基于鲲鹏计算平台的充满活力的生态。

依托多年技术积累,海量数据融入openGauss生态乘风破浪

选择openGauss技术路线后,海量数据依托自身多年的技术积累发布了商业发行版Vastbase G100。该产品兼具极致性能与高兼容、高可用、高安全、多引擎、高并发等多种特性,发布以来已在多个行业头部客户得到部署应用,包括制造行业的比亚迪新能源、中芯国际,金融行业的中信证券、国泰君安,政务领域的深圳政务云、广州政数局及大连市政府大数据中心等。

谈及Vastbase G100的成功之道,肖枫认为一方面源于多年技术沉淀,融入openGauss后做了大量企业级数据库的兼容适配;另一方面是深入融合鲲鹏计算产业生态,全栈优化,体系化演进。

首先,海量数据库Vastbase G100在原有功能基础上增加了大量企业级数据库的兼容特征,各方面功能均实现了对Oracle、MySQL等主流企业级商用数据库的高度兼容,并配套了一键式异构数据库迁移平台exBase,集成业内领先的数据库迁移能力,能够大幅降低业务系统的迁移、改造成本。

其次,海量数据联合鲲鹏计算产业生态中的硬件整机伙伴、操作系统、中间件等产业上下游企业基于openGauss技术路线进行深度优化,把openGauss在NUMA-Aware技术、SQL-Bypass、锁拆分、增量检查点、CSN事务快照等方面的核心技术最大程度上释放出来,在兼容性、安全性、性能、伙伴的适配性方面都有显著提升。

令人印象深刻的是,在多个场景应用中,海量数据库产品是与鲲鹏生态中的硬件、操作系统、中间件等通过软硬件协同优化,实现整体性能全面提升,体系化演进带来的共赢效应十分显著。对此肖枫直言,“体系化、全栈演进是趋势。处理器、操作系统、数据库这三大件,天生就具有捆绑效应。比如Wintel联盟,IBM的Power处理器和数据库,Oracle与其收购的SUN,本质上都是体系化的方案。体系化的方案可以做很多底层的深度优化,长期来看可以带来更稳定的收益。”

打破“缺芯少魂”,需要构建人才和生态的正循环

长期以来,我国“缺芯少魂”不仅仅是技术和产品本身的问题,更重要的是缺乏相应的生态和人才支持。肖枫认为数据库人才的发展和生态的构建是正循环,一方面培育人才提升产品竞争力,一方面通过更多真实市场需求检验产品,在人才和生态不断“拧麻花”的过程中向上发展。

这意味着,国内数据库领域需要把一根根手指握成拳头,凝聚成几个有竞争力的生态。openGauss正是这样一个有生命力、有前景的生态,能够汇聚数据库人才和产业链各方,形成人才的聚集地,创新的聚集地,达到人才与生态之间的同步促进,实现长期良性发展。

资料显示,openGauss自开源以来便积极进行人才培养和生态建设。在人才培养方面不仅打造系列技术课程解剖openGauss底层技术,推出相关数据库认证,培养高质量数据库人才,还积极开展产教融合,通过“智能基座”项目与72所高校合作出版教材教辅、展开数据库培训,厚植人才基础。在生态建设方面构建了由数据库厂商、关键行业客户、高校学术机构组成并不断升级的openGauss开源社区理事会、技术委员会等,推动产、学、研、用融合发展,打通人才体系建设,通过基础理论对接产业和市场需求构建知识体系,激发产业持续活力。

肖枫强调,通过生态收敛,技术创新,商业效益,人才聚集,用户认可,进而实现产品不断提升,是解决我国数据库产业面临的人才和生态问题之道。海量数据正在加大人才引进、高效率培养人才,打造有厚度的数据库人才梯队,深度参与openGauss社区建设,坚定融入并一起发展壮大openGauss生态。

建设社区夯实生态,携手逐梦数字时代星辰大海

开源为软件生态构建提供了更快更优的实现路径,而开源社区建设将决定生态的活力与前景。openGauss秉承“共建、共享、共治”的理念,搭建了由理事会、技术委员会、秘书处构成,通过开放、成熟的治理,与企业、伙伴、开发者,共同建设的最具创新力的开源社区。数据显示,在开源以来短短一年半左右的时间里,openGauss社区已吸引了产业链100家核心企业的加入,覆盖政府、金融、运营商、能源、制造等行业;发展了20个SIG特别兴趣小组;超过2500名开发者参与技术贡献;全球下载量超过50万,遍布全球81个国家,558个城市……

在这个过程中,海量数据也第一时间与openGauss社区全方位合作。2020年9月25日,openGauss社区理事会正式成立时,参与前期筹划的海量数据成为首批18家理事单位之一,共同参与社区治理,推动社区生态建设。2021年12月28日,openGauss社区技术委员会升级,海量数据专家入选新的技术委员会委员,共同开展技术创新,持续构建技术竞争力。同日,openGauss社区分委会成立,海量数据成为首批共建单位,携手促进高校师生走进开源社区,加速成长为数据库产业人才……

据肖枫介绍,在深度参与openGauss社区建设中,海量数据在源码贡献和非代码贡献方面均有大量涉及,包括代码提交、Bug修复、新特性,缺陷提交、产品改进需求等,整体社区贡献仅次于华为,获得2021年openGauss最佳实践伙伴。接下来希望增加对社区的深层贡献,比如加强对产品缺陷的管理和修复、研发更贴近用户需求的功能和特性等,争取为社区贡献更大的价值密度,同时也提升海量数据自己的能力。

面向未来他表示,海量数据作为openGauss社区理事会首批单位之一,愿与社区、伙伴、用户一起努力,培育更多的openGauss人才,打造最好的企业级数据库!沿着客户的需求走,使openGauss社区生态发展更加壮大、更加完善,并与上下游伙伴携手并进,一起为数字新时代建设跑出“加速度”,逐梦数字时代的星辰大海。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论