一、数据分析能力是考核CIO和CTO的硬指标
最近“新基建”的话题越来越热,“新基建”主要指发力于科技端的基础设施建设,主要包括七大领域:5G基建、特高压、城际高速铁路和城际轨道交通、新能源汽车充电桩、大数据中心、人工智能和工业互联网。“新基建”和大部分企业相关的更多的是大数据和人工智能。
根据普华永道2017年发布的报告,到2030年,人工智能对全球经济的贡献额将达到15.7万亿美元,超过中国和印度目前的经济总产值之和。2018年麦肯锡(MGI)发布报告《人工智能对全球经济影响的模拟计算》,认为人工智能到2030年,可能使全球GDP每年增加约1.2%。
数字经济是经济发展的新引擎已是共识,身为企业CIO和CTO的IT领导者,如何在浩浩荡荡的数字经济大潮中,用数据分析能力为企业保驾护航,使企业在数字时代扬帆远航,是对每一名CIO和CTO的考验。
企业数据的的利用,可以分为三个阶段:
●数据生产:业务(可以是传感器、交互设备等硬件,也可以是ERP等软件)产生数据,数据进入关系型或者非关系型数据库存储,再供业务使用;
● 数据分析:汇集数据,并进行分析,辅助业务人工决策;
●人工智能:将人工智能算法应用到数据分析中,不仅仅分析,还可以辅助业务自动决策。
目前,大部分企业还处在数据生产与数据分析的阶段之间,迫切需要建设完善的数据分析能力。企业在建设数据分析能力的时候,由于数据量巨大,往往面临数据存储和算力的挑战,而云的弹性可以解决这一问题,所以数据分析能力向云上迁移是一个趋势。企业建设云的时候,也必须考虑数据分析能力的建设,并要为人工智能打下基础。
二、基于云构建数据分析能力,方式、优点及挑战全面分析
基于云构建数据分析能力,可以有以下三种方式。
1. 使用公有云数据分析服务
目前,各大公有云都提供数据分析服务,并且功能越来越强大。
使用公有云数据分析的优点是:
●按需付费;
●不需要底层的技术投入,更多的专注业务层面;
●几乎不受存储数据量的限制,公有云的存储资源池可以视为无限大;
●服务成熟稳定;
●公有云一般都提供人工智能服务,在使用数据分析的服务同时,也可以很快进入人工智能阶段。
使用公有云数据分析挑战是:
●容易被公有云锁定,当大量的数据在公有云上的时候,当对公有云服务使用很熟练的时候,如果要再迁移,难度较大;
●长期使用公有云数据服务,费用会越来越惊人;
● 需要考虑数据安全和合规问题。
2. 使用开源产品自建数据分析能力
使用开源产品自建数据分析能力,像hadoop等开源产品,经过常年的发展,也比较稳定。
使用开源产品自建数据分析能力优点是:
●数据安全得到保证,数据在自有的数据中心,数据安全性更高;
●费用相对比较低;
●不会被厂商锁定。
使用开源产品自建数据分析能力,因为需要组建技术团队,运营相关服务,所以挑战是:
●对技术工程师要求很高,要找到合适的技术工程师,往往面临很大的挑战;
●碰到问题,往往得不到可靠的支持;
●需要从头建立运营体系,从硬件到系统,从平台搭建到安全,都要从零开始搭建。
3. 使用商业产品自建数据分析能力
使用商业的数据分析产品,自建数据分析能力,这样做的优点是:
●数据安全得到保证;
●如果已经有商业的私有云,比如VMware,可以充分利用现有的资源,基于既有基础设施推进AI实践。
●费用低于全部使用公有云,可以在成本和可靠性之间取得平衡;
●相对开源软件,对技术人员要求较低;
●可以得到厂商可靠的技术支撑;
●有利于使用混合云方式,即可以得到公有云的弹性,也得到私有云的安全性和经济性。
挑战是:
●需要精选供应商,确保供应商是主流供应商,符合技术趋势,满足自己的要求。
根据Wikibon研究数据,全球大数据市场规模将从2018年的420亿美元增长至2024年的840亿美元,年复合增长率为12.3%,可见对商业解决方案的采用,也是行业趋势。
综上所述,对于大多数企业来说,使用商业产品自建数据分析能力,是不错的一条路径,而英特尔联合VMware推出的数据混合云数据分析解决方案,可以避免重复投资,不但支持高级机器学习,而且还能为广泛的工作负载提供统一的云操作模型,助力企业应对数据分析和人工智能挑战。
三、英特尔和VMware双剑合璧,高效率解决数据分析难题
英特尔联合VMware推出的数据混合云数据分析解决方案,结合了最新的英特尔硬件创新、VMware虚拟化软件产品组合、容器编排和人工智能工具。英特尔推出的基于英特尔®至强®可扩展处理器而优化的深度学习堆栈,能够加速数据分析应用开发。英特尔将服务与经过优化的软硬件相组合,帮助云服务提供商满足人工智能的性能和扩展要求,助力云服务提供商提升市场竞争力。
1. 解决方案优势
英特尔联合VMware推出的数据混合云数据分析解决方案优势如下:
●易于部署:使用深度学习参考堆栈和VMware Enterprise Pivotal Container Service (PKS) 部署的容器解决方案,快速、轻松地实施人工智能。
● 面向未来:VMware vSAN超融合基础设施上的计算和存储资源已准备就绪,可以根据需要进行横向和纵向扩展。
●混合云友好:随着业务需求的变化,工作负载可以部署到本地或公有云,也可以借助 VMware Cloud Foundation混合部署在本地和公有云。
●加速推理:强大的计算能力加上集成了已经过优化的人工智能构建模块,该解决方案不但支持使用SQL和NoSQL数据库的传统企业级数据分析工作负载,还能够加速推理工作负载,从而缩短获取洞察的时间。
2. 云原生的深度学习堆栈,加速数据分析应该开发
英特尔推出的深度学习堆栈,是基于英特尔®至强®可扩展处理器而优化的平台,高集成度的高性能开源和容器化堆栈。该堆栈的开源社区版本旨在确保人工智能开发人员能够轻松访问英特尔?平台的所有特性与功能。
3. 为广泛的工作负载提供统一的云操作模型
英特尔提供了一个参考架构,让云服务提供商可以轻松地将人工智能功能添加到自己的云堆栈中,并针对深度学习做了指令层面的优化。
Kubernetes可用于将人工智能工作负载编排到虚拟机,英特尔?至强?可扩展处理器针对工作负载进行了优化。云服务提供商还可以自行选择编排器,例如使用OpenStack代替Kubernetes。
英特尔与数据分析和AI相关的各种优化特性能够充分透传给上层应用。英特尔推出的DLBoost深度学习指令,专门用于加速AI运算。英特尔推出的OpenVINO (开放视觉推理及神经网络优化) 软件平台是一个用于快速开发深度学习视觉应用的工具包。英特尔MKL-DNN是一套开源的性能增强库,能够提高在英特尔架构上运行的深度学习框架的速度。对于TensorFlow,英特尔和Google携手合作以确保该框架能够利用英特尔?至强?处理器平台的硬件优势。
四、总结:使用英特尔优化方案,进入从数据分析到人工智能的快车道
预计到2025年,数据量每12小时就会翻一番,作为企业CIO和CTO的IT领导者,必须建设数据分析能力以提高企业竞争力。数据分析能力需要考虑速度、弹性及投资回报率(ROI)。英特尔联合VMware推出的混合云数据分析解决方案,兼容已有的VMware私有云投入,由于有硬件的加速和优化,让数据分析速度可以提升数十倍,利用公有云和私有云的弹性,在性能和成本之间实现平衡,充分利用资源效率,能够获得高投资回报率。英特尔人工智能参考架构能为广泛的工作负载提供统一的云操作模型,让云服务提供商可以轻松地将人工智能功能添加到自己的云堆栈中。使用英特尔优选方案,企业将进入从数据分析到人工智能的快车道。