对话南栖仙策CTO秦熔均：探索AI数字化应用场景让控制系统更“聪明”

2024-06-21 10:08

信息化观察网

编辑部

当前，全球科技创新进入空前密集活跃期，AI等新兴技术进入发展快车道。其中，生成式AI被视作实现人类野心的加速器，正逐渐成为各行各业的新宠，各行业企业都在尝试使用大模型来驱动自身业务的长效增长，力求在商业环境中赢得竞争优势。

当前，全球科技创新进入空前密集活跃期，AI等新兴技术进入发展快车道。其中，生成式AI被视作实现人类野心的加速器，正逐渐成为各行各业的新宠，各行业企业都在尝试使用大模型来驱动自身业务的长效增长，力求在商业环境中赢得竞争优势。对生成式AI应用有一定诉求的企业客户，该如何选择合作伙伴,又该如何搭上这列红利专车？基于此，赛迪网对南栖仙策CTO秦熔均进行了专访，通过聆听行业翘楚深度解读，帮助企业捕捉发展新机遇，明晰大模型技术落地应用的具体场景，谱写第二增长曲线。

640 (1).png

【人物介绍】

秦熔均，南京大学计算机科学与技术系博士，师从南京大学俞扬教授，主攻博弈与强化学习算法和理论。于2018年9月联合创立南栖仙策（南京）科技有限公司，担任CTO，负责面向现实业务的决策技术（离线强化学习）研发及落地应用技术探索，并领导公司团队研发了一套可用于多种实际业务场景的通用智能决策算法，基于该算法的通用性，智能决策技术目前已在工业制造、工业控制、促销等多种现实场景中落地验证，相比现实场景现有基线均有显著的提升。同时，为了促进智能决策落地应用，他也提出了一套开源离线强化学习基准库。2021年，他分别入选了福布斯中国U30s和胡润中国U30s创业领袖榜单。

赛迪网：能否请您简单介绍一下您的研究经历，另外，是什么促使您深入研究这些领域的？

南栖仙策CTO秦熔均：我的研究经历主要聚焦在强化学习这个大方向，尤其是动态环境下的强化学习及其应用，通过在强化学习调整优化策略，以应对环境变化带来的挑战。2016年，AlphaGo围棋AI与围棋世界冠军、职业九段棋手李世石进行围棋人机大战并获得胜利，使强化学习引起了极大的关注。强化学习是在给定的环境下，让机器自己学习如何通过选择一系列动作，来达成长期累计收益最大化的目标。从本质上说，这种算法学习的是策略模型，它在很多游戏中都有运用。也是从这个时候起，我对这个研究方向和课题产生了极大的兴趣。进入南京大学后，主攻博弈与强化学习算法和理论，早期基本是在做一些相关算法和理论的研究。2018年开始，我与导师联合创业，想把强化学习的算法和理论应用到不同场景中去，希望利用智能决策的这种技术和力量，帮助企业进行数字化改造，实现智能化管理。

赛迪网：您认为基于人工智能的控制与传统控制相比具有哪些区别？在哪些行业的应用最具潜力和影响力？

南栖仙策CTO秦熔均：基于人工智能的控制与传统控制相比，它们的最终目标是一致的，都是要把整个系统控制的更好。人工智能结合进来以后，有几个结合的点：一是用人工智能里面偏监督学习一类的技术，去做一些预测性维护，对设备可能会出现的一些问题，提前预警并进行修理。其次，还有一些和控制相关的偏预测一类的技术，如图像识别。另外，还有直接用人工智能方法去做控制的，比如直接用强化学习去控制机械臂或者一些特别复杂的关节。这些技术和传统的控制比起来，区别主要体现在以下几个方面：我们所处的环境是高动态的，如果用人工智能方法去实现控制目标，就需要它对环境具有相应的适应能力。人工智能的模型依赖于大量的数据进行训练和优化，不论是通过一批历史数据来训练，还是通过高保真的环境来训练，它都是通过训练得到的模型。如果我们的训练环境和实际应用的环境产生了差异，这就会对这个模型的效果产生一定的影响。如果在算法端，特别是基于人工智能控制的情况下，我们通过对算法做一些修改，就有可能能够达到更好的效果。而在环境比较确定没有太多随机因素的影响下，人工智能的控制与传统控制二者的效果差不多，甚至传统控制的方法会更简洁、原理更清晰。如果环境里面存在诸多不确定因素，这种时候基于人工智能的控制就会有更好的处理能力。现在人工智能的这些方法，会有一个比较大的缺陷，深度神经网络作为当前人工智能应用的首选模型，又被称为“黑盒”模型，多层隐藏结构，数据矢量化等因素让一些行业对大模型持观望态度，因为它不像传统控制，所有的机理都是明确的。而目前，在工业控制、化工和制造业等相关行业里面，基于人工智能的控制已经取得了显著的成效，为企业发展赋能添力。

赛迪网：您认为推动智能控制进一步发展的关键因素是什么？

南栖仙策CTO秦熔均：智能控制作为人工智能领域的一个关键问题，面临诸多挑战。我们在讲智能化的时候，其实需要两个前提，就是信息化和数字化。举例来说，我们原本的系统，可能需要利用自动化装置，来实现自动化控制。大多数情况下我们需要获取一些数据，通过收集一两天或者一两周的环境运行数据，我们就有希望来对系统进行改造。就目前而言，一个非常关键的因素，就是当前数字化整体水平还不那么高，有些环境下无法做到全系统、全流程的完全自动化控制的方式。如果我们做完智能模型以后再去部署，可能会遇到一些比较麻烦的人为因素问题，如果有些控制需要人工去实施，就可能会稍微影响效率。在短期未来，比较理想的情况是能让智能模型去控制，由人来进行监督，这样可以减轻操作者的劳动强度，提高劳动效率。另一个关键因素是已经具备信息化和数字化能力以后，需要什么样的数据，能用什么样的数据，这将是面临的一个比较大的数据方面挑战。先说“需要什么数据”这个问题，如果没有做好前期规划，我们需要把所有的数据都记录下来，事后再去做分析，带来额外存储开销和工作量。另一个问题是“能用什么样的数据”，它从某种意义上限制了我们所能采用的人工智能算法。很多时候我们面临的情况是数据量有限，数据覆盖范围小，这种数据条件对于算法能力的要求极高。基于数据驱动的决策，其目的是希望比以前做的更好，这就需要去尝试做一些历史数据上没有的操作，怎么从没有见过的数据上去推演，或者在数据少以及没有新数据支撑的情况下，去做一些新的决策，这是在智能算法方面面临的一个关键挑战。

赛迪网：现在大模型很火热，您觉得大模型和工业在哪些地方可以结合？

南栖仙策CTO秦熔均：“大模型热”已经延伸到工业领域，提到大模型就不得不提多模态，这也是近年来人工智能领域的热点话题。在人工智能领域多模态意味着算法可以处理不止一个模态的数据，可以在文本、图像、音频等，多种类型的数据中理解、转译、生成，有效提高大模型处理多种信息的准确性和鲁棒性。大模型和工业直接结合应用，现在看具有一定的挑战。因为传统工业里面，它可用的计算资源较少，对部署大模型具有很大挑战。部署大模型在工业里面有一些比较普遍相通的要求，我们觉得大模型很酷，有很强的能力，是因为它能够自动处理非常多的任务，在一个新的任务下，可能不需要重新训练，就能够直接用起来，那么我们希望在工业领域也能够有这样的能力。我们来看大模型的本质，先忽略这个模型的体积大小问题，它是在很多不同场景下预训练得出来的模型，如果我们能够在现在的应用场景里面部署相对小一点、能够适用更多范围的控制模型，那在工业领域将会有很多作用。比如，我们希望在A水厂训练的这个模型拿到B水厂，尽管可能有些设备的响应是不一样的，需要控制的数量也不尽相同，在这种情况下也能直接用并达到类似的控制效果。所以大模型的这种框架和范式具有很好的启发作用，能够让我们去做一些类似预训练模型用在不同的场景下工作。据我非常有限的了解，目前大模型和工业相结合主要在机器人相关的一些工业领域应用，包括无人车、物流或者机械臂控制等。如果是再传统一点的，具体到某个生产环节和各种生产线上面，大模型还不太方便部署，这个地方可能用到的是大模型思维，通过运用这种预训练模型能够在很多任务上表现的很好的思维框架去为整个行业赋能。

赛迪网：能否举例说明贵公司实际成功应用案例，在应用过程中遇到过哪些困难和挑战，又是如何解决的？

南栖仙策CTO秦熔均：很早之前我们就开始做落地应用，最开始是和互联网的一些行业进行合作，通过做用户建模，为他们的业务做辅助支撑。因为要把智能决策特别是以强化学习为主的这些方法用起来，它的一个关键限制因素就是现实环境里没有对应的仿真器来支撑强化学习这种基于大量试错的算法。在工业领域深耕以后，我们发现在工业领域去做这件事情，面临的挑战更大，工业领域的数据量远远少于互联网行业，我们就需要解决如何在很少数据量的情况下去做好这件事情。

2020年，我们抱着试一试的心态和一家车企展开了合作，帮助他们在不同驾驶工况下减排，使汽车排放符合相关标准要求，并且降得越低越好。这里面可参考数据非常少，仅有小几十条数据，我们就用很少的数据去帮助他们做具体的减排的应用。在前期过程中我们遇到了很多困难和挑战，主要是来自业务端，我们本身的研究方向主要偏向于人工智能，对工业里面的具体业务细节的了解程度不够深入。所以前期我们花了长达半年的时间，都是去匹配具体需求和对业务进行一定程度的理解。在具体的实施过程中，首先这是一个比较长轨迹决策的问题，大概有1800步，中间会不断地返回状态，然后根据这些状态去执行动作，执行1800个动作以后，才能得到最后具体的结果。这其实是非常具有挑战的任务，我们的算法工程师基本上每天都在调试，持续了将近三到四个月的时间，当我们拿着最终调试的结果去进行第一次实验的时候，就达到了汽车尾气排放标准。后来，我们业务范围逐渐聚焦到水务和高精尖装备控制。水务对我们而言相当于一个新的行业，但核心还是去做工业控制，主要是对一些设备仪器里面的组件去进行调整，我们的这一套解决方案中的核心算法是通用的，即基于构建虚拟环境，也就是建一个业务场景的模型，然后从中寻找最优的决策策略，最后再应用到具体的业务场景中去。在新的行业里面的挑战，主要是对业务的理解。有的时候碰到一些客户对我们的技术不太理解，我们就需要额外花一些时间去和客户进行沟通，尽管我们已经有一些成功的落地案例及对应的效果展示。业务理解到位以后，在开展工作的时候，还会面临一些数据上困难以及业务具体实施过程中特定场景下带来的一些不确定性的新挑战。目前，在水务行业我们是国内第一家能够去做污水全流程控制的企业，已在江苏附近的一些水厂做了部署，实际应用效果不错，帮助他们减少了不少能耗。

赛迪网：您对自己未来在这些领域的研究和发展有什么展望？

南栖仙策CTO秦熔均：工业的智能化是大趋势，我本身的研究方向就是在这种动态环境下更好的去做智能决策方面的研究。环境是动态变化的，不是一成不变的，变化的边界也不清楚。结合我以往的研究生阶段的经历，我可能会结合具体的业务场景在算法上面进行深入的打磨，进一步去抽象出来一些问题，希望能够在更多的场景中运用这样一套比较通用的方法，至少在一个行业里面，要有一套这样的方法，能够去解决问题。目前这个领域我们认为非常符合国家未来发展的方向和趋势，相关政策的出台利好整个行业，借此我们希望我国的工业能够尽快完成升级，实现从信息化到数字化，再向未来的智能化方向迈进。

结语：随着数字化加速，企业越来越注重大数据对决策的支持，智能决策已成为企业数字化转型中的必选方案。价值驱动下，智能决策拥有光明的发展前景，未来将持续向“应用深水区”迈进，拥有更大的展示舞台。

THEEND

免责声明：凡注明为其它来源的信息均转自其它平台，由网友自主投稿和发布、编辑整理上传，对此类作品本站仅提供交流平台，不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。若有来源标注错误或侵犯了您的合法权益，请作者持权属证明与本站联系，我们将及时更正、删除，谢谢。联系邮箱：xiali@infoobs.com

本月热门

精选文章

毛磊：“数字商业”时代下产业互联网全域应用服务赋能企业升级

10月8日
“数智领航合力共赢” 2021第五届中国软件和信息服务业年度风云榜再度开启

11月10日
智慧横店乡镇智治创新实践

3月8日
芯软智控入驻江苏“5G+工业互联网”公共服务平台

4月25日
想拉近与AR形象的距离？这家公司能够帮助你

12月7日
信诺时代 x Adobe 揭秘潮酷 IP 形象设计全流程

8月2日

热点资讯

湖北省政府重磅通知：构建有线电视、4G/5G等多种渠道协同的应急广播传输覆盖网

对话南栖仙策CTO秦熔均：探索AI数字化应用场景让控制系统更“聪明”

2025 信息化观察网

长按扫描二维码阅读原文