本文来自微信公众号“AIC商业导论”,作者/郝秋江、冀静。
作为AIGC领域的开年爆款产品,2023年1月ChatGPT发布刚两个月,其月活跃用户就达到1亿人,成为有史以来增长速度最快的消费应用,目前ChatGPT的月活跃用户已经超过15亿,跻身全球网站20强,其快速发展和带来对各垂直行业产业发展、社会心理和生活带来代际性影响。虽然,ChatGPT在6月出现了首次网站流量和独立用户访问量的月度下滑,同时其每天的后台高达70万美元的运营成本令大模型公司均要重新审视对于计算资源的投入和产出,但以ChatGPT为代表的AIGC为行业和社会发展已产生深远影响,其带来的生产力变革值得我们持续探究。
ChatGPT采用SaaS订阅的创新收费模式,打破了人们对于AI技术大多应用于嵌入式项目的固有印象,拓宽了AI企业的商业模式,进一步打开了AIGC商业空间。不仅B端用户对AIGC存在高需求,未来C端用户对AIGC技术的付费有望常态化。1本文从国内AIGC发展现状展开,并从个人、公司和行业三大视角对AIGC的应用进行重点剖析,以期为由AIGC引发的关于个人成长、社会和职场变化及危机等原因、机理进行解读和探讨。
一、国内AIGC发展现状
我国人工智能产业规模持续扩大,2021年人工智能产业同比增速30%,2022年人工智能核心产业规模达到5080亿元。我国人工智能企业数量目前已达4394家,占全球的15%,位居全球第二2。
图1我国人工智能核心产业发展趋势
虽然相比于国际先进科技公司,我国AIGC产业尚处于起步阶段,底层技术和商业化落地与国外相比有一定差距。当前国内AIGC产业可大致分为基础设施层、模型层及应用层,整体层级尚不够完整,模型层成为当前关键卡口,在一定程度上限制了上下层级的发展。但国内企业对于AIGC的投入热情较高,占企业数字化转型总投入的4.6%,并有预测显示2027年投入将会达到1456.6亿元。
当前,国内知名企业在AIGC模型领域进行了大举探索和布局。2022年8月,基于自主研发的产业级大模型ERNIE,百度推出AI艺术创意辅助平台文心一格,可以通过文心大模型的语义理解能力和图片生成能力为用户提供创意。同年9月,百度开发多款应用内容生产领域的技术和产品,如“百度数字人”等。在2022年初,阿里巴巴达摩院启动通用型人工智能大模型M6项目,成为世界上最大的中文多模态模型,并已在超40个场景中实现商业化落地,成为阿里重要的科技基础设施,在电商服装设计、工业级文案生成和支付宝搜索推荐业务中形成应用。未来,阿里巴巴计划在钉钉APP中引入类ChatGPT的对话机器人。京东在AIGC领域的布局上则更加聚焦文本、数字人生成和通用型Chat AI等技术,其中在文本生成领域,京东发布的商品文案生成模型K-PLUG,帮助商家自动生成的商品文案,人工审核通过率超过95%。2023年2月,京东宣布将推出ChatGPT产业版——Chat JD,旨在打造高频、刚需的产业版通用ChatGPT类似产品。
同时,国内人工智能产业也涌现出一批创业公司,如小冰科技、聆心智能、影谱科技、澜舟科技等。其中小冰科技最早提出AI Being(人工智能数字员工)定义,并开发了小冰框架,用于快速生成符合条件的虚拟人,目前已经活跃在了诸多场景中,如万科集团年度优秀员工“崔筱盼”、红杉中国首位虚拟分析师“Hóng”等。在文本方面,小冰金融文本生成产品覆盖约90%的机构投资人。据不完全统计,小冰创建并承载的人工智能交互主题,拥有全球人工智能交互总流量的60%,超过亚马逊、谷歌及苹果同类产品的流量总和。4
2023年3月2日,Open AI宣布允许第三方开发者通过API将ChatGPT集成到他们的应用程序中,这意味着没有财力基础的小型企业和个人开发者面临新的机遇,以及人工智能内容生成技术将在国内外得到更广泛的普及,对于人们日常生活产生更深入的影响。5
二、应用场景说明
01
AIGC的特点,以及是否合适应用场景的判断指标
有关AIGC的定义,并没有统一规范的定义。国内产学研各界的理解是“利用人工智能技术自动生成内容的新型生产方式”,国际上的对应术语是’AI-generated Media’,其定义是“通过人工智能算法对数据或媒体进行生产、操控和修改的统称”。因此,AIGC是指从内容生产者的角度对内容进行分类的一种内容类型,同时也是一种自动化生成内容的技术。6
图4 AIGC特点及企业需求评估特征维度模型
02
个人应用场景示例
由于自然语言的知识获取是人类学习最自然的方式,自然语言的方式比鼠标、键盘等工具对于所有人在交互和能力获取上都是质变的提升。在ChatGPT问世之后,知识的具体载体和样式的创建门槛大大降低,任意篇幅的文字、音频、视频都可以瞬间转换且快速被整合、调用,以供学习者学习,大量的信息碎片可以被AI进行条理化整理,形成较为完整、规范的信息呈现在用户面前。“机器生成+人脑筛选”在可预见的将来,会成为人机协作的重要方式,人们可以通过AI生成的合理、差异性选项进行倾向性选择,从而将生活和学习中诸多“问答题”改为“选择题”,去除基础性重复思考,强化和发展人本属性。
个人生活
在个人学习中,Khan Academy(可汗学院)是一个来自美国的非盈利的教育平台,在接入GPT-4后能够充当虚拟导师以及教师助手两方面的角色,Khan Academy创始人更提出生成式AI会是最好的个人化家教;在个人生活中,GPT-4还与盲人和弱视辅助公司Be My Eyes合作,转变原来用户和公司代表视频电话提供视觉帮助的形式,随时随地帮助弱视人群看到美好世界。
图5 GPT-4与可汗学院及盲人和弱视辅助公司Be My Eyes合作提供服务
未来,AIGC必然会催生出学习型社会的应然样态。在舒尔茨的人力资本理论中,技术发展、终身学习和学习型社会是“原因-对策-结果”的依存关系。AIGC技术以人的全面发展为基点,催生出终身学习的新样态,即人机交互学习型组织、混质多元化知识环境以及数字侧写个性化路径,助力人与社会共同发展。7
个人创作
在绘画方面,Midjourney(MJ)、Stable difusion(SD)、Leonardo.ai、Novelai是市面上四大主流AI绘图工具。Midjoumey根据文本提示生成视觉效果,它可以快速生成一组连贯图像。Stable Difusion相比之下不擅长生成动漫图片,但对于摄影、油画、水彩、概念艺术等风格都能全面掌握,更具全能性。Leonardo.ai可以使用现有模型或自己训练AI模型来生成各种生产就绪的艺术资产。Novelai几乎只能生成动漫、手绘、素描、CG风格图片,但在这些风格的人像上出图率更高,是专精型选手。同时,在工业设计领域,ChatGPT也可以提供更加别具一格的思路。
个人社交
在个人社交方面,人们可使用AI分身制造自己的数字化网络形象,完成人力难以完成的量级、专业的社交活动或职业补位。如,2022年全国两会期间,真人王冠与A超仿真主播王冠同屏《“冠”察两会》,用全新的方式带给观众不少惊喜。节目中,“AI王冠”作为控场主持人,连线财经评论员王冠,不仅表达清晰、手势自如,与真人王冠配合十分默契,保证了节目节奏的平稳,还向观众传递了层次更加丰富的重要信息。
图6:“AI王冠”制作与直播现场
AI是指利用人工智能技术,根据真人的声音、外貌、性格等特征,创建一个虚拟的数字化代理,可以与人类进行语言、视觉、情感等多模态的交互,具体可通过以下五步实现自由的AI分身。
图7:AI分身制作技术步骤
03
公司应用场景示例
企业应用场景可根据企业经营管理各重要子部分进行展开,包括企业营销、企业客服、企业生产、企业办公、企业人力五大部分。其中,企业营销可拆分为五个步骤,AIGC可成为从认知到复购的全链路策略支持助手;企业客服部分,AIGC+客服不仅创新前端客服沟通,更着眼于线索留存和规则优化;企业生产部分,AIGC+ERP覆盖从场景驱动到预测分析的各个环节,用AI赋能业务管理过程加快商业价值;企业办公部分,AIGC+办公协同以目标为导向,可实现赋能创新与更进一步的自动化;企业人力部分,AIGC+人力资源,通过从招聘到离职全链路的效率与决策变革来撬动HR变革。
企业可根据下图,借助AIGC核心价值,赋能不同模块的组织和人力活动。
图8:企业经营管理AIGC赋能按图索骥
04
行业应用场景示例
教育行业
人工智能为教育行业赋能,助力学生思维能力跃升,认知突破。AI通过辅助学习与个性化教育、跨学科学习与综合技能培养、深度学习与高阶思维能力提升以及拓展认知边界与创新思维模式达到从低能到高能、从单能到多能到超能到异能的提升。
当前AI教育主要应用于课堂教学、课后辅导、以及学生评估体系的建立等方面。在课堂环节,AI技术一方面可以通过智能黑板、数字教师等方式提升教学环境与教学效率,另一方面,针对个别实验学科,人工智能技术可以模拟实验实景,在保证实验安全、节约实验成本的同时让学生身临其境的参与实验。在课后环节,AI技术能够为学生提供自主性学习体验,针对不同学生的学习能力与学习风格,生成贴近学生需求的个性化课后服务。对教师而言,AI一方面有助于对备课、阅卷、教研等环节降本提效,另一方面能通过生成大模型对学生建立全面的学习评估体系。
在可能的将来,ChatGPT会倒逼教育评价改革深化,将有可能在打破人类对知识垄断的基础上,冲击学校教育方式的权威性、大大增加学生学习途径、极大扩充学生可习得的知识边界。8
医疗行业
AI正在医疗行业强效助力新一代医疗设备和生物医学研究。如NVIDIAClara等适用于医疗健康行业的智能计算平台可给学校、医院、生物医药公司提供用于医学影像、基因组学、患者监控和药物研发,并可部署在嵌入式系统、边缘等任何地方,助力医疗健康行业进行创新并加快实现精准医疗的目标。
总结来看,对于医疗行业至少有十项应用。(1)AI药物设计:包括对化学空间的高效搜索和生物活性预测,推动新药的发现和设计。(2)生物行为模型:模拟和预测个体或种群的生物行为(3)健康生活指导:分析个体的生活习惯和健康数据,为用户提供个性化的健康生活建议。(5)动态生理监控:实时监控个体的生理数据,并预警可能的健康问题。(5)心理状态解读:通过对人类行为和语言的深度理解,揭示个体的心理状态,为心理健康管理提供支持。(6)生物网络解析:模拟并分析复杂的生物网络,比如代谢网络、基因调控网络等。(7)基因密码破译:解码基因信息,推动精准医疗的发展。(8)预见性医疗:根据患者生理参数和医疗记录预测疾病进程,有助于早期干预治疗。(9)量身定制的治疗:根据患者的基因型和表型信息生成个性化的治疗方案。(10)全球疫情监控:根据全球各地的疾病数据预测疫情的发展和变化。
图9:医疗行业AIGC十大应用
金融行业
金融行业是人工智能的主战场和新发地。AI可赋能的重点方面包括,更智能更安全的金融服务、对市场波动的计算加速、数字支付的欺诈预防、欺诈系统检测等。
(1)协助实现更智能更安全的金融服务。保险公司采用积极的数字化转型,以及完全由分析驱动的方法。如:利用AI实现对简单案件的自动化案赔处理,可减少复杂案件处理时间来提高客户满意度。
(2)加速交易计算。借助芯片公司GPU技术能力提升,金融机构能够利用AI和高性能计算(HPC)从大量数据中进行学习,并对市场波动做出快速响应。
(3)用于数字支付的欺诈预防策略。AI帮助银行更好地检测和预防支付欺诈,在在线支付、移动支付、店内支付、企业对消费者(B2C)和企业对企业(B2B)等支付方式和交易环节进行检测,并改进反洗钱(AML)和了解客户(KYC)系统的流程。
(4)助力欺诈模型升级和能力扩展。市面上已推出多种可扩展的AI模型如NVIDIA TritonTM推理服务器等,可以帮助金融公司系统模型提升欺诈检测能力、同时降低误报率。PayPal、美国运通和中国平安都在利用AI改善客户体验、降低成本以及打击欺诈。以运通为例,运通已通过采用此增强型实时欺诈检测系统提高准确性,并更好地保护客户和商家。该系统在2毫秒的紧延迟要求下运行,与基于CPU的配置(无法实现目标)相比,其性能提升50倍。通过结合GPU加速的LSTM深度神经网络模型和他们长期应用的梯度提升机模型(GBM),最高可将特定细分市场上的欺诈检测准确率提高6%。
游戏行业
AI在游戏全链路的研究与应用:横向,覆盖游戏制作、运营及周边生态全生命周期,纵向,AI正拓展更多元的游戏品类。在产业端,AI打破游戏产业“成本、效率、质量”的不可能三角;在开发者端,AI的运用在游戏剧情设计、美术建构、场景搭建、原画绘制、角色配音等方面大幅缩减研发成本;在用户端,AI帮助全新游戏品类与游戏个性化定制。
本文列举三款典型与游戏和创作相关的AIGC产品:荒野大镖客2、Omniverse Machinima和NVIDIA RTX Remix。
在游戏《荒野大镖客2》中的NPC智能交互系统,每个NPC都拥有属于自己的生活,能够根据情景等多种因素发起对话与互动。玩家和NPC的交流交互不再是设定好、流程式,而是自由度极高、完全开放的。人工智能也催生更多游戏品类,微软推出的《Microsoft Flight Simulator》是一款由AI制作的游戏,将二维卫星图像生成一个逼真的三维世界。最大差异是实时生成内容,包括地图、景物、气象等等,这些都来源于AI技术的支持。人工智能还充当了玩家导师的角色,《王者荣耀》游戏内“绝悟试炼”玩法中,王者绝悟与玩家在真实对战环境中交流协作,传授职业级的策略与操作技术,帮助玩家迅速熟悉英雄操作与游戏玩法。
OmniverseTM Machinima测试版是一种参考应用,可助力用户进行实时协作,对虚拟世界中的角色及其环境进行操作处理并实现动画化。对于希望从这些虚拟世界内部利用高保真渲染器的技术艺术家、内容创作者和行业专业人士,Omniverse Machinima能够提供可轻松制作游戏动画的工具。而用户借助RTX Remix MOD平台,可以轻松为经典游戏打造出惊艳的RTX重制版。Mod平台基于NVIDIA Omniverse构建,可让MOD爱好者轻松截取游戏素材,并用提供的AI工具生成场景、武器材质等相较于以往需要大量人力架构和渲染的工作。
图10:荒野大镖客2、Omniverse Machinima和NVIDIA RTX Remix
媒体行业
AIGC可以帮助新闻媒体工作者智能生成报道,将部分劳动性的采编工作自动化,更快、更准、更智能地生成内容。新闻行业中,AIGC技术赋能较强的三个类别为:对话新闻、无记者新闻和辟谣新闻。其中对话新闻是通过对话的形式呈现新闻,通常会有两个或多个角色,通过交流观点和分析来呈现新闻事件,其特点是更具有交互性和立体性,AI可生成丰富的角度进行对话,增加广泛度和趣味性;无记者新闻是通过机器人、Al等自动化技术来收集、编辑和发布新闻的方式,其特点是无需人力,能够快速、准确地发布新闻,并减少人为干预;辟谣新闻是自动识别和分类新闻,对新闻进行真假判断、溯源追踪与辟谣发布,通过数字驱动,提高辟谣准确率,帮助公众及时了解和纠正虚假信息。
其中与传统新闻相比,AIGC新闻具有广泛汇集数据,精准抓取;快速组稿,精准加工;热点追踪,传播分析的优点;然而,虽然大幅降低了时间和人力成本,AIGC新闻仍然具有模式固定、适用面窄、缺乏思考能力、缺乏创造力的缺点,传统新闻的内容可靠性、报道深度和意义深挖能力更加有保障。
三、展望
2022年末至2023年3月,全球在为生成式AI带来的产业变革而狂欢,同时“ChatGPT取代人类”、“AI助推欺诈和恐怖主义”、“打开AGI潘多拉魔盒”等讨论引发了各界人士关注,AI过程的“黑盒”属性也增加模型拥有公司具有绝对控制和垄断能力的担忧。年初ChatGPT风靡之际,由马斯克、图灵奖得主Bengio等联名发起的暂停高级AI研发的公开信,现在签名已经上升到9000多人。美国非营利组织人工智能与数字政策中心(CAIDP)也要求联邦贸易委员会(FTC)调查OpenAI是否违反了消费者保护规则,并禁止其进一步发布GPT-4。这也自下而上影响了政府的政策和法规的制定,4月意大利以违反欧洲严格的数据隐私法GDPR为由暂时禁止了ChatGPT;欧盟也提出草案,计划将ChatGPT视为高风险的AI系统进行监管。目前看来,以“善”来引导技术的创新和应用,推动、规范和纠偏AI是助推产业可持续发展的根本办法和共同价值观。
从ChatGPT的使用特点进行分析,ChatGPT可能带来7个方面的风险:
图11:以ChatGPT为例的风险示例
(1)人类冲击风险。人工智能对于文字、图像、音频等知识加工、艺术创作速度远高于人类,产生“社会性职业替代”危机。理查德·鲍德温在书《失序:机器人时代与全球大变革》中提到“过去的几次经济转型并没有导致永久性失业。在第一次工业革命期间,自动化和全球化使农业领域的就业岗位减少,但在工业和服务业领域创造了新的就业机会。同样,从1973年开始的服务业转型导致工厂的工作机会减少,但服务业领域出现了新的就业岗位。”但与以往的工业革命不同,人工智能带来的是颠覆性的高效率,这很可能会使得现有岗位数量、职业类型大量减少,同时带来能够借助AI能力工作的岗位和职业需求提升。
图12莫拉维克的人类能力与AI能力地形图:人工智能能力的扩展
海拔高度代表这项任务对计算机的难度,不断上涨的海平面代表计算机及人工智能现在能做的事情
(2)隐私安全风险。人工智能需要大量数据、模型作为输入,用户使用过程中存在个人隐私泄露风险,商业组织和国家信息泄露威胁企业和国家安全。由于人工智能综合分析的特征,民众开始担心人工智能技术黑箱化。
(3)错误信息与偏见风险。人工智能训练样本数据的不同,导致其可能有对人类特定群体的主观或客观偏见影响公平公正,在医学或法律领域的错误或直接导致伤害。此时,人工智能生成“系统性偏见”,而人类在接受这些特征后形成了数字污名。同时,ChatGPT是一种无感知的语言模型,对输入数据的处理是基于在训练数据中的出现频率和语言模式,由于训练数据之丰富,ChatGPT可能存在种族、文化和价值冲突的风险。2016年微软研发的聊天机器人Tay就曾经因为大量有害数据成为“种族歧视者”。
(4)用户滥用风险。人工智能的行为与影响超出研究者、设计者、应用者所预设、理解、可控的范围,用户对于其产生的不当内容或进行造谣、欺诈等不当行为。
(5)用户与机器交流受到伤害风险。用户在交流中受到的伤害不仅来源于ChatGPT可能产生的不良信息,还包括对机器产生依赖性等。
(6)知识产权风险。知识产权风险包括ChatGPT是否会侵犯他人的知识产权和ChatGPT产生的内容是否具有知识产权两个方面,在追责时可能会在开发者和使用者的责任界定上出现争议。
(7)垄断风险。新冠疫情造成世界出现了空间隔离,去全球化的舆论趋势不断增加,大国之间科技竞争和科技封锁逐渐凸显,人工智能公司对于技术、资本要求极高,很容易产生“数字垄断”的情况。9
为了降低人工智能可能带来的风险,企业和个人应该意识到人工智能并非万能,目前人工智能已经找到一些问题的解决方案,但也只是可计算问题的一小部分。未来,个体需要以“创造性价值以及高效利用工具解决问题”为原则,从三个方面推动能力培养。首先是把握人类核心优势,以人类独有优势建立差异性创造性工作能力;其次是提高技术能力,了解机器的运转原理,知道如何与机器互动,一些员工要被机器取代,另一些员工要与机器合作;最后,需要掌握数据运用,在这些机器生成的数据里工作。人们需要具备数据知识,才能看懂、分析和利用庞大的信息库。
图13人工智能与人类共存四象限
未来人工智能可以围绕5个要点进行增强工作:(1)感知调谐,对输入和输出进行微调以获得更好的结果;(2)跨模态互操作,即能够理解图像或声音提示,并能够以文本、声音或图像的形式响应;(3)动态化学习,使其能够根据用户的反馈和其自身的经验进行学习和改进;(4)语境感知,意味着未来AI可以更好地理解用户的语境和意图,以产生更准确和相关的回答;(5)伦理透明,即清楚地说明其决策的伦理基础,以提高用户对其决策的理解和信任。10
在具体的行动策略部分,全球政府和商界正在共同寻求促进生成式AI产业良性发展的方法。在给予人工智能适当包容的同时,细化规则,增加企业行为的确定性,以求在发展与安全之间找到平衡。我国于今年8月已完成《生成式人工智能服务管理暂行办法》的正式施行,是全球首部生成式AI立法,从法律角度监管、规范和保障。美国国会两党于6月共同提议设立国家AI委员会,欧洲国家加速跟进,规范杜绝企业隐私收集等过度行为。印度电子和信息技术部发布声明,阐述印度对人工智能发展及安全方面的立场,以期AI拉动印度商业的增长。企业方面,微软、谷歌等公司则提出负责任AI(RAI):希望形成一套安全的、可靠的和合乎道德的开发、评估和部署AI系统的方法,兼顾稳固、弹性、安全、隐私、透明等。
中美企业布局在全球领先且厂商百花齐放,但双方在技术布局和企业投入重点存在差异。相较于美国人工智能技术布局以大型厂商和创业公司为主,不同企业能力呈现出“先发者”“挑战者”差异;中国以“国家队”+创业独角兽企业完成综合布局和垂直应用的全面布局,有望在生态层面激发大量应用落地和商业化模式创新,形成有中国特色的人工智能发展道路。也正因为中国人工智能的特殊布局,国家政策层面能够快速响应出台法案让行业发展“有法可依”,为产业健康发展保驾护航。
引用:
1.史占中,郑世民,蒋越.ChatGPT与AIGC产业链[J].上海管理科学,2023,45(02):12-14.
2.中国互联网发展报告(2023)
3.2023年企业AIGC商用落地应用研究报告
4.许雪晨,田侃,李文军.新一代人工智能技术:发展演进、产业机遇及前景展望[J/OL].产业经济评论:1-16[2023-08-08].https://doi.org/10.19313/j.cnki.cn10-1223/f.20230705.001.
5.https://baijiahao.baidu.com/s?id=1759209744673321937&wfr=spider&for=pc.
6.许雪晨,田侃,李文军.新一代人工智能技术:发展演进、产业机遇及前景展望[J/OL].产业经济评论:1-16[2023-08-08].https://doi.org/10.19313/j.cnki.cn10-1223/f.20230705.001.
7.袁磊,徐济远,苏瑞.AIGC催生学习型社会新格局:应然样态、实然困境与创新范式[J/OL].现代远距离教育:1-15[2023-08-08].https://doi.org/10.13927/j.cnki.yuan.20230721.002.
8.杨小微,王珏.ChatGPT应用于基础教育的机遇、挑战与应对——“刷题式”教育、学生学习、“超级教师”及教育公平[J/OL].新疆师范大学学报(哲学社会科学版):1-11[2023-08-08].https://doi.org/10.14100/j.cnki.65-1039/g4.20230801.001.
9.哈尔滨工业大学:ChatGPT调研报告
10.清华大学:AIGC发展研究1.0版
作者 郝秋江系亚信咨询丨艾瑞数智咨询 南京办公室 咨询经理
作者 冀静系亚信咨询丨艾瑞数智咨询 北京办公室 高级咨询顾问