GPT-4:人工智能的新篇章

刘兴亮
AI朝着革命性和颠覆性改变传统工作方式的方向又大大迈进了一步,一个机器和算法生成的AI时代开始了。而人类最核心的竞争力和技能或许不再是编程、计算,甚至分析能力,而是和大模型的对话能力。

本文来自微信公众号“刘兴亮时间”,作者/刘兴亮。

01

相信这两天你一定被这则消息刷屏了——OpenAI发布了GPT-4。

在聊GPT-4之前,我们先来介绍下GPT。

进入21世纪,随着人工智能的发展,自然语言处理(NLP)领域取得了显著进展。OpenAI作为人工智能前沿企业,推出了GPT系列的自然语言处理模型。从2018年发布GPT-1,到如今的GPT-4,每一代模型都在数据规模、性能和多样性方面取得了突破性的进展,其中被大家所熟知的是基于GPT-3.5的聊天机器人——ChatGPT。

02

和上一代相比,GPT-4带给我们最大的震撼就是多模态模型,通俗点说,就是不仅可以像GPT-3.5一样进行文字对话,还可以进行视觉逻辑推理——识别图像并基于上下文应答相关问题。

比如在下图中,GPT-4解释了图片的不寻常之处——一名男子正在行驶中的出租车顶熨烫衣服。

360截图16251112669372.png

关于两者的区别,打个更直观的比喻:GPT-3.5更像一个瞎子,只能听人说,GPT-4有眼睛了,不仅可以听人说,还能看图片了。这就好比一个医生,过去只能听患者口头描述病情,现在可以看CT、B超等影像结果了,这必须是一个里程碑。

因为这使得GPT-4具有更多的商业化应用和集成,从而使其在各种场景中更具价值。同时,它可能与其他AI系统更好地协同工作,从而为用户提供更加丰富的体验。

目前Open AI还没有将GPT-4中的图像识别能力开放给普通用户,但已经为一些应用提供了支持。比如,OpenAI正在与BeMyEyes密切合作。

BeMyEyes是一家丹麦公司,致力于为盲人或视力低下的人提供技术帮助。BeMyEyes在接入了GPT-4后,视障人群就有了一个「虚拟志愿者」,可以用来描述服装的外观、识别植物、阅读地图、翻译标签等等。

当然,目前容易犯错的AI还难以完全取代人类志愿者,但也大大提升了效率。

03

第二个区别在于,GPT-4能够识别和处理更复杂的指令。

一方面,量上来了——GPT-4能够读取或生成的文字篇幅高达25000词,远超篇幅上限为3000词的ChatGPT。这意味着GPT-4可以更好地用于提取摘要、长篇内容创作、文档搜索和分析等应用场景。

另一方面,质也提高了——GPT-4具备更高的准确性、生成质量和任务完成能力。

比如,我分别让GPT-3.5(左)和GPT-4(右)给亮三点写3句slogan,要求是简短且押韵。从结果来看,不管是精简程度还是押韵效果,GPT-4都完胜。

360截图16251112669372.png

我们再来看看官方的报告:OpenAI称,GPT-4与上一代GPT-3.5相比,在日常的对话中所体现出的差别并不大,但是在各项标准化考试中,GPT-4的表现明显优于上一代,已经达到了人类的水准。

例如在GRE考试中的数学部分,满分是170分,GPT-4获得163分,而上一代GPT-3.5得分为147分,在GRE语言部分,GPT-4得分为169分,GPT-3.5得分为154分。

360截图16251112669372.png

这还不算什么,在一次模拟律师考试中,GPT-4的分数在应试者中排名前10%,而GPT-3.5的得分排名在后10%。

360截图16251112669372.png

也就是说,上了半年辅导班后,GPT的成绩从班级倒数第十名,跃升为班级前十,这太惊人了!你说,应试教育该怎么办?

04

第三个区别在于,GPT-4对误导性输出和不恰当内容有更好的防范机制。

比如,我分别让GPT-3.5(上)和GPT-4(下)讲讲关公战秦琼的故事。GPT-3.5一本正经地胡说八道,很容易产生误导;GPT-4就严谨了许多,多次明确告诉你——这是胡说的,别信。

360截图16251112669372.png

360截图16251112669372.png

官方数据也表明了GPT-4在防范机制中的提升。其中,响应被禁止内容请求的可能性降低了82%,产生事实响应的可能性提升了40%,根据政策响应敏感请求(如医疗建议和自我伤害)的频率提高了29%。

05

从GPT-3.5到GPT-4,有点从DOS直接升级到Windows 95的气氛。这家伙升级迭代的太快了。

那些模仿者和追随者们,刚把摩托车组装好想追汽车,没想到汽车的标还没贴上的时候,人家领先者已经起飞了。唉,这摩托车怎么去追赶飞机啊!

AI朝着革命性和颠覆性改变传统工作方式的方向又大大迈进了一步,一个机器和算法生成的AI时代开始了。而人类最核心的竞争力和技能或许不再是编程、计算,甚至分析能力,而是和大模型的对话能力。

当前社会的主要矛盾已经转变为AI的能力和人类想象力之间的矛盾。

06

最后,还是让我们畅想一下,未来GPT还会怎么发展或者说会产生什么样的影响呢?

首先,肯定是更强大的分析处理能力以及更精准的应答能力。

其次,多模态和跨领域融合:比如,在现有的文本、图像的基础上加上音频、视频等,这将有助于模型在更多领域发挥作用,实现真正意义上的人工智能。

此外,还要有低资源场景的适应性:随着算法和硬件技术的进步,之后的GPT版本可能在配置相对较低的设备上也能表现出色,比如老人机及其他入门级智能手机、智能家居等物联网设备、低端笔记本电脑和平板电脑等,使得更多用户能够享受到先进的自然语言处理技术带来的便利。

当然,随着人工智能在各个领域的广泛应用,未来的语言模型更需要关注安全性和伦理问题,确保其在保护用户隐私、减少偏见和歧视等方面取得进展。

最后,语言模型的发展将对各个行业产生深远影响,从而推动相关政策和法规的制定和完善,这将有助于确保人工智能技术的发展能够造福整个社会。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论