本文来自千家网。
生成式人工智能从一个流行语到一个有形的现实是一个技术转型的旅程。如今,生成式人工智能不仅仅是一项在医疗保健或广告等各个行业占据重要地位的技术,其应用范围也非常广泛。本文将深入探讨生成式人工智能的演变。
生成式人工智能
生成式人工智能是能够生成一流内容和图像的深度学习模型。生成式人工智能是在庞大的数据集上训练的。人工智能(AI)致力于在识别图像、处理自然语言和语言间翻译等非常规计算活动中复制人类的智慧。
生成式人工智能代表了人工智能发展的后续阶段。它可以被教导理解人类语言、编码语言、艺术、化学、生物或任何复杂的主题。它利用以前学到的数据来应对新的挑战。
生成式人工智能时间线:
20世纪40年代至60年代
尽管近年来备受关注,但生成式人工智能的起源可以追溯到20世纪中期人工智能的开始。
图灵测试
1947年,数学家AlanTuring在一份研究机器识别逻辑行为可能性的文件中首次提到了“智能机器”。
在1950年的一份文件中,他提出了图灵测试的想法,由一个人来评估人类与被编程成模仿人类反应的计算机之间的书面交流。如果评估员始终无法区分计算机和人,计算机将在测试中成功。
ELIZA
ELIZA聊天机器人,是英国科学家JosephWeizenbaum在1961年开发的,是能够产生响应的人工智能最早的工作实例之一。最初的程序是通过语言交流模仿心理治疗师的角色,允许ELIZA通过简单的文本交流与人交谈。
20世纪80年代至2010年代
机器学习算法的进步推动了生成式人工智能的发展,使机器能够从数据中获取知识,并随着时间的推移增强其能力。
RNN和LSTM网络
20世纪80年代末循环神经网络(RNN)和1997年长短期记忆(LSTM)网络的出现,提高了人工智能系统按顺序处理数据的能力。LSTM掌握顺序重要性的技能,对于处理复杂问题至关重要,如语音识别和机器翻译。
生成式模型的突破
2014年生成对抗网络(GAN)在生成人工智能领域的发展的另一个历史事件是另一个突破。GAN是一种无监督机器学习,其中两个神经网络相互冲突。
一个网络是生成虚假内容的生成器,另一个是鉴别器,旨在识别给定内容是真实的还是虚假的。
通过多次迭代,生成器最终将成功地创建出高质量的图像,而鉴别器无法将其与实际图像区分开来。
在大约同一时期,还发现了其他技术,其中包括VEES、扩散模型和基于流的模型,这些技术普遍增强了图像生成的算法。
变压器架构及GPT模型的介绍
从某种意义上说,在2017年首次发布的变压器模型,通过识别单词之间的相互关系,研究了自然语言文本中的模式。旧的机器学习系统一次处理一个片段,而这些变压器同时执行所有的片段,使其效率和能力大大提高。
变压器的设计为LM铺平了道路,如GTPT(生成性训练前变压器),最初是由OpenAI在2018年开发的。地理信息技术是利用深层次学习结构生成文本、与用户交互和完成各种基于语言的任务的网络。
个人可以使用GPT来简化和改进诸如编程、写作内容、研究复杂的学科和翻译文本等活动。其最大的优势在于其惊人的速度和处理大量数据的能力。
2020年至后
ChatGPT
OpenAI的ChatGPT于2022年11月发布,并在5天内获得了超过100万的用户。最初配备GPT-3。ChatGPT使程序能够与计算机进行信息丰富的上下文对话。
其还允许用户要求ChatGPT以所需的风格和指定的长度、格式和详细程度生成书面文本和不同的其他材料。
Llama
Meta的Llama(大型语言模型MetaAI)是一套尖端的基础语言模型,标志着开源人工智能技术进步的一个重要里程碑。
虽然其基本模型比GPT-3和类似的模型更简陋,但它是准确的,并且在相同的熟练程度上学习,同时使用更少的能量。
PaLM和Gemini
2022年4月,Google推出了路径语言模型(PaLM),该模型一直保密,直到2023年3月,该企业才通过API提供了该模型。PaLM标志着自然语言处理(NLP)的重大进步,拥有令人印象深刻的5400亿个参数。
在Google的所有发明中,最新的Gemini可以被认为是最重要的性能和选项之一。
其旨在同样容易地用于各种任务,并能够有效地分析多种类型的信息,即文本、代码、口语、图片和电影。Gemini有三种不同的型号,分别是Ultra、Pro和Nano。
生成式人工智能文本到图像模型
DALL-E、Midjourney和StableDiffusion是使用书面指令生成和更改视觉内容的尖端AI系统。OpenAI开发了一款名为DALL-E的软件,可以生成详细逼真的图片。
总结
总之,自诞生以来,生成式人工智能经历了巨大的演变。这项技术对各行各业的创新产生了巨大的影响。