AIGC应用持续升温,变革与风险并存
何宝宏,中国信息通信研究院云计算与大数据研究所所长
据新华社2月14日报道,近日,AIGC即人工智能生成内容,再一次引发公众关注:一款名为ChatGPT的聊天机器人程序在社交媒体上不断刷屏。相关技术的探索最早可以追溯到20世纪60年代,使用合成语音进行导航播报、通过机器撰写新闻在10年前就已经开始探索和逐步应用。近年来,智能对话音箱更是走入千家万户。
当前,人工智能生成内容的种类、质量、灵活度持续增强,技术应用的边界也在不断打破,未来很可能会对现有的产业和法律规范带来冲击。
漫画 曹一
什么是AIGC和ChatGPT
人工智能生成内容(Artificial Intelligence Generated Content),简称AIGC,本质上是以生成式人工智能为核心技术的内容创作范式。总体上,可以将AIGC概括为伴随着网络形态演化和人工智能技术变革产生的一种新的生成式网络信息内容。
ChatGPT(Chat Generative Pre-Training ),是一个典型的生成文本的AIGC应用,是由美国人工智能公司OpenAI于2022年11月推出的一款聊天机器人软件,因其可快速地对各种问题进行回答而风靡全球,上线两个月后用户破亿,是史上增速最快的消费者应用。有人将ChatGPT概括为“聊天机器人+知识检索+文本生成工具”,其本质是一个应用在对话场景的语言模型,能够回答后续问题、承认错误、质疑不正确的前提以及拒绝不适当的请求。据统计,其支持的任务类型达49种,覆盖大部分主流语言任务,可按照要求生成用于不同场景、不同形式的文字,包括邮件、小说、论文和代码等,已初步具备通用智能产品特征。
2018年,OpenAI公司曾发表论文,介绍了生成式预训练语言模型(GPT)的概念。GPT是神经网络受人脑结构和功能启发的机器学习模型,可以在人类书写的文本数据集上进行训练并执行许多功能。ChatGPT高度依赖于微软的算力支持,其作为第3.5代GPT模型,充分发挥了监督指令微调和从人类反馈中强化学习等技术作用,使得其能够理解多轮对话以及表现得更接近人类。此外,与第一代GPT相比,ChatGPT训练数据量有约万倍的扩充。
以ChatGPT为代表的自然语言处理大模型技术,将促使AI(人工智能)产业进一步带动生产力变革,极大冲击现有研发路线,发展方式或将迎来新拐点。
带动一批创新应用
从应用范围上来看,ChatGPT将带动一批创新应用。
对话类应用:以智能客服、智能外呼等产品服务为代表,主要应用行业为银行、证券等具备大量客服场景的企业。
语义理解和信息检索类应用:以大规模知识图谱、企业知识库产品等为代表,应用行业包括法律咨询等。
各类代码纠错和生成类应用:以代码智能生成、代码辅助开发产品等为代表,主要应用行业为互联网等。
各类文案、新闻、图片生成和创造类应用:如文案自动生成、新闻自动宣传等,主要应用行业为媒体等。
ChatGPT在美国已被大量使用,主要包括企业、教育机构、AI研究员、市场营销人员、设计师、媒体等。ChatGPT还可以通过对人类而言难度较高的专业级测试。另外,ChatGPT已不再仅仅是对信息内容的呈现或推送,而是对已有信息内容消化理解后的再生成。这一范式的变化,引起了全球互联网行业的高度关注。目前,微软已宣布将ChatGPT能力与必应搜索进行深度集成;谷歌管理层已经发布了“红色代码”警报,全面应对ChatGPT带来的“威胁”,发布名为学徒巴德(Apprentice Bard)的聊天机器人。
国内企业亦加紧布局,百度宣布3月推出中国版的ChatGPT“文心一言”。此外,阿里、腾讯、小米、字节跳动、快手等互联网科技公司也纷纷加入相关领域,开展研发和布局。也有地方政府“跟进”宣布支持头部企业打造对标ChatGPT的大模型。
ChatGPT只是大模型的一个典型应用,近年来,随着AIGC核心技术创新的不断突破,多款人工智能生成应用推出即风靡全球,智能生成新范式正在得到市场认可。同时,AIGC应用效能正在初步显现,带动包括生命科学、软件行业、医疗、制造等生产力的提升,将极大程度缩短研发流程与时间,节约资金成本。例如,由OpenAI GPT模型提供支持的代码生成产品Github Copilot,使用人数已经超过120万,据估算每年节约开发人员成本可达百亿美元。微软CEO表示,特斯拉80%的代码都是基于Copilot生成的。另根据美国塔夫茨大学药物开发研究中心30多年来的统计数据,目前每一个新药的研发成本大约为26亿美元,平均耗时14年;而人工智能药物研发公司英矽智能利用人工智能结合生物化学,只用了18个月时间和不到300万美元的研发经费,就合成80个药物化合物。
变革与风险并存
首先,AIGC将极大提高整个人类社会的劳动生产率,使整个人类社会更加智慧、精准和高效,同时改变人们工作、学习、生活和娱乐等生活方式。例如,一些重复性的文字创作、咨询及客服工作将被ChatGPT所取代,人们可以通过ChatGPT快速获取和学习知识,也可以创造出更多的数字生活和娱乐服务内容,给大众带来全新的体验。
其次,AIGC有望满足日益增长的数字内容需求。数字世界的繁荣离不开数字内容的丰富,AIGC可以辅助人们快速、灵活地生成数字内容,在绘画、诗歌、作曲等艺术创作领域大放异彩,既激发广大用户使用AIGC进行“创作”的热情,也极大地提升数字内容的供给能力。
随着以ChatGPT为代表的AIGC应用的不断扩大化, 也存在几方面风险。
一是,会带来一些伦理和治理问题。比如,因为预训练数据的不完整性以及本身可能带有的偏见、恶意及道德伦理的问题,使其可能会在某些场景下输出违背当地社会价值观的内容等。
二是,AIGC作品存在突出的版权问题。首先,AIGC是否属于著作权保护范畴存在争议;其次,AIGC依赖于海量数据的学习,摹写行为会稀释既有作品的独创性,可能会侵犯他人合法权益;此外,AIGC作品权利归属尚没有定论,涉及用户、平台方,以及训练用数据的原作者等多方主体,未来随着AIGC应用越来越多,这一问题将愈演愈烈。
三是,AIGC恐极大增加互联网内容监管难度。当前,机器深度学习后生成的内容愈发逼真,且应用门槛也在不断降低,人人都能轻松实现“换脸”“变声”,甚至成为“网络水军”中的一员。由于造假内容生产者具有分散性、流动性、大规模性和隐蔽性的特点,将导致追踪难度和复杂性与日俱增,对内容监管行动造成严重阻碍。
发展前景和趋势
当前,AIGC行业仍处于早期摸索期,未来随着技术的不断突破,将不断扩展AIGC的应用场景。
一是核心技术持续演进。针对大规模分布式AIGC交互算法的研究是时下紧迫且热门的主题,也是AIGC技术未来的发展方向之一。
二是产品类型逐渐丰富。近年来,随着元宇宙概念的兴起以及科技进步而快速发展的数字人是未来AIGC应用的一个重要细分赛道。未来产品将使得多重信息感知和认知能力以数字化的形式传输,并指导人工智能进行内容创作。
三是场景应用趋于多元。AIGC在未来的应用场景会进一步多元化。例如,在“AIGC+数据科学”领域,可以自动生成具有安全性、标签化、经过预处理的标准数据以满足越来越“饥饿”的人工智能模型。在“AIGC+游戏”领域,通过训练,人工智能可以生成针对不同玩家阶层的游戏攻略和教学手册,并且无重复自动创建不同难度、高交互性、高可玩性的剧情和关卡。在“AIGC+医药”领域,相关模型可以克服医疗数据的稀缺性,自动寻找带有特定性质的分子结构,以此大幅缩短新药的研发和临床试验的科研成本。此外,AIGC还可涉及绘画、作曲、演唱、编剧、设计等,不同于目前在这些细分领域以辅助内容生成为主的现状,未来这些领域的自主生成内容将会达到人类水平,经人工智能创作后无需人为优化即可投放市场。