抖音创作服务中心(抖音创作服务中心登录入口官网)

今日新闻2023-12-25 09:58:40自考教育网

在今年的2022年,AIGC的相关内容在互联网圈引起了网友的热议,比如爆圈的AI画,再到最近掀起热议的ChatGPT。此外,大厂也逐渐加强了对AI模型开发的投入。如何具体了解大厂的投资和AI人工智能的发展?我们来看看作者的解读。

抖音创作服务中心(抖音创作服务中心登录入口官网)

今年以来,AIGC(AI生产内容)已经成为一种新的互联网趋势,就像年初火起来的Web3一样。

最近一波热潮是因为上周刚刚发布的ChatGPT。背后以其难以想象的语言理解能力、沟通能力和知识储备,不仅让人感到惊讶,也在一定程度上遇到了恐怖谷效应。甚至有网友认为“很牛逼,有点吓人”。

然而,ChatGPT在理解人类语言,尤其是中文方面仍然存在问题。比如有网友问“如果你是贾宝玉,你会嫁给谁?”结果是一个讽刺的答案:

图/即时@于博士

在人工智能领域,语言理解一直是核心和难点问题之一,尤其是汉语理解。纵观目前世界上所有的语言,汉语的难度系数最高。与拉丁词相比,汉字在语义上更加模糊,容易产生歧义、信息失真等问题,对AI提出了更大的挑战。

同样是最近,阿里和腾讯的AI接连取得突破,中文语言理解又向前迈出了关键的一步。

一、AI中文成绩超过人类上个月底,在中文语言理解权威榜单CLUE中,阿里AI以总分86.685 (3354)刷新纪录。自该榜单诞生以来,AI首次超越人类成就(86.678)。不到一周,腾讯AI也更新了自己的分数,以86.918的分数超过了人类和阿里AI的分数。

线索列表,图/线索

中国两大互联网巨头在短短一周内超越人类线索成就。

作为业界最权威的中文自然语言理解榜单,CLUE(中文语言理解测评基准)是一组评估AI机器人能否像人类一样理解和回应中文文本的任务。人工智能模型的语言理解能力从17项任务中进行综合评估,包括长短文本分类、多选阅读理解和自然语言推理。

过去三年,榜单竞争激烈,几乎是中国互联网巨头的必争之地。除了阿里达摩院的NLP和腾讯的AI模型团队之外,OPPO研究院、Aauto快搜、美团的NLP也参与了榜单的角逐。虽然榜首多次易主,但在阿里和腾讯AI最新更新之前,还没有AI超越过人类的成就。

但这种超越现实,意味着总分在总榜单上超越了人类,自然语言推理榜、分类任务榜等具体子榜单依然位列人类第一。换句话说,目前阿里和腾讯的AI模型与《线索》中的人类不同测评是赢家。

另一方面,百度也以更个性化的方式向中国学生展示了China AI的中文理解能力。在9月份举行的2022百度万象大会上,百度声称AI数字人杜潇潇挑战高考作文,回答了《本手、妙手、俗手》题目的新高考I卷。凭借48分的得分,杜潇潇可以在所有候选人的作文得分中排名前25%。

图/百度

中国互联网巨头对中文的理解似乎迎来了一个奇点。阿里云计算部在阿里AI CLUE的成就首次超越人类后发布消息称,“这标志着中国对AI模型的认识达到了一个新的水平。」

第二,巨人的AI竞赛。如果说近几年AI的快速发展是从2016年的AlphaGo开始,那么2020年夏天OpenAI发布的GPT-3模型可以算是又一个关键节点。GPT-3自发布以来展示了惊人的人工智能能力。它可以写文章、翻译、写代码,甚至可以学习一个人的语言模式并与之对话。

事实上,上半年的DALL E 2(人工智能生成的图片)和ChatGPT(人工智能生成的文本)都源自GPT-3模型。此外,GPT-3支持超过

GPT-3的推出也引发了全球AI大模型的爆发。全球各大科技巨头和研究机构开始了声势浩大的AI军备竞赛。去年,谷歌推出了—— Switch Transformer,这是一个拥有万亿参数的AI大模型。微软和英伟达烧了4480个CPU之后,还完成了MT-NLG(威震天-图灵),一个拥有5300亿个参数的自然语言生成模型。

国内巨头自然不甘落后。百度去年也发布了“鹏城-百度文心”,今年升级为文心产业大模型。阿里在今年9月推出了“依桐”大模型系列,《线索测评》中第一个得分高于人类的AI“依桐-AliceMind”就出自这个模型系列。

科技巨头角力大AI模式的背景是AI在下游应用层面出现碎片化、多元化的产业趋势。华为瑞星计算业务总裁张指出,过去在单个AI应用场景下,实际上是多个AI支撑一个场景完成多个任务。

传统的AI模型只有单一的能力,比如下围棋的AlphaGo,蛋白质结构预测的AlphaFold。像GPT-3这样的大型型号已经可以完成多项任务,服务于多种场景。“这是生产效率的提高。」

百度移动生态负责人何表示,AIGC可以用十分之一的成本,千倍的生产速度,创造出具有独特价值和独立视角的内容,让内容生产和传播进入AI发电阶段。

事实上,百度已经推出了AI绘画平台“文易欣格”,腾讯也有写作机器人“梦想作家”,阿里巴巴有其AI在线设计平台Lubanner,而字节跳动则推出了提供AI视频生成功能的剪贴。

但是未来的AI创造会是什么样子呢?

三、AI创作,还是辅助创作?在ChatGPT展示了其超强的自然语言生成能力后,有网友设想,未来可以用ChatGPT生成文案并输出为语音,再用稳定扩散生成图片素材,甚至直接用Google的Imagen Video或Meta的Make-A-Video生成视频。

AI生成的视频,图/谷歌

今天,人工智能生成的文本和图片已经成熟,但距离人工智能生成的视频的实际应用还有很大差距。阿里资深技术专家、达摩院基础视觉团队负责人赵德利判断,大约两年后时间,AI生成的视频也有望达到文圣地图级别的效果。她还指出,目前的困难在于文圣图的质量和数量与数据有很大差距。

在9月的万象大会上,百度发布了“创客AI助手群”,成员包括文案、插画、视频制作人等AI助手。要认识到一个人就是一个制作团队。

几乎可以肯定的是,未来AI将彻底改变现有的内容生产模式,但AI带来的内容革命很难说是好是坏。

ChatGFT主要通过语料库进行自然语言处理的训练。首先,对大量的对话记录和语料库进行切分,处理成模型可以识别的格式。然后,利用深度学习等自然语言处理技术对模型进行训练,使模型能够通过对语料库的学习,模拟人类的聊天行为,回答用户的问题。

本质上,AI产生的内容是基于互联网上的海量语料库。它既不能凭空创造新的内容,也不能实时收集最新的语料数据,而只能收集一定参数范围内的已有信息,包括那些“有毒”的信息。

OpenAI去年指出,他们所做的改进无法消除大型语言模型中固有的毒性问题。GPT-3收到了超过600GB的在线文本,其中一些来自具有性别、种族、身体和宗教偏见的社区。和其他大型语言模型一样,会放大训练数据的偏差。

图/OpenAI

平心而论,这不仅是AI的问题,也是人类自身的问题。然而,AI生成内容的便利性和速度大大降低了内容生产的成本。比如现在把人类司机换成自动驾驶司机,也意味着各种问题。例如,更像真人的人工智能水军将充斥着社交媒体,人工智能生成的虚假或有偏见的内容随处可见。

越来越多的人开始怀疑社交媒体上的内容是真人打字还是ChatGPT生成的文字。在过去,社交媒体甚至整个互联网内容被AI完全占领并不是一件令人担忧的事情。

北京大学新闻与传播学院教授胡勇也指出,“中文内容写作充满了洗稿,使用机器学习工具生成内容会使洗稿问题更加严重。因此,胡勇认为,与其直接用AI代替人类生产内容,不如思考如何用AI帮助人类扩大内容生产能力。

在ChatGPT的对话热潮中,我们也发现内容输出确实很具体。虽然ChatGPT对自然语言的理解已经达到了令人称道的程度,但实际回答中仍然充斥着各种“无厘头文献”和过时的偏颇信息,但在辅助内容创作和成为人类写作的助手方面已经好了很多。

4.写在最后,人工智能之父艾伦图灵在提出图灵测试时,把语言理解能力作为判断一个机器系统是否智能的关键标准。因此,自然语言理解被视为人工智能皇冠上的明珠。

中国人更是如此。以前我们在AI语音助手上看到,现有的语音助手对中文的理解能力很大程度上影响了用户的语音交互体验。毕竟,没有人喜欢对牛弹琴。

然而,仅在过去的一个月里,阿里和腾讯AI在CLUE的中文理解能力上就相继超越了人类的成绩,ChatGPT至少在中文、日文和英文上展现出了惊人的语音理解能力。今年以来,AI画图、AI视频接连挑战我们对AI的认知。AI内容行业的转型似乎近在咫尺。

然而,正如科幻《沙丘》中所写的,AI深度学习的训练模式决定了“它们被训练去相信,而不是去知道。信仰是可以被操纵的。只有知识是危险的。」

作者:雷科技互联网集团;编辑:冬季果酱

原标题:阿里赢了,人类输了:语文“考试”也输给了AI。

来源:微信官方账号,LeiTech (ID: LeiTech),专注科技与生活。

本文由人人是产品经理合作媒体@雷科技授权发布。未经许可,禁止复制。

题目来自Unsplash,基于CC0协议。

此观点仅代表作者本人,大家都是产品经理。平台只提供信息存储空间服务。

相关推荐