科学网电脑版
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
通过了谷歌L3工程师入职测试,年薪18.3万美元;月活在短短两个月里从初期的100万破亿,碾压史上所有消费者应用程序;今年1月,全球每天有1300万独立用户访问;学生用ChatGPT拿下全班最高分;微软将向ChatGPT的创建者OpenAI投资100亿美元;谷歌、Meta等科技巨头纷纷在同一领域布局;多家上市公司计划开展由ChatGPT引爆的AIGC(AI Generated Content,利用人工智能技术生成内容)概念相关布局;一些公众号博主开始公开招募AI内容生成师……前些日子,一系列新闻使人工智能实验室OpenAI在去年11月30日发布的自研聊天机器人ChatGPT迅速成为互联网和朋友圈的焦点。它比其他任何可与人互动的聊天机器人都先进,与之“交谈”让人着迷,在不久前美国《时代》杂志与ChatGPT的对话中,该聊天机器人就其工作原理、相关新技术的传播可能带来的风险以及人类应该如何应对潜在问题给出了回答,并表态称,它的反应不应被视为准确事实,也不应被视为其大脑会思考的证据。一些观察人士认为,ChatGPT和它的同类人工智能程序在21世纪20年代对社会的颠覆性影响将与社交媒体平台在21世纪10年代的颠覆性一样,由此,理解其功能和局限性至关重要。
不是严格意义上的搜索工具
Chat指“聊天”,GPT(Generative Pre-training Transformer)译成中文即“预训练生成模型”,有玩家在对ChatGPT进行数日体验后,将其应用概括为“聊天机器人”+“搜索工具”+“文本创造工具”3个方面,对此,有业内人士指出,ChatGPT本质上是一个高级的语言模型,说它是聊天机器人肯定没问题,因为语言模型原本就应用于人机交互;在与人沟通的过程中,ChatGPT会表达一些新的东西,这使内容文本创作也成为它的一项功能;但目前来看,它还不是一个严格意义上的搜索工具,因为ChatGPT背后其实不存在外部知识,它没有可调用的内容页面,所有的语料都来自训练语料库。由于ChatGPT 及其竞争对手通过学习庞大的在线文本数据库中的语料――包括不实信息、偏见或过时的知识――来工作,那些语料本身可能就是错误的,所以ChatGPT在与人的互动中经常会出错,常常“看上去一本正经地说着一些谁都听不懂的奇奇怪怪的话”,有时甚至会编造虚假的论文参考文献。比如当你问它“1+1是不是等于2”,它肯定会调用与问题最相关的语料给出一个答案,但不像传统的搜索引擎那样一定可以确保每次返回的答案页面上都是“1+1=2”这个正确答案。它的答案取决于它语料库里的现成内容和它基于其中的语料加工而成的内容,由于所用语料本身的关系,ChatGPT很容易被用来产生仇恨言论、垃圾邮件,以及种族主义,性别歧视和其他可能隐含在其训练数据中的有害关联,产生带系统性偏见的胡说八道;而且这个语料库并不必然与时俱进,如果后期没有经过特定的关键词过滤等后处理设置,由原始语料本身的非客观性所造成的答案错误会延续。
只是学舌鹦鹉,不具有思考能力
正如ChatGPT自己所说(在这一点上,它的表述碰巧基本是准确的,但并不意味着必然会准确):“我们无法理解生成的单词的上下文语境或含义。我们只能根据给定的训练数据,根据特定单词或单词序列一起出现的概率生成文本。……作为一个大型语言模型,我无法像人类那样学习。我没有能力储存新的信息或经验,并利用它们来改变我未来的反应。相反,当我说我在不断地学习和提高时,我指的是OpenAI的工作人员在不断地通过新数据训练我、通过微调算法来提高我的性能。随着时间的推移,这可以让我产生更准确和相关度更高的反应。我无法从你使用的特定单词和短语中学习。我只能根据我所接受的训练和我所得到的算法来做出反应。我的回答不受我们实时对话的影响。”――简而言之,ChatGPT能根据训练语料生成上下文,但没法跳出训练视野而凭空给出新的东西。它并不像人们所感觉的那样真的具有推理、阅读理解等思考的能力,不能像人一样根据语料形成进化性的观念。不过这些并不影响对有些常见的通用问题,它能回答得很流畅、很好――因为它之前看过很多这方面的语料,只要“背”出来就行。当它用现成的素材进行组合,虽然有可能组合出一个不知所云的东西,但也有可能正好组合成了一个“好像是什么”的东西,这样人们就会惊讶它的本领很高,而这其实在一定程度上也是偶然。它作为天文数字级的海量数据、强大的计算能力和新颖的处理技术的结合体,得以呈现为那种至少让大家看上去觉得合理的存在。如果各种参数正好凑成了一个好像很合理的结果,这个“凑”的过程专业人士称之为“泛化性”。关于何谓“泛化性”,一位自然语言处理领域的专家告诉记者,例如,在训练集里只有青苹果和红苹果,指令告诉ChatGPT“这是苹果”,之后到了真实场景中,有一个黄苹果,由于之前ChatGPT已经掌握苹果的核心特征,对新看到的黄苹果,它就也能够将其识别为“苹果”。这样一种模型在经过训练后,能应用到新数据并对之作出准确预测的能力就被称为“泛化性”。它是ChatGPT所具备的一种能力。
有人曾经调侃:ChatGPT好比一只鹦鹉,因为经常听人说“恭喜发财”,它也会说“恭喜发财”,但是你让鹦鹉去做迎宾小姐,那肯定是不行的。作为一个没有“知识的消化道”的工具,ChatGPT的主要应用在聊天而非研究领域,没有输出控制,不像阿尔法狗那样以一个必然要有的输赢结果为目标导向,因而,它到底能把论文写得多么令人惊艳也值得打个问号。
在近95%