淘姐妹

淘姐妹

下篇:4万字告诉你ChatGPT到底是什么《星船知造ChatGPT技术架构及中国人工智能未来发展趋势报告》发布

电脑 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

四万字算长篇吗,4万字多久能读完,4万字要写多久,4万字的书有哪些

文 | 钱鸿生

编辑 | 唐晓园

序言及摘要:

作为星船知造“现代通信与智能网技术展望”系列栏目的第一辑,我们邀请星船知造的资深读者、通信行业教授级高级工程师钱鸿生博士为我们撰写了《【【微信】】技术架构及中国人工智能未来发展趋势报告》。

报告正文共3.8万字,在介绍了【【微信】】的进化历程、主要内涵、底层技术架构与逻辑后,主要分析中美现阶段在AI领域的竞争优势与差距,提出【【微信】】潜在的商业价值和对资本市场影响的风险管控警示。并分析了算法和算力以及芯片技术,对我国人工智能AI发展的制约与影响,最后切入我国AI产业结构调整、建立AI法律保护与系统安全的视角,对发展我国人工智能产业提出一些前瞻性的趋势分析和研判。

上周我们发布了报告上篇(可点击)

4万字告诉你【【微信】】到底是什么(上)》

,今天的下篇我们将继续节选报告第三章中的“我国人工智能发展中存在的主要问题”、第四章《【【微信】】对资本市场影响的分析与研判》和第五章《我国未来人工智能发展的展望》中部分核心内容和观点。

也欢迎您关注星船知造,回复关键词白皮书【【微信】】",下载高清完整版《【【微信】】技术架构及我国人工智能未来发展趋势报告》

我国发展AI产业国家规划与阶段性困境

【【微信】】推出【【微信】】后不久,微软宣布将【【微信】】与搜索引擎Bing整合,谷歌宣布推出Bard应对挑战,接着Meta官网公布了一款新的人工智能大型语言模型LLaMA。

此时,人们自然而然把目光转向了中国相关企业,他们何时宣布推出类似于【【微信】】人工智能发展的时间表。

人们特别关注的企业有百度、阿里巴巴以及人工智能企业科大讯飞等等一大批中国与人工智能有关联企业的动向。

3.4.3 我国人工智能发展中存在的主要问题

我国发展人工智能面临三方面技术难点如下:

第一,人工智能的AI算法

人工智能常见的算法技术的基础性研究主要集中于国内各大高校团队,但在科研成果转化领域一直发展比较缓慢,较难实现从理论和技术向生产力的转化。

目前以华为、阿里、腾讯等公司主导的人工智能技术研发团队迅速崛起,将科研产品开发与算法技术结合,从产业领域实现人工智能算法的技术成果转化。

但是在算法的基础理论研究层面,一直以来是我们发展人工智能技术的短板。没有对大规模机器学习场景中强化学习算法模型、生成性预训练变换模型、分布式并行的研发投入,或者说由于受到资金投入与人才缺乏的影响,研究成果与世界发达企业还有很大的差距。

美国现有的人工智能系统的关键技术都是不开源的,系统深度学习框架、数据库和工具集,均限内部使用,部分仅对系统的应用接口持开源的态度,使我们无法在短时间内掌握世界最先进的人工智能系统的开发经验。

从市场的角度来看,我国目前的人工智能系统都是一些比较初级的数据采集与分析应用系统,类似于【【微信】】高度智能化的AI产品的研发还处于摸索与初级阶段,在性能和稳定性方面改善空间潜力巨大。

? ?图源:pexels

早在20世纪80年代,我国学术界就提出了相当完善的AI算法模型,中国多家高校有从事算法模型的研究,但大多都将算法模型应用在人脸识别系统,提高图像识别精度方面。到目前为止算法模型在AI领域的价值还没有被真正体现,这可能受限于我们的芯片制造水平难以提供支撑深度神经网络训练和预训练需要的算力。

科研领域需要更大投入,要针对目前的已有算法进行深度优化,或者另辟蹊径,提出更为先进的算法理论。要打造出符合世界产业发展最新技术水平,具有全球市场竞争力的人工智能产品,看来有相当长的一段路要走。但也不排除弯道超车或换道超车奇迹的发生。

我国AI发展现状任重而道远。

第二,人工智能AI模型软件

国内的人工智能模型软件开发已经起步,开始对标世界先进的人工智能模型,培育自己的发展环境。人工智能模型是人工智能生态中最重要的因素之一,我国需要促进国产模型软件的发展和推广,摆脱国外的标准制约【【微信】】就是基于“生成型预训练变换模型”开发出来的自然语言聊天机器人。

第三,人工智能开发环境

人工智能开发环境是指相关算法、数据库、软件开发工具、高性能的人工智能AI计算机芯片、云计算网络的集合。国产AI模型开发需要和国产AI智能芯片及硬件进行相互适配、性能优化和应用推广,才能够形成面向行业应用的软硬件一体化人工智能平台。

? 图源:unsplash

国际人工智能巨头掌控着人工智能开发环境的关键技术,我们目前还较难在短时间内在AI芯片、算法、模型软件、云数据库服务等人工智能开发环境上有十分大的突破。

人工智能系统开发是一个系统工程,需要协同各个方面的资源共同发力,才能在产业发展中占有制高点。

? 图源:pexels

3.4.4? AI芯片,人工智能绕不过去的坎

人工智能AI芯片是技术发展的关键之一,它是提供人工智能算力的灵魂和大脑,承载了为各种终端提供强大算力的重要任务。人工智能AI 芯片的出现,极大提高数据处理的能力,尤其在处理海量数据时明显优于传统CPU。

从技术架构来看,AI芯片一般可以分为GPU、FPGA、ASIC和类脑芯片四大类――

GPU(Graphics Processing Unit,图形处理器)

?

GPU是利用处理图形任务的图形处理器来计算原本由中央处理器CPU的通用计算任务。

GPU的关键性能是矩形并行计算,主流的GPU具有强大的计算能力,无论性能还是内存带宽均远大于同代的CPU。CPU 由专为顺序串行处理而优化组成,而 GPU 则拥有一个由数以千计的更小、更高效的核心(专为同时处理多重任务而设计)组成的大规模并行计算架构。同时CPU相当一部分时间在执行外设的中断、进程的切换等任务,而GPU有更多的时间用于并行计算。

英伟达是AI芯片GPU(图形处理器单元)的主要生产厂商,无论是【【微信】】的【【微信】】、还是微软的搜索引擎Bing、谷歌的人工智能系统LaMDA,都离不开英伟达提供的底层芯片GPU的算力支持,英伟达系列的A100和H100系列占全球AI芯片市场的80%以上的份额。

除了英伟达,还有AMD,ARM家的Mali,Imagination的PowerVR,【【微信】】的Adreno等。

? 图源:unsplash

基于FPGA现场可编程门阵列

FPGA(Field Programmable Gate Array)现场可编程门阵列,或称半定制化芯片。它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物,可以根据算法需求,动态重构计算架构。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。

全球知名的FPGA生产厂商有:Altera,Xilinx,Actel,Lattice,Atmel,我国厂商代表有深鉴科技DPU百度XPU等。

? 百度阿波罗 ?unsplash

ASIC(Application Specific Integrated Circuit)

ASIC专用集成电路是针对特定用户要求定制设计、制造的专门的应用程序芯片。ASIC芯片广泛应用于人工智能设备、虚拟货币挖矿设备、耗材打印设备、军事国防设备等智慧终端。

ASIC芯片还可以细分为全定制ASIC芯片半定制ASIC芯片可编程ASIC芯片。ASIC芯片拥有面积小、集成度高等优势,被广泛应用于人工智能终端和网络系统中。

类脑计算芯片(Brain-Inspired Chip)

类脑计算芯片是人工智能AI的一个重要组成部分,类脑芯片可模拟人类大脑信息处理方式,能以极低的功耗对信息进行并行和分布式处理,类脑计算芯片就是把微电子技术和新型神经形态器件结合,突破传统计算架构,实现存储与计算的深度融合,大幅提升计算性能、提高集成度、降低能耗。对于现有的计算体系与系统做出变革,并实现在计算能耗、计算能力与计算效率等方面的大幅改进。

IBM已经开始进行类脑智能算法与技术的探索,并已成功研制出TrueNorth芯片。

中国目前有清华大学的天机芯,浙江大学的Darwin2 (55nm)等一批研制类脑计算芯片机构和企业。

【【微信】】对资本市场影响的研判

4.2 【【微信】】背后的技术壁垒和文化控制权

【【微信】】是一种自然语言处理技术,一旦【【微信】】能从目前的实验阶段走向应用成熟阶段,将这标志着在人类活动中,人工智能将开始扮演重要角色并占据优势地位。

我们知道,在自然语言处理大模型技术上,由于受到各种因素的影响,我国的人工智能相比国外发展有一定的差距,特别受制于美国对我国芯片技术的控制,严重阻碍了我国的人工智能的研发和应用。

但在局部技术领域,我们还是具有很大优势的比如在优化大模型中的数据库,在某些特定领域进行模型优化和云数据库建设,以及在一些与自然语言处理关系密切的学科。在国家宏观政策的指导下,发挥社会市场经济体制的优势,能集中力量办大事的原则,完全可以进行基于大模型处理方法模型的应用性研究,以适应人工智能发展对拉动国家经济上行,满足人们追求丰富多彩生活娱乐的需求。

从国际竞争角度来看,我们也必须关注【【微信】】带来的国际技术垄断企业利用技术标准和先入为主的优势,在关键技术和人工智能芯片方面卡住我们发展的命脉,制约我们的发展。

一旦这种在人工智能关键技术上形成国外企业垄断的局面,对我们在人工智能以及其他高科技方面的发展是极其不利的,而这样的以技术版权和相应的技术壁垒为前提,就可能带来文化上的弱势,甚至是某种形态下受制于人。

因此,我们应当把发展人工智能的重心放在推动我们国家的基础产业、芯片技术、大模型优化、数据库应用以及与人工智能等相关产业同步发展的正确轨道上来。而不是一味地跟随【【微信】】起舞。

4.3 【【微信】】可能引发的机遇与风险

我们对【【微信】】要时刻保持清醒的认知,每一次技术迭代,都将改变人类生活的内涵和方式。【【微信】】是否属于一次新的技术迭代这个问题还有进一步观察,可是以【【微信】】为代表的人工智能技术的发展和自然语言处理技术的突破,一定会对现有产业发展格局带来前所未有的重要影响。

? 无人机拍摄下的苏州图源:unsplash

从正面影响来看,【【微信】】可以帮助人们快速获取信息和提高工作效率,扩展知识面,提供发展AI 产业新的思路和方法。

另一方面,某些低端和重复的工作可能被【【微信】】和 AI代替,导致劳动力市场的阶段性动荡和变化。如果人们过度依赖AI,可能会降低人们一部分的操作技能水平和创新精神。某些行业可能会发生重组甚至消失,有可能在变化过程中引发社会矛盾等。

颠覆性创新理论的提出者克里斯滕森在《创新者的窘境》这本书中,将创新分为了延续性创新和破坏性创新两种:破坏性创新难以评估市场规模增长的需求和未来的发展路径;延续性创新则会将资源推向更容易带来增长的方向。

总体而言,以【【微信】】为代表的人工智能的发展, 可能对人类的未来产生重要影响,需要积极开展相关的研究和管理,以确保国家经济技术发展不受制于人,保持社会的稳定发展和保护大多数人的共同利益。  

人工智能解决方案可以为企业和公民提供巨大的机会,但也可能带来风险,这就需要一个坚实的监管框架来确保人工智能技术的健康发展。

4.4 【【微信】】的隐患与潜在危机

尽管目前的【【微信】】还是一个验证的版本,强大的文本处理与聊天能力十分强大,但【【微信】】在短短的几个月试运行中也暴露出了很多缺陷,甚至可能会引发危机。这些问题正随着以【【微信】】为代表的生成型AI系统的推进逐渐浮出水面。人们也会更关注这些问题,并迅速采取防范措施。【【微信】】存在的缺陷与风险主要体现在以下几个方面:

4.1.1 【【微信】】在道德和法律方面的违规行为

人们在使用中发现,【【微信】】对信息、数据来源无法进行核实、核查和验证,可能存在个人数据与商业秘密被泄露,引起窃取他人信息的道德问题和提供虚假信息两大隐患。

【【微信】】从网络中获取大量信息,依托海量数据库分析运行,其中包括大量的互联网用户自行输入的信息,比如新闻工作者编写的稿子,【【微信】】目前无法追溯到文字的来源,因此当用户输入提问时,【【微信】】可能产生泄露个人数据或商业秘密等的风险。

Unsplash

【【微信】】涉及的法律风险不限于以下几种:

著作权:生成的内容可能会侵犯他人的著作权。

隐私权:使用【【微信】】 可能需要提供一些个人信息,因此存在泄露个人隐私的风险。

信息误导:生成的内容可能不准确或有误导性和歧视性。

侵权违规:【【微信】】生成的内容可能侵犯他人的合法权益,如商标权、出版权、著作权、专利权等。

商标侵权: 【【微信】】 生成的图像和视频内容可能涉及商标侵权。

人身攻击: 【【微信】】 生成的内容可能涉及对宗教和人身攻击,违反社会伦理道德。

侮辱诽谤:使用 【【微信】】 生成的内容可能侮辱他人,可能涉及诽谤等法律问题。

最近,【【微信】】表示,正考虑在【【微信】】中添加模型水印,即监测模型可以识别的特殊标记,以降低信息滥用的问题。

4.1.2 【【微信】】提供虚假信息

【【微信】】常常出现“一本正经的胡说八道’”,这是【【微信】】目前被人诟病的一个主要缺点。对于有些虚假信息,需要具备一定专业知识的人才能辨别真伪,这就为不法分子恶意“训练”或“误导”人工智能,使其提供*信息、钓鱼网站等内容,损害公民人身和财产安全创造了有利条件。

4.1.3. 【【微信】】信息监管迫在眉睫

【【微信】】在建立语料库、生成文本时,大量使用并非公开的开源代码,或未办理许可证申请,可能会导致侵权。对于一些受著作权或版权保护的文本、视频、软件代码等,如果没有经过权利人的授权,直接复制到自己的数据库中,在此基础上修改、拼凑,极有可能侵害他人的著作权,因此对【【微信】】必须要考虑建立相关的监管机制,防止产生不良的社会影响。

4.1.4. 【【微信】】提供侵权信息

一位美国众议院科学委员议员表示:“我对人工智能以及人工智能推动的社会进步感到兴奋,但也为其不受限制和不受监管感到担忧。”

纽约大学认知科学名誉教授Gary Marcus对以深度学习为中心的 AI 持怀疑态度,他认为:“生成式 AI 对社会结构构成了真实而迫在眉睫的威胁”。

各国监管机构要有切实可行的风险评估框架,并任命一个负责任的机构。此外,人工智能伦理框架的建立将为所有部门创造一个良好的创新环境。

一位资深的网络安全公司管理者认为:她的团队能够让 【【微信】】 编写网络攻击的程序,【【微信】】从编写网络钓鱼电子邮件到编写恶意代码,再到规避常见的网络安全检查,实施对其他系统的攻击,【【微信】】几乎可以成为让没有软件编码技能的人成为网络罪犯。  

无数的教育工作者谴责有人使用 【【微信】】考试作弊,美国的多所学校已经禁止学生用 【【微信】】聊天机器人答题,拒绝采用【【微信】】编写的论文和答卷。

人们为人工智能推动的社会进步感到兴奋? ?图源:pexels

由于【【微信】】是一种人工智能工具,只要输入提问,点击鼠标,就可以完成任何的主题文章、诗歌和电子邮件。特别是学生用【【微信】】完成试题应答和论文撰写。在国外教育界引起了轩然大波。

为此【【微信】】迫于社会压力,赶紧开发出了防作弊应用软件,可以审查哪些试卷和论文是由【【微信】】提供的,以此防止学生作弊。

但是,这种新的检测工具并没有消除教师们的恐惧,反而让科技界和教育界有些失望。据测试,该系统大约只有20%的准确性,不能完全检出作弊的试卷答题。

2023年1月初,美国普林斯顿大学的学生爱德华・田(Edward Tian)开发了GPTZero工具,该工具的标语是“人类应该知道真相”,该工具可以更准确鉴别由【【微信】】提供的文档,相信不久国内也会催生出这类的应用软件和工具。

? 图源:unsplash

中美在人工智能领域的竞争焦点与差距

中美在人工智能领域的竞争焦点与差距,主要体现在以下几个方面:

5.2.1 AI芯片方面的竞争

中美在人工智能领域的竞争首先是超级计算机方面,更具体来说,就是计算机的芯片之争,其中包括AI芯片引进与我国自主开发两个方面。

AI芯片引进方面:自从2022年10月美国更新了限制对华出口的管制条例,宣布将全面限制向中国出口超级计算机领域的芯片,将特定高性能芯片、高性能计算芯片加入了商业管制清单。其中就包括AI最主要的英伟达A100和H100系列以及AMD的MR1250等高性能人工智能芯片。

在以【【微信】】为代表的生成类AI大模型中,对于AI芯片的要求更高,包括要求更高速的内存带宽、更大的内存容量以及更加高效的数据通信带宽。以【【微信】】的【【微信】】-3.5模型训练为例,微软公司专门为【【微信】】 开发了一款定制的超级计算机,使用了上万颗英伟达A100的AI芯片。

在集成电路芯片加工领域,世界排名第一的台积电已经可以生产3纳米的芯片,目前中国芯片制造排名第一的中芯国际,生产14纳米的芯片,差距十分明显,而且这种差距可能在相当一段时间内依然存在,并且有被拉开的可能性。

这是个残酷的事实,也激励我们需举全国之力缩小在芯片制造领域的差距,否则包括人工智能在内的其他高科技发展都将受到很大的制约。

5.2.2美国对华出口AI芯片速率方面的限制

【【微信】】-3模型的预训练使用了大量分布式计算技术,【【微信】】不仅会使用本公司的物理服务器和数据中心,同时也会使用微软位于华盛顿凤凰城、德州圣安东尼等多个异地的超算中心。然后将结果同步到自己的计算机上,以达到加速训练和提高模型性能。

【【微信】】-3模型参数量非常大,往往达到上万亿个参数,需要使用大量分布式计算技术计算作为支持,每个训练节点需要和其他节点之间进行高速的数据传输和协同计算。因此AI芯片的高速互联的性能指标,对于人工智能大模型的训练将会起到一个至关重要的作用。

美国政府对华出口的英伟达公司AI芯片输出速率加以了严格限制,明确提到了要限制600GP/秒互联宽带以上的AI芯片的出口。英伟达公司因此为了继续向中国出口AI芯片,赚取利润的同时又不违反美国政府的管制要求,向中国提供特供版的A800芯片,用于替代A100芯片。据查英伟达官网,表明A800的高速互联通信速率降为了400GB/秒,而美国本土使用的A100产品的高速互联通信速率为600GB/秒,这种降级指标会对AI系统的性能造成很大的影响。

5.2.3芯片加工阻碍了我们的进步

AI芯片的加工是体现芯片性能的一个重要方面,目前英伟达A100芯片是采用台积电7纳米工艺制作完成,而M1250采用的是台积电6纳米工艺,最新的英伟达H100采用的则是台积电的4纳米工艺,第四代的N【【微信】】之间的传输速率达到了900G

ChatGPT历代对比 ChatGPT 基础版和plus版对比

chatgpt官网,chatgpt怎么用,chatgpt使用,chatgpt中文

今天凌晨,OpenAI 发布了最新的GPT-4

根据发布会披露的内容来看,这个新一代比早先大家使用的 ChatGPT 的 GPT-3.5 内核强悍了一大截,再次刷新了编辑部对 AI 的认知。

首先,非常非常重要的一点是,GPT-4 可以接受文字以外的内容输入了,目前支持文字与图像的混合输入。

在官方的示例中,用户给 GPT-4 上传了一张梗图,问 GPT-4 这张图为什么好笑:

GPT-4 非常详细且精准地描述出了图片上的内容。

并且有思维条理的解释了,为什么这张图会让人觉得好笑。

这还不算完,就算是十分抽象的 Meme,它也能一本正经地给你解释笑点在哪里。

只不过么,GPT4 也还没到能通过图灵的程度。

当然,这个功能并不只是能解释梗图那么简单,它拥有无限的想象空间,比如:

在今天凌晨的官方直播视频中,GTP 的开发人员演示了GPT-4 可以识别他手绘的一张网页草图,并且根据草图写出网页的前端代码。

手绘的网页草图,非常抽象

GPT-4 给出的网页以及代码

虽然这个示例里的网站非常简单,但 GPT-4 的理解能力和创造力还是让人觉得不可思议:

重要的不是它能不能做得很好,而是它能做到,这是一个质的飞跃。

甚至,目前已经有公司在搞这项技术的落地应用,打算把它和导盲服务结合起来。

这样一来,盲人只需要拍张照,GPT-4 就能立即复述出面前物品的信息。

而在文字问答方面,GPT-4 也有非常大的提升,输入字增加到了 2.5 万。

在专业领域上的回答,特别是 “ 问题复杂度足够高的时候……GPT-4 比老版本更细、更可信、更富有创造力 ”。

比如,在统一律师考试( Uniform Bar Exam )中,GPT-4 可以超过 90% 的人类考生,而老版本只能超过 10% 的人类考生,妥妥学渣学霸的区别。

在 GRE 数学和语文

( 阅读与填空 )考试中 ,GPT-4 的考试成绩已经是哈佛、麻省理工、斯坦福大学生的水平了。

不仅自己回答问题能力变强了,GPT-4 还会人格扮演。

比如你提出一个问题,ChatGPT 只会机械式地回答,而 GPT-4 可以按你的要求以苏格拉底风格给你作答。

那这个玩法就多了呀。

向下滑动

不过,说了这么多,百闻不如一试。

即使已经是凌晨 2 点,编辑部依旧花重金( 20 美元/月 ),连夜让美国同事帮忙升级试用了一波。

遗憾的是,OpenAI 考虑到用户们搞幺蛾子的能力太狠,所以目前 GPT-4 的图片输入功能暂时不对公众开放,也没有说啥时候可以用上。

不过,我们还是可以试试它聪明的小脑瓜子。

先是给了一个全网疯传的“ 华为、阿里入职面试题 ”,挑战大获成功。

而隔壁的 ChatGPT 就有点拉了。

作为击败了 90% 人类的大律师,GPT-4 的推理能力应该强无敌吧。

所以我们又搞了道法考的经典案件,想掂量掂量 GPT-4 到底有几斤几两。

问:乙去甲家吃饭,结果电动车被偷了。于是乙准备偷辆别人的电动车,此时,喝醉的甲来帮忙撬锁,帮乙成功得手。结果调查后发现,乙偷的是甲的电动车,问甲算不算是盗窃罪?

虽然新旧两款结论都是正确的,但是旧版的解题过程,就有点乱来了。。

而在一些更需要 “ 创造性 ” 或是 “ 思考 ” 的问题,比如:

关于最近一次特斯拉投资者大会上 “ 实现全球可持续能源 ” 的计划,你觉得是可行的吗?为什么可行?

GPT-4 的表现就更让人吃惊了。

虽然 GPT-4 的知识库停留在 2021 年 9月,并没有覆盖半个月前的那场投资者大会,但它却神奇地未卜先知了。

而老版本 ChatGPT 的回答就逊色了很多,没有条理,还有一堆车轱辘话,没有建设性观点。

随后,我们又问了一个行业思考相关的问题:

你如何看待全球的碳排放战略,它能成功吗?

老版只能浮于表面笼统地给点泛泛的概念,而 GPT-4 的回答明显维度更宽、思考更深,洋洋洒洒列了 10 点,更加细致有条理,并且含有更多专业词汇与内容,可以说几乎完美地回答了这个问题。

上面这些,还仅仅只是我们编辑部的试验,在一些大佬们手上,GPT-4 令人恐惧的表现就更多了。

比如仅仅只用了 60 秒,就做出了一款 Pong 游戏,20 秒就能做出贪吃蛇游戏。

不可否认,GPT-4 比起旧版来说,强的不是一点半点。不过我们试出来的问题,其实也不少。

我们搞了套高中数学竞赛试卷来考它,结果,一试就尴尬了。。第一道选择题,新旧两个版本就都解错了。

难道说,斯坦福、麻省理工还不如。。?

因为 GPT-4 可以支持更长的输入文本,所以我们就又测试了它的总结概括能力。

这下馅露得更大了。

我们甩给它的是,差评君之前发过的一篇文章的链接,其实 GPT-4 是没有联网的,正常来说是没法总结的。

结果,它愣是凭空捏造了两个文章总结,而且和我们给的文章没有任何关系

直到在我反复指正两次,语气都加重了,它才承认自己的错误。

直到后面我们把原文直接贴进去后,GPT-4 才展露了它超强的总结能力。

说实话,这个胡编乱造的能力让我们心里一惊,于是就又想了个测试方法。

前两天,小黑胖把“ 手拿把攥 ”记混成“ 手拿把蒜 ”,被编辑部嘲笑了很久,于是我们就问 GPT-4 “ 手拿把蒜什么意思?”

结果牛掰了,GPT-4在理解了一部分“ 把蒜(攥)”是形容事情轻而易举的基础上,引经据典地胡编乱造,颇有种当年我写作文时,引用的俄罗斯文学家“ 沃兹基索德 ”的味道了。

要知道,如果是真实场,这个半真半假、引用权威的胡说八道的后果将是非常严重的,堪称最高级的谎言。

明明连更老的 ChatGPT 也不敢这么捏造来源地胡说,更高级的 GPT-4 怎么会这样呢?

我们猜测,就是因为新版本更倾向于表现出 “ 更具有深度思考 ”,这么一来,在回答很多问题的时候,GPT-4 会自己给自己加戏,才会出现这些闹剧

虽然我们试了这么多漏洞,但总的来讲,这次发布的 ChatGPT,无论是基础功能、想象空间、逻辑能力、思考能力,都比之前强了一大截。

明明距离老版本 ChatGPT 颠覆我们的认知才没几个月,它们就又掏出了一个船新版本,我们只能说:恐怖如斯。

更恐怖的是,其实 GPT-4 诞生时间,可能比我们想的还要早很多,之前 OpenAI 发布基于 GPT-3.5 的 ChatGPT 时,内部员工就质疑过为啥发个这么古早的版本。

而我们也早就接触过 GPT-4 了,New Bing 官方今天发了个公告,承认了 New Bing 其实就是 GPT-4。

所以这么说的话,有没有种可能,GPT-5 也已经近了呢?

我已经开始期待除了文字、图片以外,视频、音频等形式的输入了。