淘姐妹

淘姐妹

传播学视野中的ChatGPT技术逻辑

电脑 0
传播学视野中的交往理论,传播学视野中的主持艺术阅读,传播学视域下,传播理论视角

#解码【【微信】】#基于大语言模型开发而成的人工智能产品【【微信】】在推出后立即引起社会广泛关注,短短两个月内用户数量已经突破1亿。【【微信】】是OpenAI公司GPT-3.5模型的直接应用,通俗地说,GPT模型不同于以往以句段为单位的块状文本拼接生成方式,它从底层算法上实现了基于概率的“字词接龙式”文本生成,即通过大型语料库学习获得的语言模型来生成自然语言文本。本文从技术呈现特点、功能与行业影响三方面来分析【【微信】】的应用及发展。

  拥有三方面技术呈现特点

  从技术呈现特点看,【【微信】】是自然语言技术领域一个具有里程碑意义的产品,是算力提升的一个标志性成果。作为一个算力强大的对话产品,【【微信】】拥有三方面技术呈现特点。

  一是面向开放域的应用。相比于任务型对话技术,开放域的对话技术难度要大得多。任务型对话有规定的范围和模式,积累一定数据的监督学习就可以有好的表现。而开放域是面向整个社会不同群体的不同对话内容,没有固定的应答格式。要形成有体验感的对话,与任务型对话相比,开放域就需要更复杂的对话技术和更大的算力模型。

  二是【【微信】】表现为具有连续多轮交互对话的能力。根据用户输入的内容,【【微信】】能够在联系上下文的基础上,提供更准确、更贴合语境的回答。为了实现连续多轮对话,【【微信】】使用了一种称为“上下文学习”(in-context learning)的方法来训练模型――在每一轮对话中,它会将对话历史和当前用户的输入作为新的上下文,继续生成下一轮回答。多轮对话就解决了用户的体验感问题,可以形成连贯的交流感,解决了之前聊天软件只能进行单轮僵硬对话的问题,这是自然语言对话技术应用层面的一次大飞跃。从用户角度来说,多轮对话意味着机器和人可以进入到一定对话场景之中,对话可以连续进行,而不是一问一答式的、与前面无关联的单轮对话模式。

  三是【【微信】】具有多模态信息生成的潜力。目前,【【微信】】定位为人工智能对话产品,支持文本、代码等模态,技术能力集中于自然语言处理领域。【【微信】】是大型语言预训练模型GPT-3.5在对话系统领域的直接应用,该模型未来可与其他模型或工具搭配使用,通过有效地生成与多媒体相关的文本描述,为多模态信息生成提供一种新的方法。

  让普通用户直接与人工智能对话

  从功能角度看,【【微信】】具有聊天、检索、知识服务、AI创作四种互联网功能,是一个具备复合功能的人工智能产品。作为一款现象级的人工智能产品,【【微信】】标志着人工智能领域自然语言处理技术从“To B”到“To C”的重大转变。此前,已经出现不少面向大众的对话软件,但这些产品在使用规模、体验感等方面都无法与【【微信】】相比。【【微信】】对话框样式的产品界面让大规模普通用户能直接与人工智能流畅对话。

  一是对话聊天功能。作为一款对话模型,聊天陪伴是【【微信】】提供的基础功能,日常闲聊或专业交流对其而言都不在话下。由于流畅的对话体验,【【微信】】得以在与用户对话过程中建立社交连接,满足用户的陪伴需求,对话聊天功能将是【【微信】】与用户建立黏性的重要功能。从微软小冰等社交机器人的经验来看,人机对话将成为数字交流的一个重要组成部分,而社会也有这个需求。人与【【微信】】建立的准社会交往关系,是人文社科领域值得持续关注的一个命题。

  二是信息检索功能。由于【【微信】】在自然语言处理方面的技术迭代,将为用户提供更直接更有效的信息检索内容。更进一步看,与现阶段的搜索引擎需要用户自己从检索结果中寻找答案不同,集成了【【微信】】模型的对话式搜索将直接为用户提供最优的信息检索结果。【【微信】】模型有助于打造下一代搜索引擎,如微软打造的新必应搜索(new Bing)在这方面已经走在了同行前列。新必应已经打破了搜索引擎多年来形成的产品形态,成为新的搜索形态的开始。

  三是知识服务功能。【【微信】】的模型拥有1750亿个参数,用以训练的数据集包含数百亿个单词,规模超过45TB空间,类型涵盖网页、电子书、新闻文章、论坛帖子、电子邮件、社交媒体等各种文本数据。因此,【【微信】】聚合了人类世界的广泛知识,能够以问答形式提供知识服务功能。更重要的一点是,【【微信】】的大模型对当前知识服务网站的准确度和质量提出了挑战,如它可以完成程序代码等具有一定难度的知识服务,甚至可以完成大学生作业和考试等,其知识服务能力也会持续增强。

  四是AI创作功能。【【微信】】的强大之处在于它的输出是真正生成式(Generative)的。【【微信】】基于字词的概率分布,在文本生成时根据给定的输入前缀,预测接下来的字词,并将其作为生成文本的一部分。所以,【【微信】】可以根据用户提供的主题或关键词,自动生成新闻报道、评论、诗歌等文本内容,还可以创作图像等。AI创作降低了艺术创作的技巧门槛,人类可以直接进入情感表达的艺术创作之中。

  将云服务提升至智能时代

  从行业影响看, 【【微信】】兴起带来的影响非常广泛,也将云服务从数字时代推进到智能时代,智能化将显著提升各行各业的生产效率。未来用户对云厂商的需求将聚焦智能服务,是模型、框架、芯片、应用的全方面竞争。具体到相关产业,人工智能的产业竞争至少包含三个方面。

  一是复合功能的竞争。通用型的人工智能是众多科学家不懈追求的目标,但目前的技术还很难接触到通用型人工智能。即使是【【微信】】也只是处于专门化人工智能阶段,技术框架和技术逻辑没有革命性的突破,更多是过去技术的集大成。但【【微信】】能够完成对话聊天、知识服务、AI创作等多种复合功能,这是在专门化人工智能技术阶段的技术聚合的突破。换言之,复合功能的人工智能产品将是未来的发展方向。

  二是大模型的竞争。【【微信】】带来的一个思考就是大模型将成为下一步人工智能领域的重要形态,人工智能技术将更多地从实验室走向应用大模型。GPT初代模型拥有1.17亿个参数,GPT-2的参数数量增加到15亿个,GPT-3的参数数量更是比上一代多了两个数量级,达到1750亿个参数。参数越多,大语言模型的智能化程度越高,这方面的竞争也会愈发激烈。

  三是大资金的竞争。据有关报道,继微软在2023年1月23日宣布向OpenAI进行第三轮达数十亿美元的投资后,谷歌母公司Alphabet在2月4日向【【微信】】竞品Anthropic投入3亿美元,以开发生成式人工智能。人工智能越来越需要强大算力的支撑。大模型离不开大数据,可以预见,未来人工智能模型的训练集规模将呈现陡然增长的趋势。面对更多维度和更高量级的数据,算力是必要的支撑。因此,如何获得强大的算力将成为未来的竞争方向,但其前提就是需要有足够的资金支持。

  最后,对于【【微信】】当前的火热态势,人们也应该冷静思考。我们要认识到,以【【微信】】为代表的人工智能只是一种技术手段,【【微信】】是一种更高效、更便捷的技术,是新技术的迭代。【【微信】】代表的是自然语言技术的一个方向,但不是技术的全部,自然语言处理技术领域还有很多可以开拓的方向。进一步来看,我们要从技术逻辑来理解人工智能技术,而不能将认知与判断建立在好莱坞电影式的想象之上,否则,就会对人工智能产生无意义的恐慌,认为技术会很快颠覆人类社会;或者盲目地夜郎自大,以小模型充当大模型,认为短时间突击加班就可以完成技术突破。这两种心态都不利于技术创新。应对人工智能技术的挑战,需要按照技术逻辑来理解,在技术逻辑基础上建立技术创新的运行规则,我们才有可能真正赶上人工智能时代的技术迭代发展。

  (作者单位:北京师范大学新闻传播学院)

作者:张洪忠 刘绍强来源:中国社会科学网-中国社会科学报

举报/反馈


chatgpt是真正意义上的ai吗 AI与ChatGPT区别

chatgpt,chatgpt国内能用吗,chatgpt怎么读,chatgpt中文

写在前面

ChatGPT 自去年11月30日发布后,开始在科技圈里引起热议。到了如今2月份,已经变成(科技领域)全民狂欢,有个说法是,Web3的开发者大都掉头去搞 AI 了;大厂纷纷入局,紧张加码;民间也有老王带5000万美金下场,ChatGPT 套壳产品遍地丛生。

在充满焦虑和 fomo 氛围中,我还是想着是否能捋出一条自己的思路来――AI 到底能做什么?

很多初次接触的朋友第一印象就是,这不就是个很聪明的聊天机器人嘛?无非是个加强版的小冰。有趣之后,怕是就没有需求了。这个观点恐怕是错的。跟很多过气的产品不同(如换脸的 ZAO),ChatGPT 让人耳目一新的不是聊天接近通过图灵测试(Turing Test)了,而是背后的 GPT 技术,让人意识到,原来砸语(jin)料(qian)真的能砸出质变来。

正如 OpenAI 的 GPT-3早在2020年中旬就发布了,为何当时没有引起轰动,有了 ChatGPT 才全民关注?就是 OpenAI 发现没人体会到其进步之处,只好自己做了层应用的壳,让大家开开眼。

开眼之后,若是再只看到聊天机器人这层价值,就叫人哭笑不得了。

正如 OpenAI 的 Sam Altman 自己说的,不喜欢 generative AI 这个词儿,它似乎暗示 AI 的目的只是做内容生产,这就忽视了其背后的价值。

就像他也不喜欢 Web3一样。不要用概念蒙蔽了价值。

很多朋友的推演,是会成为谷歌和百度的替代品。这是很天然的想法,目前 ChatGPT 证明了信息获取和整合的效率是大于搜索引擎的,【【微信】】 也是真的 NB,想体验一票难求。不过这也未必是终局。

我从纯个人的视角,和过往对互联网的观察经验,自己捋了出来 AI 的7个可能性。它们代表的是不同市场中的价值,自然也代表着不同的红利机会。希望这些思考能对你有所启发。

另外,这个路径不存在时间关系,只是凭直觉做的影响面的排序。越往前,越已经在成为现实;越往后,则越有革命性。

1. AI as Chat Bot

聊天机器人是最直接的产品形态,它的价值自然是最低的。其实 Sam Altman 自己就说过,ChatGPT 是一个 horrible product,它有大量的错误信息,不是拿来做实际应用的。这就像是演示某个机器的 demo 一样,被很多人认为是唯一的产品形态了。

但哪怕聊天机器人,想象空间可能也比大多数人预期的要大。

ChatGPT 与小冰和百度 PLATO 比,并非只是显示出了更善谈、更体贴的能力提升,更重要是在此建模能力和计算能力基础上,可以做个性化的事情了。

这是脾气贼差的百度 PLATO,发布于2021年10月,参数量百亿,是 GPT-3的1/17。百度即将在3月发布的最新模型,可能参数量会翻倍。

对比而言,ChatGPT 如今体现出来的耐心、体贴和妥当,被网友们普遍称赞:

在个性化聊天机器人方面,推特上有一个很温暖的案例:@michelle huang 用 GPT-3再造了一个童年的自己,并跟她对话。

以此类推,这样针对性的聊天机器人还可以用于很多陪伴的场景:

-亲人去世,用亲人过往的语料生成一个很相似的数字人;

- 给抑郁症或自闭症患者,提供一位温柔健谈的朋友;

-想要学习语言的朋友,有一个能够准确指出错误并认真指导的辅导(已经有了口语陪练教程:【【网址】】/video/【【微信】】);

- 让小朋友有一个不同于家长和老师的有耐心的无所不知的长辈;

- 在养老院或独居在家,没有亲人常伴的老人,有个倾诉对象(甚至帮着写一篇人生自传?);

这也不是天方夜谭,有一个产品叫 Replika,已经上线了,用的就是 ChatGPT 的技术。你可以根据自己的需求生成一个虚拟女友 or 男友 or 单纯的朋友。目前还引起了不少有关性骚扰、家暴、隐私等问题的争议,具体不展开说了,有兴趣可以自行搜下。

这些都是非常现实且有效的场景。焦虑的当代人面临孤独困境,聊天机器人能更好地完成陌生人交友的 APP 原本的任务。有反驳的声音会说,孤独困境应该用人与人真正的交往解决,机器是冰冷的。我不太同意这个观点。在社会结构性的困局还没有解开时,长夜漫漫的独身打工人、养老院里卧床的老人、父母在外留守在家的儿童,当下的需求仍需要解决。

说句题外话,AI 在未来各个场景下都会被戴上一个很虚无的帽子:「机器是冰冷的」「没有灵魂」「它并不是真正在思考」,这是历史上重现了无数次的了。回答这句话最好的方式,就是引用乔姆斯基老爷子的那句名言:

Thinking is a human feature. Will AI someday really think? That's like asking if submarines swim.

思考是人类特性。AI 有天会思考吗?那就像是在问潜水艇会不会游泳一样。

它们能跟人一样完成任务,那是怎样完成的,并不重要。

以上是第一大场景:陪伴型聊天机器人。如果要评估价值的话,也许是陌陌+Soul+心理疾病治疗工具+养老设施+.. 这么计算。看起来是百亿级的市场。

2. AI as Creator Tools

第二个场景,也是如今热议最多的话题之一,即成为创作工具。这也在成为现实,也是大家热议,也许会替代掉不少创作者的场景。

在插画领域,这是最明显的。很多图片都可以胜任。按照 Midjourney 的情况下,出图速度大约是1 min 左右,出图价格大约是0.4-0.5元人民币。当然,不见得每张图都很理想,再加上还要 【【微信】】 的过程,凭我的经验,10 min、10元之内做出一张满意的插图,是可靠的

各位可以感受下这个速度与价格,跟几千到上万报酬的画师的效率比。

这是最近一周我闲来用 Midjourney 做的一些图:

目前 Midjourney 还有些注册和使用上的麻烦。未来中国有自己的绘图工具,是必然的,可能今年就会出现。届时在插画师(专指按照甲方要求完成创作的,不算艺术家)领域会有一轮血腥的清洗。

插画之外,AI 做概念图也是好手艺。

虽说这些概念图显然没到可用的地步。但作为工业设计行业、互联网 UI 设计、游戏设计等等的参考,是完全没问题的,很好用的(再想想10 min 、10块钱是什么概念)。

说到游戏行业,似乎 AI 概念图带来的冲击是最大的。网游里大量的角色设定、装备、道具等等,都很擅长。这两张都是我用 Midjourney 做出来的示意图:

图的冲击是直观的。文字内容和视频内容也不是岁月静好。先感受下这样的文风模仿:

这里面有两点体会:

  • ChatGPT 的模仿能力实在很强,写得像模像样;
  • 由于是凭空去写,ChatGPT 的内容显得很空泛。

若是给出具体的内容,表现力就要强不少。

假如 ChatGPT 有更多的中文语料,或者干脆扔100篇知乎回答,或者300篇小红书笔记给它,结果肯定是不同的。专门的微博写作机器、知乎写作机器、小红书写作机器,都会应运而生。

用 AI 润色加工,成为绝大多数内容平台的必备流程,这也是会必然发生的。

同样的事情也会发生在音频领域。我自己一直在用微信读书,听书体验在几年内有肉耳可闻的变化。谈吐的流畅程度,重音的准确性,以及语气的恰到好处,在大多数语句里,跟过去的人工阅读差异不大了。

现在最新的 AI 能力,是可以根据你的声音,来定制生成任何语音片段的。以及有很多相关的工具,可以做视频操作。(更多可以参考这篇很好的整理文章:关于 AI 的107个人,61个工具和28个通讯)

闲话不多说了,还是跟 OpenAI 做 ChatGPT 一样,嗦这么久也许不如做一个有冲击力的实际的案例。各位感受一下吧。

这里的图片是 Midjourney 参考《狂飙》里的卖鱼仔老默做出来的;声音由 Ele【【微信】】 生成,取样是我过去录制的三期单口的播客;讲话内容是 ChatGPT 生成的对 AI 的看法;对口型生成视频是 D-ID 的 AI 产品做的。(参考了@汗青、@Leo的思考笔记、@Szhans 提供的资料和方法。推荐去即刻社区关注他们。)

目前这些 AI 功能的成本并不高。整个制作成本按用户侧算约合20块钱,半个多小时搞定。可以猜想下对未来内容制作行业的影响。

还有一个有意思的案例,是可以进一步降低制作门槛的:

直观的感受是,抖音、视频号、小红书的内容,会很快有工业化生产替代机械劳动的机会,很多编辑、美工、剪辑会纷纷失业;知乎、豆瓣和公众号会慢些,也不远。

我脑海里总会浮现一个景象,就是一个视频账号的主理人,每天可以发10条高质量的内容,一人成团。他需要做的,就是设立主题、检查进度和斟酌内容的改进意见,剩下的,从取材、求证、编排、拍摄、制作、配音等等由 AI 搞定。

(用 Midjourney 绘制的场景)

这是第二个场景,内容创作的辅助工具。它带来的应该是目前所有内容工作室的基础工作的价值,估计也是百亿量级的市场,而能占领这个市场的,大概率还是目前的大型内容平台。

3. AI asCreator

接下来就需要一个思想实验了:推演一下内容创作的生态,如果 AI 足够强大,真的需要人的参与吗?会不会从选题,到迭代,AI 全部能包圆儿呢?

这里有三个命题,每个都会有不同的结局。

第一个命题是:AI 能不能选题并制作出好的内容?

这在某些品类下也许可以。拿搞笑类的视频举例子,我经常看到有些短视频,内容就是小时候看过的《故事会》里的那种袖珍小笑话。对于 AI 来讲,理论上是可以搜集人类历史上几乎所有信息的。那它可以设法翻遍的所有笑话,结合想象出来的场景,配适当的人物形象和台词,做成视频。

对于如何判断是否搞笑来说,AI 一开始未必能真正做好。不过互联网的内容平台,擅长的就是基于反馈快速迭代,这与 RLHF 的逻辑契合。AI 负责做抖音的短视频,它可以通过海量用户反馈去快速学习到底喜欢看什么。那前面说的一人成团,干脆就变成无人成团了。

抖音原来是圈养了一大批创作者作为佃农,这些佃农尚且有一定风险,也有管理成本(抖音的赛博佃农逻辑),那干脆圈养永远不会反抗、老老实实听话的 AI 创作者就更理想了。AI 是没有感情的工作机器,放很多个模型互相去内卷,也不会有人上天台,不会有人闹仲裁。

第二个命题是:AI 能不能也产生情感链接,让人不会出戏?

AI 可以制作异步消费的视频、音频、文字和图像,但它能否更进一步,在直接与人互动方面,也有突破性进展,能让人不出戏,真正以为对方就是人?

前面我们聊到的 Chat Bot,还是在不得已的情况下,作为人的替代。若是身边真有亲人朋友,那不需要一个虚拟的陪伴;身边真有专家,也不需要数字人专家。而这里聊的,是假如可以选的话,AI 更受欢迎,会怎么样?

比如在直播领域,AI 也可以能言善辩,也可以讲历史谈文化,更可以跟某些评论区的网友互动(在判断跟谁互动效果最好这件事上,也能训练),对商家而言,调教一个自己的虚拟 AI,就很值得。这跟前两年流行的虚拟形象/数字人不同,那些形象都是真人外面包了一层皮,讲话都是写好的稿件、或者真人发声,背后都是收入微薄的运营。个性化的虚拟 AI 有价值的不是外部形象,而是 AI 的对话模型,和模型所带来的不同人格。

游戏直播也是如此。AI 也可以操纵游戏主角,尝试大量的可能性;可以尝试顶尖的手速,也可以模仿笨拙的新手;可以去做很多人不愿意做的事情,比如探索各种极端情况下游戏会怎么发展(很多游戏主播就是以此为主题的)。

*行业也有这样的机会。在*游戏里,捏出个性化的对象已经是刚需了。是不是可以有近似真人的体验?

这些都取决于一个大问题:普通人对 AI 是否真的能产生情感链接。意识到屏幕对面是个不存在的数字人,我们会不会真的投入情感?日本御宅族里有对二次元人物过度迷恋、甚至跟纸片人结婚的先例,会被认为是病态。未来社会是否能对此习以为常?这很难说。

第三个命题:个人 AI 内容的成本降到无限低。

刚刚说的还是创作者来捕捉用户的需求,那如果用户的需求可以精准实现呢?我们把 AI 想得再理想化一些、对计算性能的单位成本再低一些,就能推演出一个完全不同的生态。

在一百年前,电影已经诞生。那时候想要看到大屏幕上的内容,是富人的特权。跟当时的人说,未来每个人手里都会有块屏幕,而且这个屏幕的内容是个性化的,每个人可以自由选择做什么事情、看什么内容,当时的人一定会觉得奢侈。

那未来的 AI 制作内容,会不会成本低到,可以千人千面、真正个性化呢?比如设想这样的场景:

用户输入一段电影的需求:「我想看一部修仙小说,题材跟无间道类似,主角是梁朝伟和刘德华饰演的。他们分属不同的世仇门派。梁朝伟擅长的法术是火系的,刘德华擅长的法术是黑暗系的......」 接下来,AI 就会编排出一部按照要求制作的、剧情精彩画面出色的类型片电影。

如果这种能力在成本断崖下跌后真的实现,就会带来全新的体验差。小说、音乐、播客、电影、电视剧、动画,都可以以此类推。

电影一开始也许不满意,那用户可以自行修改:「这里的场面从峨眉山,改到夏威夷;那次的战斗里,不要让阿紫牺牲...... 」也许整个娱乐行业会变成互动为主的产业。并非是创作者单向输出,而是有一个谦和且耐心的 AI 创作者为用户服务。

这种生态下,如今我们在消费的大部分内容乃至娱乐产业都会由 AI 完成。人类就会集中去做更先锋的电影、音乐,那些 AI 用历史上的资料无法完成的内容。

这三个命题的成立与否,都会深刻改变内容娱乐行业,改变的程度不同。第一个命题,可能会产生新的抖音和 B 站,紧接着就是新的爱优腾芒;第二个命题,会产生新的直播行业,乃至新的内容电商;第三个命题,则是要产生新的内容和娱乐行业了。这三个变局里,也许新兴的内容平台就有从体验差带来的新机会,未必只是旧平台的独有优势,就充满了变数。

4. AI asAssistant

把 AI 当成内容创作者,那么 AI 的天花板就是内容娱乐产业。不过 AI 显然不止于此。

AI 在日常生活里其实已经很常见了,只不过都是无感知的、水下的,或者说更润物无声的。我们用的翻译工具,都是机器翻译技术支持的;我们打开淘宝,商品都是由个性化引擎的 AI 推荐的;刷门禁、打开手机和电脑的人脸识别、指纹识别也都是 AI。它们在替代掉一些过去人工的工作。

在更专业的专家(Expert System)领域,AI 的应用就更早了。1980年代,CADUCEUS 就可以从血液里的细菌做一些特定疾病的诊断。这中间有大量的垂直领域专家系统的研究进展。到如今比较知名的,Deepmind 旗下的 AlphaFold,可以预测所有的蛋白质结构。

不过 ChatGPT 让很多人体会到,应用到日常工作里的可能性。

像这种演讲稿,虽是玩笑,但在很多场合下已经能帮我们完成文案工作了。类似的还有很多,我之前也提到过,OpenAI 官网的总结:

  • 整理目录;
  • 整理文章的关键词;
  • 从产品描述得到广告语;
  • 给产品起名;
  • 根据主题列出推荐书单;
  • 整理总结中心思想;
  • 总结论文摘要;
  • 撰写采访提纲;
  • 自动代码注释;
  • bug fixer;
  • 把 Ja【【微信】】 改写为 Python;

智能助理的概念出现很久了,现在才算是真正可用。对于工作中可能帮到什么,可以先看下 Notion AI 的体验。

这大概率就是未来在 Office 套件里我们用 Word 和 Excel 的体会。(有兴趣的可以直接参考下这个视频:【【网址】】/video/【【微信】】)

它能够协助的方面还有很多想象空间。

比如有一个插件叫做 Bearly.ai,可以整理浏览器里看到的网页的核心思想,跟我们小时候做的阅读理解中心思想归纳差不多。

这里是一个示意,左下角是用另一个翻译插件得到的结论。

HyperWrite 可以依据你写的内容,提供写作建议,或直接帮你改稿,还可选随意一些的风格,还是严肃正式的风格。

像飞书妙记也是 AI 技术的辅助,会议记录或录音文件转成区分讲话人的文本,且可对应音频时点做调整处理。播客圈用过的朋友都说好。

更大的变化就在确定性更高的代码领域了。程序员们发现,ChatGPT 能很好地帮他们解决问题。并不仅仅是 debug 那么简单。

让代码更简化(ChatGPT应用场景):

找到一些配置问题:

确定性较高的场景,除了代码,就是各种考试。ChatGPT 通过了 Google 的18万美元 L3工程师考试之外,还通过了美国的司法考试(明尼苏达大学宪法、福利法、税法和侵权法)、商学院考试(沃顿商学院 MBA)、医师资格考试(USMLE)等等。

很自然,也变成了学生作弊的工具。美国教育界已经有很多学校禁止使用。这里不展开说了。

ChatGPT 的能力有很多想象空间,在细分的信息处理领域里。

比如这个 Snipd 的 APP,提供的是 AI 处理后的播客内容。跟一般的播客客户端不同,这里会根据时间轴有核心的观点总结。这样很好地解决了不少人觉得播客时间太长、听了半天才遇到对自己有帮助内容的问题。

以此类推,罗振宇和「得到」和不少知识相关的内容创作者们,长期致力做的事情就是信息的搜集和整合,这些是否也是 AI 能取代的?比如,整理哲学历史上的概念关系、人物图谱和相关书籍论文的摘要?

比如大家很痛苦的找 Excel 的公式语句(已经有人用ChatGPT做Excel报表了):

比如,Tome.app 这样的产品可以自动生成一套商务的 PPT:

(Tome.app这里有一个试用视频:【【网址】】/video/【【微信】】)

还有意想不到的应用方式,用 OpenAI 的 DALL-E 2模型给犯罪嫌疑人画画像(https://www.vice.com/en/【【微信】】/qjk745/ai-police-sketches):

这些产品和能力,有的会进入办公套件,有的会在细分领域越来越方便,国内肯定也会雨后春笋。它们都会陆续成为「打工人」的标配。

说到这里,有年纪的朋友估计能想起时代的眼泪,预置在 Office 里的 Clippy, 可能会再次焕发青春(以不同的形态):

在辅助办公的领域,市场的价值应该至少是如今办公领域的半壁江山。也类似前文所说,若是以功能附加的形式加入原有的办公工具中,那机会还是在旧势力手上的。

5. AI as Worker

跟前面说的思想实验类似,如果办公辅助真的那么奏效,是不是 AI 也可以完全包圆儿了呢?

这里有一个命题是:AI 能不能做出比打工人优质,或至少差不多水平的决策?

命题为真,白领人群就真的会比较危机。老板可以让 AI 安排行程、收发邮件,让 AI 做数据推演,让 AI 完成产品的大致设计和研发工作。AI 还能持续学习,了解老板的个人喜好,和企业经营策略。坊间唱衰数据分析师这样的岗位要被淘汰,也是基于这样的逻辑。

不过这点就当下看,并不乐观。有新的评论说,【【微信】】 发布会上看起来很惊艳的总结 Gap 第三季度财报的结果里,其实是有大量错误的。

「【【微信】】 给出了 Gap 调整后的运营毛利率(reported operating margin, adjusted for impairment charges and restrucring costs)为5.9%。然而在财报中,Gap 的运营毛利率是4.6%,调整后则是3.9%。」(ChatGPT加持的微软【【微信】】也错误频出)

现在大多企业怕是不敢真的把 AI 辅助用到重要决策里。哪怕给老板写个邮件的朋友,应该也得检查下 ChatGPT 别脑袋一抽瞎写了不靠谱的内容。

但话说回来,要是办公辅助变成了大多数打工人的日常,这相当于也提供了更多的训练数据,又是 RLHF 的逻辑了,AI 势必会变得更懂决策。想想还有点儿不寒而栗――无数打工人在用 AI 帮自己打工,结局是 AI 变得更强了,让打工人没机会再打工。

这件事就需要再观望了。对少数不太依赖人参与决策、确定性更强的领域,会陆续变成无人公司,是会发生的。像量化交易,就是一人也能成团的生意。

这样的影响面就不止办公领域了,是整个白领职业市场都要洗牌。白领的洗牌,也很有可能内部无法迁移,组织中利益关系错综复杂,除非有马斯克那样的独裁又笃定的组织改造。也有可能是外部打破僵局。

不过洗牌之后,似乎蓝领才是所有打工人的宇宙尽头?

这里正好可以引用一段 Sam Altman 采访中说的话(@Alex Banks 整理):

如果你10年之前问大家,AI 会产生什么影响,会是这样的:

  • 第一步:蓝领失业(工人/卡车司机);
  • 第二步:基础工作的白领;
  • 第三步:高新技术工作的白领(程序员);
  • 第四步:创意相关的工作。

如今看,发生的顺序是恰恰相反的。

6. AI as Search Engine

用 ChatGPT 第一直觉是聊天机器人,第二直觉就是,这不是跟搜索引擎很像吗?是获取信息的重要工具。

以此为前提,很多朋友实验过之后,发现 ChatGPT 给出的答案错漏百出,很多时候有惊艳,很多时候也会误导事实。更重要的是,没办法校验真实的情况。搜索引擎是有网页权重排序的,同时对信源有疑虑,可以亲自去查阅判断。ChatGPT 只是单纯的回答,不是一个理想的信息获取产品。

实际上从产品视角看,ChatGPT 不是替代搜索引擎,而是跟前面说的 Assistant 的逻辑一样:信息的辅助处理。搜索引擎依然发挥作用,ChatGPT 是极其有效的整合工具。就像发生在很多信息处理的情况一样(如 Word 和输入法的错别字检测,很顺畅地融合进日常使用)。

【【微信】】 提供了一个很出色的整合方案,可以更有效地看出 ChatGPT 在其中的作用。它不是只留了 ChatGPT 的回答,而是在上面加了一层。

如图,左边是原始的网页列表,右侧则给出了整合的结论。可以理解是一个耐心的朋友,帮你看了一遍网页,告诉你他 get 到的信息

这个不够直观的话,可以看这个案例。记得前面我发的0素材的自制视频吗?当时有朋友问是用哪些工具、怎么做的。

正常使用搜索引擎的思路是,把每一个工具输入进搜索框,看每个工具的官网/百科,了解下大概的说明。再输入下一个。等等。

而用 【【微信】】 的体验会是这样:

这里面的信息,几乎是没错的。哪怕有些没有那么准确,会发现有出处的标注,完全可以点进去了解详情。

类似的搜索整合能力,从目前的 ChatGPT 也能找到体现,比如这是范冰冰哥的一个案例:

这里还有一个示例,是把 ChatGPT 接入 Siri,看效果的对比,也挺直观的(来自 【【网址】】/Daiyimo/Access-chatGPT-in-Siri),可以暂且无视拉胯的连接网速的问题,只看结果的区别:

这种体验差是完全可以压过替代成本的。一个配套了 ChatGPT 的 Bing,在不是为了明确结果(如搜苹果官网)的情况下,体验是比 Google 好多了的。这样的体验差,会让很多人都涌去用新的产品,而这时就会有有趣的事情发生了。

首先,目前的接口调用是有成本的,GPT 的每次调用大概是0.066美元一次,而全球的搜索引擎广告收入是每次搜索0.048美元,即使用 GTP 是亏本的。不过目前 GPT 调用里有云服务的成本,这块微软可以打下来打到0.033美元,再加上技术优化,预期是可以到0.00825美元。(参考ChatGPT背后的经济账,感谢 Martin 分享的信息)

简单说就是:搜索引擎引入 GPT 这样的技术,哪怕不亏,也一定比原来赚得少。

这种境况下,就是创新者的窘境了。就像拼多多当年做的很多事情,淘宝没法跟进,因为要大出血。Bing 的用户量远低于 Google,所以用 GPT 换用户很划算;Google 则是要