淘姐妹

淘姐妹

ait绘画 ChatGPT可以绘画吗

电脑 0

淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】


研究了四个多月AI绘画,又把ChatGPT作为日常工具用了一个多月后,忽然有点明白特德・姜那篇《ChatGPT是互联网的一张模糊JPEG图像》背后的含义了。

有人问AI为何不会画手指。其实何止手指,如果你放大仔细观察就会发现,衣服、建筑、物体、光影,AI几乎没有一个细节是能完全画好的。只是手指最突兀最容易被一眼察觉而已。

因为AI目前的训练集只不过是512x512到768x768分辨率的图片,而各种附加的、混合的、额外训练的模型,受限于算力,也无法从根本上提升它的精度。

你看到的AI成品越精美,其实代表它越接近于原始训练集,换言之就是过拟合了。

如果试图单靠AI画出一张细节尽可能完美的图,结果往往会令人沮丧。例如只有一只手不完美时,理论上我们可以用Inpaint单独重画,但很可能几百轮重画下来都未必能达到想要的结果。全图重画又可能顾此失彼,手完美了,别处又乱掉了。

这几乎是“精度不足”现状下的必然情况。区区数GB的基础模型和消费级显卡,在可接受时间内能生成的极限就是如此。

能精准控制绘画结果的Controlnet发布后令人精神一振,正说明了AI绘画至今困扰我们的局限所在:不借助人力进行强力干预的情况下,单靠AI画出理想的作品难如登天。

绘画和ChatGPT、还有精度有什么关系呢?

同为AI,同样基于神经网络,底层终究会遇到同样的问题。

我们尚不清楚背后的GPT 3.5模型究竟有多大规模。但想想就知道,无论如何都会比它吸收学习的整个互联网和人类知识总和要小得多得多得多,至少有几个数量级的差距。

在咨询一些笼统概念、文本写作时,ChatGPT会给出很漂亮的结果。

而一旦你寻根究底,试图让它在细节也尽善尽美,就会出现哭笑不得的结论。

前些天我在微博看到小学的数学题,很简单,打算塞给ChatGPT问问。

只要学过九九乘法表,对里面的数字就会有直觉,然后得出结果。

当然,ChatGPT没有这种直觉,但它也能找出其中的规律:

令人疑惑的是,尽管它换了种方式来总结规律,而且规律是正确的。但最后的答案却是失了智一样。

后来对话反反复复进行了好多次,无论我如何引导,它只会不停道歉然后再次装模作样地分析,得出再一个不同的错误答案。

这时候心累的我脑中忽然闪过一个场景,就是此前在调教AI绘画时,那个反复无数次也画不好的手指:

它的精度已经到极限了,再精妙的算法也没法从单个像素还原出一幅图,或者从单个数字还原出一本数学书。

而且,这种精度不足不仅仅出现在数理问题上,人文历史方面只要不停追问细节,一样会最终崩溃掉。

随便举个例子。我很早前问过它一个知识性问题:乾隆年间为何中国人口迅速增长。

它回答了四个原因,包括粮食增长、健康医疗、战乱减少、人口流动。当然每条还包括了一些解释。

然后我追问粮食为何增长,它回答农业技术、水利、土地制度、外贸等。

我再追问农业技术有哪些,它回答引进种子、灌溉、耕作、动物饲养等。

继续追问具体哪些种子,它抓瞎了,只能承认自己不清楚,但声称据记载还是引进了许多农作物和动物的。

再问哪些农作物和动物,精彩的来了,它居然直接告诉我,引进了棉花、花生、甘蔗、番茄,甚至马、牛、羊、猪。

这时候按说它已经崩溃了。反问一句,这些真的都是乾隆年间引进的吗?它就开始说,其实不是的,有的是唐朝,有的是明朝,跟上一句已经开始前后矛盾。

再问下去没有更多意义,无非是精度触底后在说车轱辘话而已。

恐怕大家最近在网上见过很多ChatGPT的搞笑答案,其实相当一部分,就是AI在极限精度下随机冒出的胡话。

也正是因为如此,ChatGPT和new Bing能漂亮高效解决我们生活工作中的一些问题,却解决不了另一些细节更多的问题。

而更沮丧的是,中文互联网内容质量的低下和封闭,最终导致中文部分在这张JPEG图里会“更模糊”一些。

有可能即将到来的GPT-4会大力出奇迹,靠高出几个数量级的训练集再次突破我们的想象力;或者在当前模型体系下触碰到了AI自身的算力极限,发现它也只是一张分辨率更高而放大后同样模糊的JPEG图片……

补充个例外:ChatGPT能生成可直接运行的程序代码,这不是因为程序的精度要求低,而是OpenAI背后专门有细分模型(Codex,最新版本代号【【微信】】)针对代码生成做了海量学习。你可以想象成如果AI专门用几千万张人手图片特训过模型后画出的手必然不会是现在这个样子。

(注:题图是用“ChatGPT Is a Blurry JPEG of the Web”为关键词让AI画的)

#AI绘画# #ChatGPT#


一克商评|集众家所长,ChatGPT版必应是对搜索的颠覆|B站|AI|必应

集众家之所长出自哪里,集众家所长于一身,集众家之长而长于众人出处,集众家之所长的成语

  微软已启动全球路演:推动ChatGPT版必应搜索商业变现

  据报道,微软已开始向广告主展示AI聊天机器人加持的必应搜索引擎的广告会变成什么样。目前,微软正在围绕生成式人工智能聊天机器人,探索新的收入来源。广告行业的消息人士表示,过去一个月,微软正在全球各地举办路演活动,并与广告主和广告公司举行非公开会议,展示其测试中的ChatGPT版必应搜索的广告形式。

  封清扬:新版必应可以说是联网版的ChatGPT。目前的ChatGPT只能获取2021年之前的知识,而搭载了ChatGPT同源技术的新版必应能够弥补“仅限2021年之前”的不足,整合归纳“新鲜”资讯,给出搜索结果。大概就是百度搜索微信对话式交流知乎整理归纳信息大众点评筛选好评内容……可以说是综合了各类应用的看家本领,集大家智慧为用户带来最准确、最全面、最个性化的搜索体验。这是对整个搜索的颠覆。

  B站治理网暴、谣言类内容,将限制9大类谣言传播

  为了落实中央网信办清朗网络环境等专项行动要求,3月14日,B站发布《关于整治网络谣言、网络暴力类内容的倡导》,持续整治谣言、网暴类内容,打击“造谣传谣”、“网络爆破”等9大类违规行为,维护社区氛围与网络环境。针对组织、企业发布不友善信息的行为,也被B站纳入到治理范畴内。针对违规内容和行为,B站将采取限制内容传播、折叠、添加提醒标识等措施。如情节严重、影响恶劣,B站也将酌情对违规账号的使用权限功能采取部分或整体封禁、对账号添加提醒标识等措施。此外,B站还提供平台投诉举报功能及客诉渠道,帮助用户及时反馈,维护自身合法权益。

  起士:平台治理是很多互联网企业的长期课题,B站虽然不是弹幕的发明者,但弹幕在国内的影响力却是B站实实在在长期培养出来的。相比web2.0时代门户网站、论坛等形态产品主要以评论、留言的用户发言形式,视频弹幕更有冲击力,也更容易成为情绪的发泄口,B站此次发布对网络谣言和网络暴力内容的倡导,并推出相应的功能和平台规则,是平台有序发展的自然结果。

  腾讯助力地震预警“最后一公里”

  3月14日,四川省地震局与腾讯公司举行合作框架协议签约仪式。双方将围绕地震预警信息发布、震后信息综合服务、自然灾害风险普查数据运用等展开深入合作,共同探索地震灾害“最后一公里”信息化公共服务新模式。据介绍,本次合作,双方将针对以上挑战共同探索应对方案,在广播电视、专用终端、局域喇叭、手机等地震预警信息发布渠道的基础上,借助微信平台向公众发布省地震速报预警信息,这将是地震预警“最后一公里”的有效补充,提高预警信息覆盖率和有效性。

  豪伊:上天容易入地难,此次合作的意义不仅在于技术层面的合作,更在于微信平台的到达能力。一个月活达到十几亿,几乎人手一个的app,无疑是实现地震速报到达的最佳途经,能够极好的提高预警信息覆盖率和有效性。后面的问题是,保证网络和信息传输的稳定性,这是围绕新基建,腾讯乃至于其他互联网科技公司需要达成了另外一项工作了。

  创新工场李开复:AI 2.0已至,看好三类投资机会

  #声音#

  创新工场董事长兼首席执行官、创新工场人工智能工程院院长李开复在分享会上指出,AI已经来到从1.0迈入2.0的拐点,AI 2.0将会带来平台式的变革,诞生全新平台催生新一代AI 2.0应用的研发和商业化。创新工场主要关注三类投资机会:AI 2.0智能应用、AI 2.0平台和AI基础设施。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。