淘姐妹

淘姐妹

百度版ChatGPT股市遇冷!正主却在一路狂飙进化|Focus

电脑 0
百度版超级联盟,百度版唱吧绚舞,百度版超级群英传怎么充值,百度版创造与魔法

编译 |?ZeR0

编辑?|?漠影

出品 | 芯东西

3月16日,号称“中国版【【微信】】”的百度“文心一言”正式发布,其港股股价一度下跌10%。对比OPEN AI近日发布的【【微信】】4.0,其GPT的狂飙进化,离不开底层算力的支持。

截止3月16日港股收盘,百度集团报收125.10港元/股,对应市值3458亿港元(折合人民币3040亿元)。对比今日(3月16日)开盘价下跌6.36%,市值缩水近百亿港元。

「不二研究」带您揭秘【【微信】】背后的算力杀手锏,以下Enjoy:

芯东西3月14日消息,为了向人工智能(AI)初创公司【【微信】】的前沿研究提供支持,微软三年前为【【微信】】打造了一台由数万个A100 GPU组成的大型AI超级计算机,成本或超过数亿美元。微软还在60多个数据中心总共部署了几十万个推理GPU。

据微软Azure云业务的高管透露,爆火的【【微信】】聊天机器人【【微信】】正是由这个AI超级计算机提供支持。当前微软正在打造更大、更复杂的超级计算机,为新模型训练和运行提供支持。

微软还在本周一宣布基于NVIDIA最新旗舰芯片H100 GPU和N【【微信】】Band网络互连技术,推出Azure最强大、可大规模扩展的AI虚拟机系列,以显著加速AI模型的开发。

微软对AI基础设施的芯片及前沿技术布局,对于应对大模型与生成式AI应用热潮、为更大规模的模型训练与部署提供算力支撑颇具参考价值。

【【微信】】背后的算力功臣

微软在2019年向【【微信】】投资10亿美元时,同意为【【微信】】建造一台大型顶尖超级计算机。当时,微软并不确定在其Azure云服务中构建这么大的东西,会不会对Azure本身造成影响。

【【微信】】试图训练更多需要学习海量数据、拥有超大参数规模的AI模型,需要长期访问强大的云计算服务。为了应对这一挑战,微软必须想方设法将数万个N【【微信】】串在一起,并改变其在机架上放置服务器的方式,以防止断电。

▲图源:freepik

负责云计算和人工智能的微软执行副总裁【【微信】】不愿透露该项目的具体成本,但表示“可能大于”数亿美元。

训练大型AI模型需要在一个地方连接大量连接的GPU,就像微软组装的AI超级计算机一样。

据微软【【微信】】基础设施总经理Nidhi Chappell介绍,微软构建了一个可在非常大的范围内运行且可靠的系统架构,这就是让【【微信】】成为可能的原因。【【微信】】总裁兼联合创始人说,与Azure共同设计超级计算机对于扩展苛刻的AI训练需求至关重要,使得【【微信】】能在【【微信】】等系统上开展研究和调整工作。

现在,微软使用它为【【微信】】构建的同一组资源来训练和运行自己的大型AI模型,包括上个月发布的新版Bing搜索机器人。

微软还将系统出售给其他客户,并已经在开发下一代AI超级计算机,这是它与【【微信】】扩大交易、追加数十亿美元投资的一部分。

值得注意的是,AI超级计算机虽然是专为【【微信】】打造的,但微软并没有把它设计成只能供一家企业使用的定制化设施。

▲图源:freepik

“我们并没有将它们构建成定制的东西――它最初是作为定制的东西,但我们总是以一种通用化的方式来构建它,这样任何想要训练大型语言模型的人都可以利用同样的改进。”【【微信】】在接受采访时说,“这确实帮助我们成为更广泛的AI云。”

除此之外,微软还部署了用于推理的GPU,这些处理器共有数十万个,分布在其60多个数据中心区域。

网络互连为生成式AI做准备

微软周一宣布推出Azure最强大、可大规模扩展的AI虚拟机系列ND H100 v5 VM,支持从8到数千个N【【微信】】,这些GPU通过N【【微信】】Band网络互连,能够显著提高AI模型计算速度。以下是一些创新技术。

▲图源:芯东西

生成式AI应用正在迅速发展,微软对自己的AI基础设施非常有信心。微软【【微信】】+AI首席产品经理Matt Vegas说,大规模AI内置于Azure的DNA里,微软最初投资【【微信】】等大型语言模型研究,并实现了在云上构建第一台AI超级计算机等工程里程碑,为生成式AI成为可能做好了准备。

在AI超级计算机的支撑下,微软一方面可以通过Azure服务直接为客户提供训练模型所需的资源,也可以通过Azure 【【微信】】服务让更广泛的客户用到大规模生成式AI模型的能力。也就是说,中小型公司可以通过获取云服务来解决算力资源不足的问题,不需要进行大量物理硬件或软件投资。

▲图源:freepik

算力是一场持久仗。新版Bing仍处于预览阶段,微软逐渐从候补名单中添加更多用户。【【微信】】的团队每天与大约20名随时准备修补bug的员工召开会议。该小组的工作是弄清楚如何使更多的计算能力快速上线,以及解决突然出现的问题。

当【【微信】】或微软训练大型AI模型时,工作是一次性完成的。它分布在所有GPU上,在某些时候,这些单元需要在高吞吐量、低延迟网络中相互通信和共享工作。

对于AI超级计算机,微软已确保处理所有芯片之间通信的网络设备能够处理该负载,并且它必须开发能够充分利用GPU和网络设备的软件。微软已开发出可训练具有数万亿参数的模型的软件。

▲图源:freepik

由于所有机器同时启动,微软不得不考虑它们如何放置以及电源的位置。【【微信】】打了个比方,如果不做这些权衡,你在数据中心遇到的情况就好比你在厨房同时打开微波炉、烤面包机和真空吸尘器时会遇到的状况。

Azure全球基础设施总监Alistair Speirs谈道,微软还必须确保它能够冷却所有机器和芯片。【【微信】】说,微软将继续致力于定制服务器和芯片设计以及优化其供应链的方法,以尽可能地提高速度、效率和成本。

云服务依赖于数以千计的不同部件和项目,任何一个组件的延迟或供应短缺,都可能导致一切失败。

最近,维修人员不得不应对电缆托盘短缺的问题。这种类似篮子的装置用来固定从机器上掉下来的电缆。因此他们设计了一种新的电缆桥架,微软可以自行制造或从某处购买。【【微信】】说,他们还研究了如何压缩全球现有数据中心中尽可能多的服务器,这样就不必等待新建筑。

打造下一代超级计算机

微软正通过应用十年的超级计算经验和支持最大的AI训练工作负载,来应对模型规模和复杂性呈指数级增长的趋势,为生成式AI进步奠定基础。

“现在让世界惊叹的模型是构建于我们几年前开始建造的超级计算机上的。新模型将构建于我们现在正在训练的新超级计算机上,这台计算机要大得多,而且会更加复杂。”【【微信】】说。

不二研究郑重声明:文中观点系作者个人观点,不代表本平台就此提出任何投资建议。投资者应谨慎理性作出投资决策。


百度的行业景气分析 百度市值为什么跌了这么多

百度的行业景观有哪些,百度行业分析,百度行业背景,百度前景分析

今天,万众瞩目的文心一言终于发布了,大家都希望这个中国版的“chatgpt”能够给大家带来惊喜,让大家的生产力借着“国产化”的东风,提升到一个新的层次。然而,现实却很打脸,百度股价一度暴跌超过10%,今天,小编就来带大家一起看看百度文心一言发布会到底发生了什么。

一、开场就心虚,李彦宏直言产品不成熟

发布会一开始,李彦宏开场直言通过自己对文心一言的体验,感觉其核心能力还不太成熟,为什么现在急于发布,主要是因为市场需求太大,大家都在等着用这样的产品。一句话总结:产品还不成熟,但是市场需求很旺盛,早发布早圈钱。

二、发布会展示录制问答,真实回应能力让人担忧

在百度文心一言发布会上,李彦宏全程展示的问答居然全部是录制,虽然他解释说是因为打字太麻烦,比较耗费时间,所以选择了录制。可这个解释明显站不住脚,因为发布会上,并没有问特别长的问题,更何况几乎所有问题李彦宏都读了一遍,在语音识别技术如此发达的今天,既然有时间读,直接语音识别就行了,根本用不着打字。所以全程录制展示的真正原因其实还是技术不行,怕现场展示出现错误,录制的答案可能都是预先设置好的,甚至有人怀疑,录制视频里面文心一言的回答,都是提前人工输入到文心一言的数据库中,在录制视频时调用出来的,虽然看起来不错,但并不是文心一言真正的能力。虽然小编认为这种怀疑论不一定真实,但用录制视频方式发布对话产品确实让人大跌眼镜,也很让人费解。

三、没有技术亮点,甚至炒10年前的剩饭

文心一言发布会上展示的文字转视频能力,很多平台早就有了,比如抖音的图文成片,生成的视频质量比文心一言要好得多。其本质是从海量素材库中搜索匹配的画面,拼凑成视频,这和国外根据文字原创视频的能力差距十万八千里。

发布会上展示的藏头诗写作能力,更加让人感到难堪,因为早在十几年前中国网络上就流行了很多藏头诗生成器这样的小软件,大多是个人开发,技术难度很低,文心一言展示的“洛阳纸贵”的藏头诗,质量极其一般,毫无技术创新可言。

总之,文心一言发布会几乎没有亮点可言,就像是一个很多已有小程序的大合集,市场对这个发布会也表现出了很大失望,在文心一言发布会开始后仅12分钟,百度股价就开始下跌,到发布会开始后第22分钟,百度股价下跌超过10%。