谷歌发布 AI 全家桶,XR 低调更新
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
文 /VR 陀螺 万里
当地时间 5 月 10 日,谷歌召开了其 2023 年 I/O 开发者大会。本次大会主题不出意外是今年爆火的 AI,当然 AI 也是以往谷歌 I/O 大会的重点所在。
本届大会,谷歌推出了新的大型语言模型 PaLM 2,并且几乎把自家全部业务矩阵都与 AI 串联了起来:谷歌搜索、Gmail、【【淘密令】】、Pixel ……颇有一种 AI 全家桶的味道。
而关于 XR 部分的内容并不多,更新主要涉及三个方面:谷歌地图 LBS AR 工具、公布 Project Starline 最新原型、宣布与三星打造新的 XR 平台。
图源:谷歌
PaLM 2 发布、AI 贯穿谷歌整个产品线
今年 2 月,谷歌推出了对标 ChatGPT 的对话式 AI 工具 Brad,结果演示的时候翻车,导致股价大跌。本次 I/O 大会,谷歌一雪前耻,并把 AI 与自家应用生态更为紧密结合在了一起。
大语言模型 PaLM 2
会上公布的第一款产品是谷歌新一代大语言模型 PaLM 2,它支持 100 种语言,在逻辑推理、编程以及翻译等方面相较上一代均有显著提升。
谷歌 CEO Sundar Pichai 指出,在写代码时,PaLM 2 可检查并修复里面的错误,并且可生成不同语言的注释来实现跨团队协作。此外,它是首款能够给医学执照考试问题提供专业解答意见的语言模型,如可以理解 X 光图片并为医生提供部分参考信息。
PaLM 2 现已开放预览,它针对不同性能的设备提供了不同的适配版本以满足对模型运行的支持,其中 Gecko 版本甚至能在手机等移动设备上运行。
对话式 AI Brad
伴随着 PaLM 2 的发布,Bard 也得到了全新升级。它继承了 PaLM 2 在数学、逻辑等方面的强大能力。编程方面,它学习的编程语言超过了 20 多种,在演示中,谷歌产品副总裁 Sissie Hsiao 使用 Brad 生成了一个基于 Python 的国际象棋代码,并且可以实现代码优化、注释、导出等操作。
当提问景点建议时,它将会生成带有图片的场景介绍;询问大学报考建议时,它会列出一系列高校名称、地点以及专业信息,甚至可以生成对比表格。不仅如此,谷歌宣布 Bard 即将与 Adobe Firefly 达成合作,未来它还将配备文本生成图像功能。
会上,谷歌宣布移除 Bard 的等待名单候补机制,它已经面向 180 多个国家和地区全面开放,在语言方面,它新增了对日语和韩语的支持,未来适配语言将增加至 40 种。
文本生成图片功能演示,图源:谷歌
办公套装 【【淘密令】】
Sundar 指出,谷歌有 15 款产品,它们的日活均超过了 5 亿,其中 Chrome 等五款产品,日活甚至突破了 20 亿。谷歌希望为这些产品引入 AI 工具,以进一步提升工作以及生活效率。
专门针对办公套件 【【淘密令】】,谷歌为之带来了名为 Duet AI for 【【淘密令】】 的功能更新。
如借助 help me write 功能,用户可以在 Gmail 中快速生成一封邮件;在 Docs 中,你只需要写上简单的招聘需求,它就会自动帮你生成一个信息饱满的招聘广告。此外,AI 的新能力在表格、幻灯片等产品上均有体现。
Google 【【淘密令】】 主管 Aparna Pappu 在会上展示了 AI 在办公时的强大辅助能力,如你在写一个恐怖故事的时候卡壳,AI 能够为你提供故事发展脉络建议。
【【淘密令】】 AI 新功能现已面向少部分测试人员推出,后续会进一步向企业以及普通用户开放,不过具体时间暂未公布。
快速生成招聘广告,图源:谷歌
结合 AI 的搜索体验 SGE
不少人认为,伴随着对话式 AI 的推出,将会撼动谷歌以搜索为主导的业务根基。不过在 I/O 大会上,谷歌还是展开了积极尝试,以寻找搜索广告业务新的变现可能。
谷歌搜索副总裁 【【淘密令】】 展示了名为 SGE(Search Generati【【微信】】)的新功能,如当用户搜索自行车,网页中将会出现自行车用途、悬挂系统等 AI 生成信息,以帮助用户更好完成购买决策(可以简单理解为一个智能客服)。此外,网页端还会出现符合用户需求的商品信息,用户可以点击链接快速完成购买。
SGE 将在未来数周内推出,美国用户现可申请加入等候名单。
首款折叠手机推出,XR 业务低调更新
除 AI 产品外,I/O 大会上还为我们带来了三款硬件产品,其中包括首款折叠机 Pixel Fold、家庭平板 Pixel tablet 以及入门级的 Google Pixel 7a。这三款产品均搭载了谷歌自研 G2 处理器,前者售价 1799 美元起步,后两款产品售价为 499 美元。
此外,谷歌还为安卓带来了 Android 14 更新,不过新系统更新乏善可陈,里面除了查找丢失设备、新建个性化时钟等新功能外,AI 生成壁纸可算是一个小小的亮点。
对于我们关心的 XR 业务,本次 Keynote 演讲上似乎显得有点默默无闻。去年谷歌的 I/O 大会上,谷歌展示了一款具备实时翻译功能的 AR 眼镜设备,但本次活动上暂未看到该产品的最新动态。
大会上,谷歌 Android 生态系统副总裁 Sameer Samat 只是简单提了一句:" 我们与三星一起,正在构建一个由 Android 驱动的全新沉浸式 XR 平台,我们将在今年晚些时候分享更多信息。" 这已是 XR 的全部。
LBS AR 创建工具 Geospatial Creator
虽然没有 XR 新的硬件设备展示,但是在开场,Sundar 提到了其地图业务的更新,谷歌的地图业务是其未来构建大型 LBS AR 体验的重要载体。
去年,谷歌地图引入了沉浸式视图 Immersive view,该功能可以展示动态的 3D 街景鸟瞰图,这是通过将数十亿张全景图像拼接实现的。此外,用于构建 LBS AR 服务的 Geospatial API 也于去年亮相,当时 I/O 大会透露,里面内置了超过 87 个国家 / 地区的 3D 地图信息,开发者可用于远程构建基于地图的 AR 服务。
如今,谷歌把 Immersive view 引入到了骑行、驾驶等导航当中,用户在出发前,可先进行路线图 3D 导览,并查看天气等。该功能将于今年夏天推出,年底前适配 15 个城市。
此外,谷歌地图进一步推出了 AR 创作工具 Geospatial Creator。根据谷歌官网信息,这是一款低门槛的创作工具,它可直接集成到 Adobe Aero 和 Unity 等 3D 引擎中。" 你无需编写任何代码,在数分钟内即可打造基于世界的沉浸式体验。"
用户则可通过 Geospatial Creator 生成二维码或者链接以共享 AR 体验,无需下载特定的 APP。目前 Geospatial Creator 内置的 3D 地图数据涵盖了 49 个国家 / 地区。
应用落地方面,谷歌宣布已经与 Gap、Mattel、Global Street Art、新加坡旅游局、【【微信】】、TAITO 等企业或者客户达成了合作。如 TAITO 即将发布的 AR 游戏《SPACE IN【【微信】】: World Defense》,里面结合使用了 ARCore 和 Geospatial Creator 技术。
Google Arts & Culture 与 Global Street Art 和三位世界知名艺术家合作,通过 Geospatial Creator 为伦敦 ( Camille Walala ) 、墨西哥城 ( Edgar Saner ) 和洛杉矶 ( Tristan Eaton ) 打造了 AR 壁画体验。
新的 Project Starline 原型
Project Starline 是一款搭载了光场技术的远程会议协作产品,最早于 2021 年 I/O 大会亮相。在 Keynote 演讲之外,谷歌在官网上发布了它的最新原型产品更新信息。
其最新的原型产品改进主要集中在设备瘦身方面。在先前版本中,为了实现裸眼 3D 显示效果,里面需要配备大量红外发射器和特殊相机等复杂硬件,它的体积就像一个餐厅摊位般庞大。如今借由新的 AI 技术,只需要数个标准相机即可生成高质量的 3D 图像,如今它的外观也更近似于一台普通的纯平电视。
目前,Project Starline 系统已经在 Salesforce、T-Mobile、WeWork 等企业展开测试,但是正式发布时间还并未确定。有消息指出该系统售价高达数万美元,高昂的售价可能也是制约其推广的重要因素。
本次 I/O 大会上谷歌的 XR 新动作并不多,可算是一个遗憾。不过,从去年的 Geospatial API,再到今年的 Geospatial Creator,谷歌给我们留下了巨大的想象空间,通过地图工具构建AR 体验,这为未来 XR 产品的爆发打下了重要的生态基础。
根据以往信息,谷歌去年 10 月展开了一轮有关 AR 眼镜的小规模线下测试;去年以 1 亿美元收购 AI 头像初创公司 Alter ……相信谷歌在 XR 硬件方面也很快会有更多动作公布。
第一时间了解 XR 资讯
关注 VR 陀螺官网(【【微信】】.cn)
VR 陀螺的联系方式:
商务合作 | 投稿 :
西瓜(微信号 【【QQ微信】】)
六六(微信号 【【QQ微信】】)
寻求免费曝光:
六六(微信号 【【QQ微信】】)
投稿邮箱:【【邮箱】】
谷歌最新ai产品发布 谷歌ai 微软ai哪个强
谷歌最新股票价格,谷歌最新版下载安装,谷歌最新版,谷歌最新款手机被OpenAI和微软吊打几个月后,谷歌终于全面出击AI。在5月10日的2023 Google I/O开发者大会上,谷歌宣布搜索、邮箱、地图等25个产品接入大模型PaLM2,通过生成式AI来重构所有产品。
谷歌新的搜索服务叫搜索生成体验SGE,搜索结果首先将是AI生成的摘要,同时还给出链接,以证明摘要中的内容;办公协作平台【【淘密令】】新增助手Duet AI,为Gmail和DOS文档提供写作辅助、为幻灯片提供图片生成、为Meet生成会议摘要;
几个月前演示翻车的聊天机器人Bard功能也有所增加,能识别图片,在回复中能附带照片。同时支持用户将聊天记录导出到 Google Docs 和 Gmail 中。
在谷歌地图中,AI为用户生成沉浸式路线视图。在手机中,AI帮助用户智能修图,不久的将来,用户还可以用提示词让AI生成不同的手机壁纸。
除了互联网用户,谷歌还为Android开发者推出了AI编码机器人Studio Bot,不仅可以生成代码、修复BUG,还能回答关于安卓应用开发的相关问题。谷歌云为企业客户推出了Duet AI,客户可以选择不同付费档次的AI模型。
从互联网服务到手机硬件,从普通用户到开发者和企业客户,谷歌在AI的覆盖面上已经完全超过了微软。
到目前为止,全面拥抱生成式AI的科技巨头就只有微软和谷歌两家。之前市场关注的重点是微软Bing接入chatGPT后是否有可能逆袭谷歌搜索?假设只占搜索市场3%的Bing有机会撼动占90%市场的谷歌搜索,那么排名第四的谷歌云也有可能挑战老二微软云。
生成式AI有可能改写任何行业的格局,这已经是一场全面性的战争,未来将把所有企业都卷进来。目前战场上只有两个阵营,一方是谷歌,另一方则是“OpenAI+微软”联军。
决定胜负的关键是双方大模型的实力比拼。
众所周知,所有大语言模型的起源和基石是谷歌2017年推出的Transformer,它分为编码器和解码器两大模块,模拟了人类大脑从理解语言到表达语言的过程。
2018年6月,OpenAI公司发布了GPT模型的初代版本,GPT-1。2018年10月,Google也发布了BERT模型。虽然二者都基于Transformer,但GPT模型仅使用了解码器的部分,而BERT仅使用了编码器的部分,二者在技术路线上也走向了两条不同的道路。
具体来说,BERT在训练时每一个词需要对整个输入序列的上下文进行相关性分析,从模式上来看更接近于一个完形填空模型;而GPT在训练时会对下文进行了遮盖(mask)处理,仅基于上文,来生成下文,因此更接近人类的语言生成模式,更适合来构建语言生成模型。
但BERT的参数量是GPT-1的3倍,因此其测评结果要领先于GPT-1。GPT不断改进训练的方法,经过多次迭代,到2020年5月发布GPT-3,训练参数达到了1750亿,数据集在处理前容量达到了45TB,成了真正意义上的超大语言模型。
看到GPT基于仅解码器产生的高性能,2021年10月,谷歌也转向仅解码器的方向。2022年1月,谷歌推出LaMDA大模型。2022年4月,推出PaLM大模型,现在接入谷歌全线产品的PaLM2是其升级版本。
OpenAI去年11月底发布的chatGPT是GPT-3.5,今年3月又发布了GPT-4。可以说,在仅解码器这个技术路线上,OpenAI走在谷歌前面,GPT的更新迭代也比PaLM快了两代。
但PaLM2大模型在性能上是否一定比GPT-4差两代?现在也还没法下定论,待日后两家接入大模型的产品上线后,才能一分高下。
而决定大模型胜负的除了技术性能,还要看谁能吸引到更多的盟友。鉴于大模型耗资巨大,目前来看,只有巨头才玩得起。虽然Meta、英伟达也有推出大模型,但还没有什么动静。
OpenAI已经拉开了阵势,向企业推出了MaaS模式,有详细的API收费标准。目前已经有很多创业公司基于chatGPT推出创新的AI应用,比如生成广告文案的Jasper,生成视频的 waymark,生成游戏角色的Inworld AI。OpenAI还推出了chatGPT插件,供第三方互联网产品使用。
PaLM2目前只面向自己的产品,但谷歌自己的产品和用户就够多了。互联网产品除了搜索、【【淘密令】】、地图,还有视频网站youtube、浏览器chrome;硬件产品除了手机,还有笔记本电脑、智能家居、谷歌眼镜。根据中信建投的报告,谷歌在全球用户超过43亿。
而且谷歌也在引入合作伙伴。在本届开发者大会期间,全球决策和市场情报技术提供商Fiscalnote被选为Bard的启动合作伙伴,使用户能够访问选定的实时公司数据集和内容。
一切才刚刚开始,未来各行各业势必都要用AI来武装自己,届时它们将投奔哪个阵营,OpenAI+微软还是谷歌?抑或还有更强的阵营出现?
最后我想说,微软不足为惧,OpenAI才是谷歌真正的对手。
OpenAI本来是个非盈利机构,因为算力成本昂贵,后来过渡到“有限盈利”,利润上限为任何投资的 100 倍。跟微软的绑定只是暂时的,在完成对投资人和员工的承诺后,OpenAI将回归非盈利机构。
GPT的接入让微软的产品焕发新生,但AI在其中扮演的角色只是助手,主角仍是微软的Office、Bing、Team。换句话说,入口并没有变。
但其实生成式AI的革命性在于对人机交互方式的彻底颠覆。4月份,OpenAI 联合创始人之一的Greg Brockman在 TED2023 上做了一个现场演示,他叫ChatGPT 策划一个TED晚宴,ChatGPT生成了一个非常详细的方案,接着调用 Dall-E 生成了一张晚宴的图片,然后列出晚宴需要的食材清单,在食品购物网站instacart下单购买,最后调用一个软件在推特上发了一条推文。
整个过程都没有离开ChatGPT界面,而且ChatGPT会自己使用工具。这才是未来互联网的新范式,人们有什么需求直接找ChatGPT这样的聊天机器人就行了,不需要费劲去下载APP,在繁琐的菜单中去寻找功能。很多APP将隐身幕后,甚至消失。
OpenAI可以无所顾忌地去革互联网的命,但谷歌会用Bard来干掉自己的互联网产品吗?未来它将如何取舍、重组其庞杂的产品线?它又将给互联网产业树立一个什么样的新范式?
而这恐怕将是PaLM和GPT对决的终局之战。
参考资料:
《解析GPT背后的技术演进》(方正证券研究所)