淘姐妹

淘姐妹

chatgpt真的很牛吗 对chatgpt的客观评价

电脑 0
chatteing,chat it,chat thit,chatplus

AI人工智能时代已经到来!很多人表示很心慌,即将失业!确实如此!

AIGC创作误区:现在很多人有误区,觉得AI就是输入几个关键词就出来了,其实不是的,AI不是人,很简单的一个brief,人很快就理解了,但是AI其实理解不了,比如,一个三维的数字,需要机械或者机甲结构,有光带流动,这些需要研究一套属于自己的方法,怎么控形,怎么控制材质匹配,都要了解计算机的逻辑,而不是我们人的逻辑,这块太重要了!这也是我们课程的重点与核心!

AIGC在NFT、IP创作、设计素材方面的应用也已经越来越普及,大家加油吧!

一、会被ChatGPT取代的岗位

网络上流传已久的一张图片:ChatGPT会取代哪些岗位?

图中明确表示ChatGPT即将取代初级计算机程序员、数据分析师、文字工作者、客服、教师、律师、图书编译工作者、广告人、交易员、文秘。

除此之外,初级设计师即将也会被取代。不管你是平面设计师、电商设计师、UI设计师、展览设计师、室内设计师、环境艺术设计师、插画设计师.......如果,你还停留在初级水平阶段,一定是即将会被取代的命运。

随着AI人工智能的崛起,各种AI绘画软件正在如雨后春笋般涌出,从知名到到不知名的,至少也有几十款。其中包括Open AI的DALL.W,微软的NUWA,百度的文心一格,谷歌的Parti。

ChatGPT是美国人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具,使用了Transformer神经网络架构,也是GPT-3.5架构,这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力,尤其是它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流。

ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码甚至写论文等任务。

OpenAI创造的DALL・E图像生成器,能够直接通过文本描述生成类似超现实主义的图像,让机器也能拥有顶级画家、设计师的创造力。

Midjourney是一款搭载在 Discord 上的人工智能绘画聊天工具。只要输入你想到的文字,就能通过AI人工智能产出相对应的图片,耗时只有大约一分钟。自2022年5月推出测试版后,这款搭载在Discord社区上的工具迅速成为讨论焦点。

NUWA是一款由微软出品的AI绘画工具,支持生成任意尺寸、任意大小的高分辨率图像,以适配不同设备、平台和场景。可以对原画作进行延伸创作;可以将静态图片转换成动态的视频;可以根据文字描述创作出来高分辨率的图片。

AIGC即AI Generated Content,是指利用人工智能技术来生成内容,AIGC也被认为是继UGC、PGC之后的新型内容生产方式,AI绘画、AI写作等都属于AIGC的分支。对AIGC来说,2022年被认为是其发展速度惊人的一年,2023年AIGC逐步被应用到各行各业。

AIGC以其真实性、多样性、可控性、组合性的特征,有望帮助企业提高内容生产的效率,或将率先在传媒、电商、影视、娱乐等数字化程度高、内容需求丰富的行业取得重大创新发展。AIGC已经在多个领域得到广泛应用,如金融、传媒、文娱、电商等,未来应用场景会进一步多元化,场景与场景的融合交互也是未来的发展趋势之一。

目前,很多朋友已经开始使用AIGC工作,甚至接一些项目。我们发现一些公司已经开始招聘具有AIGC创作能力的人。AIGC已经明确写到岗位技能要求里。

AIGC的应用场景如下(图片来源于网络),其中包括娱乐领域、传媒领域、影视领域、电商领域以及教育、工业、医疗、金融等各行各业。

而AIGC的技术场景从文本生产、音频生成、图像生成、视频生成、跨模态内容生成等方面都有突出的优势。帮助创作者省时、省力,帮助企业老板降本增效。

三、AIGC的价值

AIGC 的价值体现在以下四个方面:

1、降本增效
通过 AI 技术可以大大降低成本,并且高效率地生成文字、图像等内容,降低 人工和时间成本。
2、提升创作内容质量
AI 模型是经过大数据的训练,知识积累量远高于人类水平, 可以生成更高质量的内容。如 OpenAI 的 AI 作画产品 DALL・E 2,由 120 亿参数版本的 GPT-3 模型经过 4 亿对图像和文本训练而来,生成的内容已经接近中等画师的水平。
3、增加创作内容的多样性
AI 模型逐渐由单模态向多模态方向发展,多模态技术是指将图像、声音、文字等多类型内容融合学习,丰富了 AIGC 的内容,使 AIGC的应用更具有通用性。
4、使生成的创作内容具有个性化
AI 模型可以根据每个人喜好、模型算法、关键词生成个性化内容。AIGC 应用有望从降本增效向额外价值转移。在垂直领域,目前国内已有 AIGC 技术的应用落地,包括机器写稿、对话式 AI、报告生成等,技术价值主要在于替代 人工实现降本增效。

四、AIGC的具体应用场景

下面是一些朋友通过AIGC创作的内容和作品(已经过授权展示),而且很多已经商业化。

1、AIGC在虚拟数字人中的应用

AIGC创作作者:Neo

2、AIGC创作在头像设计中的应用

AIGC创作作者:史叶
AIGC创作作者:史叶

3、AIGC在二次元动漫方面的应用

作者:邦威

4、AIGC在影视动画方面的应用

作者:邦威

5、AIGC在角色设计方面的应用

作者:邦威

6、AIGC在概念设计中的应用

作者:邦威

7、AIGC在场景设计中的应用

作者:邦威

8、AIGC在手办创作方面的应用

作者:邦威

9、AIGC在IP设计中的应用

作者:邦威
作者:邦威

10、AIGC在插画设计中的应用

作者:邦威

11、AIGC在字体创意设计中的应用

作者:邦威

12、AIGC在室内设计中的应用

作者:邦威

13、AIGC在展台/展厅设计中的应用

作者:邦威
作者:邦威

14、AIGC在室内空间设计中的应用

作者:邦威
作者:邦威

15、AIGC在建筑外饰设计/建筑效果图中的应用

作者:邦威

16、AIGC在平面设计、电商设计等方面的应用

作者:邦威

UIzard是一个做界面的向导,可以非常简单地嵌入一些Google的API。根据单个文本提示,UIzard Autodesigner 将在几秒钟内生成一个多屏幕、可编辑的模型,方便更新、调整和迭代。生成设计后,可以使用 Uizard 易于使用的拖放式编辑器来更新组件、编辑交互、添加新屏幕。

AIGC在视频设计中的应用,有Meta:Make-A-Video。只要输入一句话,视频自动生成!

下面的图是我自己测试的一个给视觉客定义的文案,非常完美!估计我得想个1~3个月也未必能定义与描述得如此详细与到位。

视觉客是一种新兴的营销模式,它是将品牌的营销活动与社交媒体结合在一起,以更有效地吸引消费者,增强品牌的可视性和影响力。它通过招募影响力较大的网络用户,让他们成为品牌的"视觉客",为品牌创造有价值的内容,以更有效地推广品牌。

ChatGPT在文案创作方面的应用

五、AIGC知识内容资源分享

下面给大家列一些非常实用的AIGC资源和内容

1、AI百科网站:

2、AI配音神器:国内:,国外(含中文版):

3、APP应用程序下图中把文本、视频、3D、语音、代码、图像等一些内容的AI应用程序列出来了(图片来源于网络)。

4、AIGC创作应用程序(网站)

下面图中列出了收藏最多的最佳AI工具(图片来源于网络),绝大部分经过我的测试,还是真不错的。

5、中文AI工具库

中文AI工具库网址为

六、AIGC&ChatGPT课程介绍

视觉客TOP设计师邦威老师主讲的《觉醒:人人必学的AIGC创作&ChatGPT必修课》已经开始接受报名了。帮助大家掌握最前沿的科技资讯,适应潮流,避免卷入被时代淘汰的车轮。

1、课程适合人群
设计师:设计相关专业大学生,在职设计师,期望加薪设计师、游戏设计师、平面设计师、UI设计师、电商设计师、展览设计师、影视动画设计师、服装设计师、环艺设计师、工业设计师、视频设计师......
企业老板/中高层领导:各行业企业快速了解降本增效的方法。
市场运营/企划人员:快速掌握文案、策划、运营思路等方面脚本以及相关概念配图与方案。
在校大学生:掌握最前沿的AI人工智能技术手段,提升学习效率,升学无忧
大学老师:掌握最前沿的AI人工智能技术,提高教学课件备案效率,协助学生掌握最前沿的学习方法。
2、AIGC课程内容
第01课 第1次使用AI创作,Midjourney
第02课 AI创作操作流程
第03课 AI创作语法与技法
第04课 开放的AI创作应用场景,文字、图片、三维、动画、视频、声音
第05课 AIGC创作赛博朋克风格画面
第06课 AIGC创作手绘风格,二次元与漫画
第07课 AIGC创作电影风格画面
第08课 AIGC创作游戏风格画面
第09课 AIGC创作虚拟现实风格画面
第10课 AIGC综合应用:ChatGPT文案、LOGO设计、平面设计、包装设计、IP设计、电商设计、UI设计、插画设计、展示设计、游戏设计、产品设计、概念设计

3、老师作品展示(下一篇文章全面展示)


msra cvpr 2017 论文分享会 去msra可以实习一年以上吗


ChatGPT会画画了!

问它:能生成一张猫片给我吗?

立刻连文带图全有了。

还能根据新的文字指令调整图片:把猫换成狗。

同时也看得懂图、有理解能力。

比如发一张图给它,然后问摩托是什么颜色?它能回答出是黑色。

如上,就是由MSRA资深研究人员们提出的视觉版ChatGPT(【【微信】】)。

通过给ChatGPT结合多种视觉模型,并利用一个提示管理器(Prompt Manager),他们成功让ChatGPT可以处理各种视觉任务。

这项工作一发出来就火了,GitHub揽星已超过1.5k。

简单总结一下,就是把GPT和Dall-E合并的感觉~

又懂文字又会画图……有人就说:

这不是终极meme图制造机?

诀窍在于提示工程?

【【微信】】,其实就是让ChatGPT可以处理多模态信息。

但是从头训练一个多模态模型,工作量非常大。

研究人员想到可以在ChatGPT的基础上,结合一些视觉模型

而想要达到这一目的,关键需要一个中间站。

由此他们提出了提示管理器(Prompt Manager)的概念。

它的作用主要有3方面:

第一、明确告诉ChatGPT,每个视觉模型的作用,并指定好输入输出格式。

第二、转换不同的视觉信息,如将PNG图像、深度图像、掩码矩阵等转换为语言格式,方便ChatGPT理解。

第三、处理视觉模型的历史生成结果,以及不同模型的调用优先级、规避冲突等,让ChatGPT能够以迭代的方式接收视觉模型的生成内容,直到输出用户满意的结果。

这样一来,【【微信】】的工作流大概长这样:

假如用户输入了一张图,模型会先将内容发送给提示管理器,然后转换成语言给ChatGPT判断,当它发现这个问题不需要调用视觉模型,就会直接给出输出(第一个回答)。

第二个问题时,ChatGPT分析问题内容需要使用视觉模型,就会让视觉模型开始执行,然后一直迭代,直到ChatGPT判断不再需要调用视觉模型时,才会输出结果。

论文介绍,【【微信】】中包含了22个不同的视觉模型。包括Stable Diffusion、BLIP、pix2pix等。

为了验证【【微信】】的能力,他们还进行了大量零次试验(zero-shot experiments)。

结果如开头所示,【【微信】】具备很强的图像理解能力。

可以一直按照人的需求不断生成、修改图片。

当然,研究人员也提到了这项工作目前还存在一些局限性

比如生成结果的质量,主要取决于视觉模型的性能。

以及使用大量的提示工程,会一定程度上影响生成结果的速度。而且还可能同时调用多个模型,也会影响实时性。

最后,在输入图片的隐私安全上,还需要做进一步升级保护。

MSRA老将出马

本项研究成果来自微软亚洲研究院的团队。

通讯作者是段楠

他是MSRA首席研究员,自然语言计算组研究经理,中国科学技术大学兼职博导,天津大学兼职教授,CCF杰出会员。

主要从事自然语言处理、代码智能、多模态智能、机器推理等研究。

2006年加入MSRA,任职已超16年。

第一作者Chenfei Wu,同样是一位资深研究人员了。

据领英资料显示,他于2012年加入微软,任职11年,目前是一位软件工程师。