文心一言抢画家饭碗?汉语的复杂你想象不到
科技
科技 > 人工智能 > 正文

文心一言抢画家饭碗?汉语的复杂你想象不到

3月16日,百度大模型AI产品文心一言正式发布,百度创始人、董事长兼首席执行官李彦宏的表示,文心一言是个多模态模型,在多模态生成场景中,可以生成图片、音频和视频等多种形式的内容。此前已经有媒体为大家带来文本问答的测试(《我们向文心一言和ChatGPT问了几个同样的问题 结果很意外》),今天我们一起来看看文心一言的AI图片生成表现到底如何,面对复杂的汉语,文心一言会交出怎样的答卷?

文心一言能将我的描述准确转换成图片吗?

我们先来给文心一言提个简单的问题:给我画一瓶白酒。

结果不太如人意,我们在给它描述地的详细一点:给我画一瓶酱香型白酒。这个结果……还是有不少艺术气质在其中。

我们再描述准确一点:帮我画一个茅台的酒瓶子,这个结果……

似乎文心一言对中国白酒不是很熟,对洋酒倒是有些许认知。虽然我们对文心一言进行了纠正和指导,但它还是没有“学会”。

通过语言描述,文心一言能给我们带来怎么样的画面呢?我们测试了一些描述,发现文心一言给出的结果充满了“想象力”。

文心一言“印象里”自己老板李彦宏是什么样子呢?带着这个问题我们问了问它。

思路打开,我们似乎得到了意想不到的答案。

李彦宏大笑

李彦宏喝酒

文心一言发布会上的李彦宏

最后展示一下文心一言反复想让大家让他画的“晶莹剔透的牡丹花”。

可否与竞争对手一战?

OpenAI在GPT-4中,加强了图片生成的能力。而该功能也被New Bing整合到旗下Bing图片生成产品中。而说到AI图片生成领域的佼佼者,就不能不提到Midjourney。GPT4发布后,新版本“Midjourney V5”也正式亮相。改进后的V5细节更加逼真、风格多样、手指描绘更加准确。近期,由Midjourney生成的情侣照在网上被疯转,网友直呼效果炸裂。

那么其竞争对手New Bing、Midjourney相比,文心一言图片生成能力如何呢?经我们也进行了两轮对比测试。

首先我们对比“中国情侣”这个主题:

Midjourney这幅堪比照片的生成图像确实让人大吃一惊。

“中国情侣”这个主题下Bing图片生成的结果如下:

整体看上去不错,但与Midjourney相比,在人物细节上还有提升空间。目前Bing绘图仅支持英文,如果输入的词语不符合系统要求,则无法生成。如果输入的提示语多次不符合要求,系统则会暂停用户访问该功能。

文心一言在输入上面描述后产出的画作有点让人“摸不到头脑”。尽管我们进行了多次测试,但中国情侣的人物元素仍没有出现,对画作内容的理解它还有很大的提升空间。但相比对手已经迭代到GPT4与Midjourney V5,我们似乎应该再多给文心一言一些时间。

文心一言中国情侣描述提供的画作

随后我们又给文心一言和New Bing的提出了生成一副“毕加索风格蒙娜丽莎的微笑”的任务,结果如下:

New Bing生成的“毕加索风格蒙娜丽莎的微笑”

总结:

通过一番对文心一言生成画作的测试,我觉得文心一言生成的图片的风格很相似,充满了“赛博朋克”风。即便你明确指出了想要画作的风格,但结果还是不尽如人意。汉语的复杂和博大精深,似乎对于大模型调教需要更多的时间和耐心。文心一言已经正式亮相,期待接下来它能不断给我们带来惊喜,服务于各行各业。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载