AI美女全军覆没!赛博照妖镜下集体变“鬼”,AI代码拆台AI生图

明敏 克雷西 发自 凹非寺量子位 | 公众号 QbitAI赛博照妖镜下,AI美女全变鬼。来看它的牙。

奥飞寺明敏克西

量子比特|公众号QbitAI

网络魔镜之下,所有AI美女都变成了鬼魂。

快来看看它的牙齿。

777278fbded94de7a198faa36133a1e7~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=DLDwTa6suRAZuP7jsER%2B16fM%2FAQ%3D 当图像饱和度全面提高时,AI人像的牙齿会变得非常怪异,边界也变得模糊。

整体画面色彩正常,但麦克风部分就更奇怪了。

与真人照片相比,应该是这样的。

牙齿清晰,图中色块均匀。

896196c4b478429688ad14f8e10c9882~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=%2BMfttSJ9SZMr2SePcJHLG%2Fu6ybc%3D 这个工具已经开放了,大家可以用照片来尝试一下。

AI生成的视频中的某一帧无法逃脱此方法。

54b07a077f244e34a856a4101c9e0141~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=LQmhAtwfpEp5VHmpLpj7drN0Ris%3D缺失牙齿的照片也可以揭示问题。

3c7ab89577de41dca59ce61ebde23b86~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=IVavbCLw13zN87dRfO7M10jWc%2Bk%3D但是顺便说一句,这个工具是由Claude 创建的。用AI破解AI,一个奇妙的闭环。

cc195414ac8e4b379f722936093cc303~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=lRWID9nRloHbOHqscxSg2fcGa48%3D 有一种说法。最近,AI人像过于逼真,引发了不少讨论。例如,在一组流行的“TED演讲视频”中,没有一个是真人。

5b92020594ea4dd889bae8238391da33~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=fwgq4K8e17mebRkVzIWmgK%2Fx8nw%3D 不仅人脸无法辨别,就连以前人工智能的缺点——书写,现在也可以完全作假。

1fbc9defb4db4392b44ab2053f5b68d7~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=jwWp4PEwNXaAYQZjl32Ieosz61c%3D更重要的是,生成这样的AI肖像的成本并不高。仅需5分钟即可完成,每20秒1.5美元(约10元人民币)。

d1bc176678b74912ac80f78756679e53~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=tdsl55m%2B0Qjb0Wt2hpkM7hE%2BpuI%3D 现在网友们也坐不住了,纷纷开始AI打假大赛。

近5000人前来讨论这两张照片哪个是真人。

f29ba2d4f07e45589edd3c3a73f2c1b5~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=EF6RzdS0XVl6k27vxwRFqOT04Io%3D给出的理由多种多样。有些人觉得文字和图案细节很抽象,而另一些人则认为人物的眼睛是空洞的……

最先进的人工智能生成肖像的规则正在逐渐被弄清楚。

不看细节已很难分辨

综上所述,调整饱和度可能是最快的识别方法。

这样AI群像曝光更彻底。

f68e224277844612aa9eab5823c38155~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=TRoyszW2csfXk8eCgpr30JNxE7M%3D但是有一个问题。如果图像是使用JPEG 算法压缩的,则此方法可能不起作用。

例如,确保照片是真实照片。

5a087f29fa1f4a93bcaf53c06d55df13~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=4vl%2BQRKFqUfkhyaqopkotOO178A%3D 不过,由于图像压缩和光照问题,人物的牙齿也有点模糊。

1c6d954c517846f48089a754b50164d5~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=SjK0QWXGRzxvDv57J56FM%2BRyG1A%3D于是网友们还列出了更多判断人像是否是AI合成的方法。

第一种方法,简单来说,就是依靠人类的知识和判断。

由于AI学习图像的方式与人类不一致,因此不可避免地无法100%从人类的角度掌握视觉信息。

结果是人工智能生成的图像常常与现实世界不一致,这为图像识别提供了起点。

使用开头的图像作为示例。

整体来看,人物皮肤过于光滑,看不到毛孔。这种过于完美的功能只会增加不真实感。

当然,这种“不切实际的感觉”并不完全等同于“假”。毕竟经过微晶磨皮处理过的照片里是看不到毛孔的。

但这并不是唯一的判断因素。图中AI留下的与常识的偏差可能不止一处。

24edc8c27f15499e99101bc882daa082~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=fjGVkFVcPKDejm7Z8Ggj8ndUQjs%3D其实如果你看这张图下面的细节,你可以看到一个比较明显的特征—— 铭牌上方挂钩的奇特连接方法。

b8f1842ae9b84e24b570e9f2eedc04b2~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=%2FLbFFwnO%2Fn8HXzIUt%2B0GxPMpKQc%3D 还有一些麦克风在高饱和模式下显示出缺陷。放大后,肉眼就能直接看到线索。

9983bb74b7b141abaf1b935c17e78041~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=9paELf5TiBAOLLlbwXnAeo6xXBY%3D 更隐蔽的是,毛发末端有几根毛发处于不合理的位置,但这样的特征恐怕需要列文虎克级别的视力才能看到。

然而,随着世代技术的进步,能发现的特征变得越来越隐蔽,这是必然趋势。

fe461c8aa2e046bc9ca3589f1190f646~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=7LX3A0uo7kgtJGGhhYNNhpcdQ7Q%3D 另一种方法是阅读文本。尽管人工智能正在逐步克服字体描绘中的“鬼符号”问题,但要正确渲染具有正确实际含义的文本仍然存在一些困难。

例如,有网友发现,照片中人佩戴的徽章上,谷歌标志下方最后一行的两个字母是“CA”,意思是加利福尼亚州,而前面的一长串应该是城市名称。

但事实上,加州没有一个城市的名字这么长。

3a70ae34388140af9258dc4152268f4a~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=bsHQWH2n9LgDhcCxT%2BRTZGFwEgo%3D除了这些物体本身的细节外,光影等信息也可以用来判断真伪。

这张图片是从一个视频中提取出来的,它所在的视频中有这么一帧。

在麦克风的右侧,有一个非常奇怪的影子。该阴影对应于角色的一只手。显然这里的AI处理是有所欠缺的。

ef687b6d668f46018bd70e948f2f8a6d~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=5wHk9n9ETswNpPmZKLiAN2FLMQI%3D 说到视频,由于前后内容的一致性,AI 比静态图像更容易暴露缺陷。

2a30a28a87cd422c99c1c69323222434~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=EqaWlQ0QqffiMiq3rQsq9uNYeWQ%3D 还有一些不被认为是“常识错误”的特征,但它们也反映了AI在生成图像时的一些偏好。

比如这四张图,都是AI合成的“普通人”。你发现什么共同点了吗?

cd60d40210874920a03687622ccf6799~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=bcdeofhKWP9ofWSFoI%2FsePPoAd8%3D 有网友表示,这四张图片中的人都没有笑脸,这似乎体现了AI生成图片的一些特征。

68409a4c0c2a4886a70228e3876d8d26~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=4KT912MOUbmoDQUywUqq16oTe9I%3D 这些图片确实如此,但这种判断方法很难形成体系。毕竟不同的AI绘图工具有不同的特点。

总之,为了应对AI的逐步推进,一方面我们可以加大“列文虎克”的力度,另一方面也可以引入增加饱和度等图像处理技术。

但如果这样的“量变”积累得越来越多,用肉眼判断就会越来越困难,图像饱和度可能有一天会被AI打破。

因此,人们也在改变对“逐模型”方法的思考和思考,利用AI生成的图像来训练检测模型,并从图像中分析更多的特征。

例如,AI生成的图像在光谱、噪声分布等方面有很多特征,这些特征是肉眼无法捕捉到的,但AI可以清晰地看到它们。

当然,也不排除检测方法滞后,跟不上模型变化,或者模型开发者甚至专门从事对抗性开发的可能。

例如,在上面讨论的图片中,AI 检测工具只有2% 的概率是由AI 合成的。

21a765155feb48a3b3a3de009f1c1bb2~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=wLw9tPEjrIyEvh6iqdqs%2FtvfS5I%3D 但AI欺诈和AI检测之间的博弈过程本身就是一场“猫捉老鼠的游戏”。

因此,除了检测之外,模型开发者可能还需要承担一些责任,比如给AI生成的图像添加隐形水印,让AI欺诈无处可藏。

AI魔高一尺

值得一提的是,上述引起恐慌的AI肖像多是由最近流行的Flux生成/参与制作的。

大家甚至开始认为,如果效果太好,难以辨别,那就是Flux做的。

73e39c2f81f640ee893b89580a224766~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=rG0O5c2B0CK7AYlZvu7JnFXy6Sg%3D 由Stable Diffusion原班人马打造,发布仅10天就在网络上引起轩然大波。

这些假TED演讲的漂亮照片都是它制作的。

2ae320d71b3647dd921287d4f343421b~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=zgW5sqTsIXkOk2EOOfLnQnEWvsQ%3D也有人用Flux和Gen-3制作精美的护肤品广告。

964689b1ed0d4fdfbfa07dc20c9c5649~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=MDAodI3mlljJpAG6RxHkMvTpH%2FA%3D以及多角度的各种合成效果。

5e28c80819254c34bd4757492cc588c0~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=pswKYq9u1y12D41BewguCixmjO8%3D 解决AI画师、AI生成图片中的中文文字等问题。

ac175a732fec4d46a3fde47ebfb64778~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=1kM37JzHWhAMdRO0erIP5wNSHS4%3D 这直接导致人类在辨别AI图画时不再能直接看手和文字。他们只能根据线索猜测。

d60bf19edbdb46df98c572246360f6b3~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1725381811&x-signature=ogAtlOD4eR314tbhPa9fwtoMkRQ%3D助焊剂应加强手头、文字等指标的培训。

这也意味着,如果现在的AI继续在纹理细节、颜色等训练上下功夫,等到下一代AI绘图模型出来时,人类的识别方法可能会再次失效……

此外,Flux 是开源的,可以在笔记本电脑上运行。现在很多人都处于忘记中途的状态。

从稳定扩散到通量花了两年时间。

从“威尔·史密斯吃面条”到“Tedx音箱”,用了1年时间。

真不知道未来人类还要想出什么招数来区分AI世代……

参考链接:

[1]https://x.com/ChuckBaggett/status/1822686462044754160

[2]https://www.reddit.com/r/artificial/comments/1epjlbl/average_looking_people/

[3]https://www.reddit.com/r/ChatGPT/comments/1epeshq/这些_are_all_ai/

[4]https://x.com/levelsio/status/1822751995012268062

– 超过-

量子比特QbitAI·今日头条签约

关注我们,第一时间了解前沿技术动态

版权声明:本文转载于网络,版权归作者所有。如有侵权,请联系本站编辑删除。

综合资源

教师节图片 背景,1986教师节图案

2024-8-27 22:53:43

综合资源

PCIe 4.0固态硬盘1G已不到3毛,aigo、三星、西数、金士顿深度评测

2024-8-28 0:51:00

购物车
优惠劵
搜索