抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!

金磊 发自 凹非寺看!现在正有四位小姐姐在你面前大秀热舞:以为是某些主播在短视频平台发布的作品?No,No,No。真实答案是:假的,生成的,而且还是只靠了一张图

你以为这是一些主播在短视频平台上发布的作品?

不,不,不。

真正的答案是:假的,生成的,而且只依赖于一张图片!

实际的打开方法是这样的:

这是新加坡国立大学和字节跳动的最新研究成果,名为MagicAnimate。

它的功能可以用一个简单的公式来概括:一张图片+一组动作=一段毫无违和感的视频。

然后,这项技术一经公布,就在科技圈引起了不小的轰动,不少科技大佬和极客都开始玩起了花样。

甚至HuggingFace CTO 也用自己的头像进行了尝试:

顺便,他还开了一个幽默的玩笑:

这算健身吗?这周我可以不去健身房了。

还有网友更新得相当及时,正在玩新发布的GTA6(侠盗猎车手6)预告片中的角色:

就连表情包也成为了网友们挑选的对象……

MagicAnimate可以说是把科技圈的注意力都集中到了自己身上,因此有网友调侃:

OpenAI 可以休息一下了。

火,真的火了。

一张图即可生成一段舞

那么如何“吃”这么受欢迎的MagicAnimate呢?

话不多说,让我们一步一步来体验吧。

目前项目组已在HuggingFace开通了在线体验页面:

操作也非常简单,只需三步:

上传静态人物照片,上传要生成的动作演示视频,调整参数,然后点击“动画”。比如下面是我的照片和最近风靡全球的《科目三》舞蹈片段:

视频来源:抖音(ID:QC0217)

您还可以选择页面底部提供的模板进行体验:

不过需要注意的是,由于MagicAnimate目前过于流行,因此在生成过程中可能会出现“宕机”的情况:

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!

就算成功“吃”了,可能还是要排队……

(没错!截至发稿,我们还没有等到结果!)

此外,MagicAnimate还在GitHub上提供了本地体验方法。有兴趣的朋友可以尝试一下~

那么下一个问题是:

怎么做到的?

总体而言,MagicAnimate 采用了基于扩散模型(diffusion)的框架,目的是增强时间一致性、保持参考图像的真实性、提高动画保真度。

为此,团队首先开发了视频扩散模型(Temporal Consistency Modeling)来对时间信息进行编码。

该模型通过向扩散网络添加时间注意模块来对时间信息进行编码,以确保动画中帧之间的时间一致性。

其次,为了保持帧之间的外观一致性,团队引入了新的外观编码器(Appearance Encoder)来保留参考图像的复杂细节。

该编码器与之前使用CLIP编码的方法不同,能够提取密集的视觉特征来指导动画,从而更好地保留身份、背景和服装等信息。

基于这两项创新技术,团队进一步采用了简单的视频融合技术(Video Fusion Technique)来促进长视频动画的平滑过渡。

最终,两个基准测试的实验表明,MagicAnimate 的结果远远优于以前的方法。

尤其是在具有挑战性的TikTok 舞蹈数据集上,MagicAnimate 在视频保真度方面比最强基线高出了38% 以上!

团队给出的定性对比如下:

并与交叉ID的SOTA基线进行对比,结果如下:

One More Thing

不得不说,像MagicAnimate这样的项目最近真的很火。

这不,在“出道”前不久,阿里巴巴团队还发布了一个名为Animate Anybody 的项目,同样只需要“一张图片”和“想要的动作”:

于是,也有网友提出疑问:

这似乎是MagicAnimate 和AnimateAnyone 之间的一场战争。谁更好?

你怎么认为?

论文地址:https://arxiv.org/abs/2311.16498

参考链接:[1]https://github.com/magic-research/magic-animate[2]https://twitter.com/cocktailpeanut/status/1732052908227588263[3]https://twitter.com/ProductHunt/status/1732116454647136449[4]https://twitter.com/Gradio/状态/1731992981715231162[5]https://twitter.com/dylan_ebert_/status/1732152096621813954

– 超过-

用户评论

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
月下独酌

哇,这个技术太神奇了!再也不用担心自己舞蹈动作不够标准了,一张照片就能生成视频,太方便了。

    有12位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
北染陌人

真的假的?一张照片就能做出高质量的视频?那我还学舞蹈做什么啊,哈哈。

    有11位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
一生只盼一人

我觉得这种技术挺有意思的,但是感觉少了点互动性,还是喜欢看真人表演。

    有11位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
走过海棠暮

这个技术太前沿了,不过我担心照片生成的舞蹈视频缺乏灵性。

    有5位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
该用户已上天

这种照片生成视频的方式挺有创意的,希望以后能看到更多这样的尝试。

    有14位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
站上冰箱当高冷

我不太懂技术,但是看到这个标题我就觉得有点不放心,感觉少了点什么。

    有15位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
葵雨

我觉得这种技术对于舞蹈爱好者来说是个福音,可以更好地展示自己的舞姿。

    有11位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
苏莫晨

哎呀,这种技术如果用在商业广告上,效果肯定不错吧!

    有17位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
醉红颜

哎,现在连舞蹈都不需要真人了,真是科技改变生活啊。

    有15位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
一尾流莺

这张照片就能生成视频,那我们是不是可以告别那些低质量的舞蹈视频了呢?

    有20位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
孤城暮雨

我猜这技术背后的算法一定很复杂,不然怎么处理那么多的舞蹈动作呢。

    有5位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
逃避

虽然感觉有点不适应,但是这个技术确实很有潜力,说不定会成为未来舞蹈传播的新方式。

    有14位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
傲世九天

这个标题让我想起了之前看到的虚拟偶像,感觉这个技术有点类似。

    有19位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
孤者何惧

不过说实话,我还是更喜欢看真人跳舞,那种感觉是照片无法替代的。

    有8位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
全网暗恋者

这张照片就能生成视频,那以后我们是不是能看到更多个性化的舞蹈视频了呢?

    有11位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
尘埃落定

这个技术让我想起了小时候玩的游戏,现在感觉科技真是越来越强大了。

    有13位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
温柔腔

不过,我还是有点担心这种技术会不会让舞蹈这门艺术变得廉价。

    有18位网友表示赞同!

抖音舞蹈不需要真人出现在镜头上,只需一张照片就可以生成高质量的视频!
酒笙倾凉

这个标题让我想起了小时候的魔法书,感觉现在的生活就像是在魔法世界里一样。

    有15位网友表示赞同!

综合资源

高级剪辑编辑,用照片制作精美的旋转视频,简单易学

2024-9-30 13:09:20

综合资源

教你如何将手机照片制作视频,并添加音乐和文字。它简单易学且非常实用。

2024-9-30 13:14:25

购物车
优惠劵
搜索