有人用ai伪造了自己的声音亲朋好友都听不出来(ai伪造声音)

来源:新浪科技
如果有一种技术可以在一秒钟内复制或模仿你的讲话,你会感到惊讶或害怕吗?
2019年,AI技术的应用越来越多元化。科大讯飞、搜狗等科技公司相继发布了语音合成技术的应用。通过AI手段,用户可以在一秒钟内改变社会名人的声音或其他想要模仿的声音。
互联网技术正在悄然改变我们的生活。对于人工智能企业来说,广泛应用语音识别技术并不难。但其背后的伦理和安全风险可能会随着AI技术的发展成为一个不可忽视的问题。
实时变声技术受AI公司欢迎,声音可以一秒变。“大家好,今天我很高兴。我来科大讯飞参加新品发布会,我一直喜欢科大讯飞……”
这是发生在科大讯飞2019新品发布会上的一幕。科大讯飞董事长刘庆峰用科技模拟了单田芳、林志玲和罗永浩的声音来致开幕词。尤其是罗永浩的声音响起的时候,很多人以为老罗已经到现场了。
“你看到了刘庆峰,却听到了老罗的声音。”刘庆峰在台上说,这是该公司最新的实时变声技术。据悉,这种新的语音合成技术只需要1分钟的声音样本就可以模仿任何人的讲话。
不仅在科大讯飞,就在最近,搜狗CEO王小川在一次会议上展示了搜狗的变声功能。通过手机软件,模拟了高和东北姑娘的声音,引得现场笑声不断。然后他展示了歌曲中的声音替换。据介绍,系统对他的声音进行了14分钟的训练,然后调音。
这是搜狗最新的语音合成技术,可以把任何人的声音转换成特定的声音,林志玲和马云的声音可以在几秒钟内改变。王小川说,这不仅是简单的语音合成,还可以传递语音、语调和情感。
目前,在搜狗输入法中,用户可以将自己的声音自由转换成自己喜欢的声音,在微信、QQ、陌陌等各大社交场景中均可使用。搜狗为19种特定声音提供了明星、动漫人物、游戏IP、方言等类别。
王小川
其实语音合成在很长一段时间内都不是什么新技术。之前我们看到的更多的是把文字转化成声音,比如在导航、转录、智能音箱、智能语音助手比如Siri等方面的应用。而不是真人说话。
今年,许多AI公司在语音合成在变声、语音cos等场景的应用上做出了努力,可以将真人发出的声音转化为特定的声音。
百度也有相关技术的应用。今年5月初,在央视的公益节目《等着我》中,百度大脑基于智能语音技术合成了已故老兵的声音,帮助64年的老战友实现了“团圆”。
据介绍,该技术采用百度端到端的语音风格分离建模方案,利用多组神经网络对音色、情感、风格等不同维度的语音进行独立编码建模,从而指导最终合成。
这些AI技术应用的背后,一方面反映了AI技术应用的进步,以及给社会带来的普惠价值。如搜狗将语音转语音技术、AI合成主播技术与行业结合,与媒体、教育、内容制作、旅游等场景结合,将带来更多价值想象空间。
另一方面,未来可能存在的技术漏洞、滥用等风险也不容忽视。有网友指出“小心被用于电信诈骗”“以后可能会接到‘马云’的电话”.
音频领域的人士认为,对于音频这种交互工具产品应该是有用的,但对于以音频为内容载体的在线音频平台,其积极意义还有待观察。
所以对于企业来说,在不断寻求技术突破和商业价值的同时,也要树立技术安全的责任感。
语音合成技术在实际应用中还存在很多缺陷。据了解,逼真的语音合成技术是由神经网络和机器学习支持的。神经网络模拟了电信号在人脑神经元之间的传递过程,并对输入数据进行处理。它使用分层神经元从大量样本数据中总结共同特征。
在商业化方面,语音合成技术已经应用于语音交互、有声读物、新媒体、智能客服、泛娱乐等领域。
蜻蜓FM大学教育类负责人牛森在接受新浪科技采访时表示,语音合成技术将大大降低音频领域从文本内容到音频的人员、时间和经济成本。
在谈到语音cos时,牛森指出,这件事在实践中存在很多瑕疵。比如合成的音频,在情感和情感表达上肯定和真实的人声不完全一致。
他表示,对于音频用户来说,同样的内容,阅读和讲述的听感体验会有很大的不同。只有最真实的人声,才能引起深刻的情感共鸣,这也是音频的价值所在。
在道德和安全层面,牛森认为,首先应该从技术上对人声和合成音进行筛选和确认,从权利上界定版权链。任何未经授权的合成音频都是侵权违法行为。“作为平台,我们会严格控制版权和质量”。
据了解,在一些音频平台上,语音合成技术主要用于少儿节目,而在其他内容上,AI模拟效果并不是那么好,并没有得到广泛应用。
至于语音合成中的安全隐患,变声技术发布后,刘庆峰曾现场强调:人工智能可持续发展的核心是其价值观如何阳光、健康、对人有益。所以,作为变声技术这样的黑科技,我们显然不会在各种app中轻易对外开放,必须有一种健康、安全、有趣的方式与世界连接。
此前,刘庆峰也提到,人工智能领域需要技术合作,也需要法律和伦理合作。
关于安全问题,搜狗公司向新浪科技表示,“技术是一把双刃剑,可以用来造福,也可以带来灾难。搜狗永远坚持科学和技术。变声技术是目前人工智能的前沿应用。基于语音表征学习和迁移学习技术,任何人的语音都可以转换成特定人的语音(任意对一)。搜狗在这方面有所突破,率先进入实用阶段。这项技术还可以应用于电影配音、家庭陪伴等场景,帮助人们提高工作效率和生活幸福感。”
搜狗透露,为了保证这项技术不被有心人滥用,公司做了严格的管理和限制:
1.搜狗不向第三方出口变声技术,以确保该技术的可控性和安全性。
2.变声功能的所有目标音色均由搜狗定义,不允许用户随意模仿。
3.改变后的声音用于微信、QQ等app。它不能被转发和复制,所以它可以追踪发件人。
此前,王小川在接受媒体采访时也提到了人工智能的立法:在人工智能发展的现阶段,根据技术的发展,不断调整和尽快完善,是应对人工智能带来的法律和伦理风险的最实际的手段。
但是,目前技术的发展仍然领先于伦理和法律。周在今年5月的世界智能大会上提到,在AI领域,如果没有人文主义的思维,可能设计出来的系统会是一个悲剧。
AI技术背后的人文思考。事实上,AI技术背后“以假乱真”的现象不仅仅出现在声音领域。最近三星的一个技术应用也引起了人们的关注。
据国外媒体报道,三星位于莫斯科的人工智能实验室的研究人员,基于大量的运动图片和视频资料,以及“深度卷积神经网络”训练,可以通过AI技术准确识别某些面部特征,并可以将静止图像变成运动图片甚至视频。
在实验中
也就是说,未来随着AI图像生成技术的进步,只需要一张照片就可以生成一段虚假视频。
在此之前,艾的变脸也在社交媒体上引起热议。有人把《射雕英雄传》 94版朱茵演的黄蓉换成了杨幂的脸。网友直呼“不矛盾”“假真相”,甚至调侃“最划算的新老剧制作方式”。
这本来就是一个恶搞或者纯娱乐的视频。然而,在这种操作的背后,很多人担心该技术会被滥用。如果用在不合适的地方,就会涉及到版权、肖像权、安全等问题。
这种技术早在两年前就在国外技术界存在和传播。之前有网友把主播的脸改成了明星。然而,由于各种因素的影响,这项技术的实际应用还比较少。
图片来源:互联网
在美国,人工智能已经被用来将色情视频中的女主角替换成一个女明星。这项技术引起了恐慌并被关闭。
除此之外,在某些行业,这样的技术也会带来新的思考。比如有些音频会被篡改,引发社会问题;在未来的影视剧中,可能会出现星体双AI变脸、AI合成配音等场景。虽然这些技术在一定程度上节约了成本,加快了影视制作的进程,但在道德和人文层面释放的价值观仍有待商榷。
无论是AI变声还是AI变脸,高科技的快速发展也给法律规则带来了新的挑战。
值得注意的是,在4月份全国人大常委会审议的《民法典人格权编(草案)》中,正式增加了一条:任何组织和个人不得利用信息技术手段侵犯他人的肖像权。
换句话说,一个很好的信号是,未来AI变脸甚至语音合成技术的应用都将受到法律的规范。
目前,AI技术的应用正在不断突破虚拟世界和现实世界的界限。我们需要思考的是,如果这些技术在未来变得越来越强大,越来越普及,那么辨别真假将会变得越来越困难。技术发展的同时,应该如何控制安全隐患?

综合资源

初三物理李雪冬

2024-1-28 20:41:19

好玩下载

火影忍者辅助下载,火影忍者手游辅助器下载

2024-1-17 23:54:36

购物车
优惠劵
搜索