相关新闻
-
近期“暴力男”事件中的“视频数据”在网上暴露了什么?
2026-05-25 16:19在这个信息为王的互联网时代,我们应该如何正确的善用监控数据?这个问题一直被人们所提及,近日,一段“男子当街殴打女子”的视频在网上热传,同时引发了持续关注。大连市公安局先后两次发布通知,称该视
-
从瑞幸事件如何看出互联网企业?
2026-05-23 14:27此次瑞幸咖啡曝出财务造假的丑闻,一方面对中概股产生了一系列的负面影响,另一方面也突显出互联网网站开发企业尽职调查的重要性。瑞幸咖啡事件不但引发了中概股的思考,还触及了整个互联网行业的反思。
-
网站开发真正的作用和意义究竟是什么?
2026-05-18 08:51在当今互联网的发展下,很多企业为了促进企业的发展,会通过网站开发来满足这个需求,但是有很多的企业在网站建设后却发现网站似乎没有很大的作用,并没有起到预期的作用,那么如何才能发挥它的意义呢?1
-
一篇深度好文教你网站开发页脚的设计技巧
2026-05-14 08:35评价一个网站开发的好坏有众多因素,视觉设计、品牌一致性、网站易用性等。都会影响到访客的情绪,而我们要介绍的是不起眼的网站开发的页脚,在网站开发中却有着至关重要的功能担当。今天小编分享几个页脚
-
网站制作设计中有哪些基本规则?
2026-05-10 09:31网站制作给用户的体验感是瞬息之间的事情,用户一般都会在第一次接触网站时,留下的第一个印象来评论网站的好坏,从而决定是否继续停留获取信息。北京BBIN宝盈凭借多年网站制作设计制作经验认为,在快节
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。
020-49255679
现在就想找顾问聊聊立即咨询