北京时间5月8日凌晨1点,谷歌I/O大会在美国山景城海岸线圆形剧场举行。
今年是谷歌实施“AI First”的第三年。在这场具有里程碑意义的大会上,谷歌首席执行官桑德尔皮帅做了一次例行的开幕式。他说,谷歌的目标一直是组织来自世界各地的信息,并帮助世界各地的用户方便地访问这些信息。
接下来,谷歌将从一个“帮你找到答案”的公司,变成一个“帮你完成任务”的公司,打造一个对所有人都更有帮助的谷歌。
整个I/O大会下来,没有“黑科技”多少有些失望。然而,整个会议的风格也符合桑德尔皮帅的开场白。AI在Google的Assistant、Android Q、AR、硬件等重要业务中起到了润滑作用。并且已经向“实用化”的道路靠拢。
1.人工智能视觉和语音
首先,在AI的帮助下,Google的基础3354搜索也迎来了重要更新:视觉搜索引入了AR功能,搜索结果以AR的形式直接在现实中展示。
搜索:AR功能中引入视觉搜索。在会场,谷歌会将搜索到的鲨鱼“投射”到真实场景中。
Google与NASA、New Balance、Target、Visible Body、Volvo、Wayfair等都有合作。支持在搜索或物理扫描中建立AR模型。
比如在Google搜索中从Visible Body看解剖3D模型,可以提供学习参考。
以上和谷歌镜头实际上反映了谷歌在机器视觉技术上的进步。这一次,谷歌镜头有以下更新:
更强的菜单识别:通过扫描一家餐厅的菜单,Google Lens可以自动用符号突出显示最受欢迎的菜肴。用户点击后,还会显示其他用户对这道菜的评价和评分,帮助困难户通过点餐做出选择。
实时照片翻译。相当于把Google Translate app的拍照功能搬到相机上,把镜头放在机票或菜单上,翻译结果就会自动覆盖。
将数字信息与物理世界中的事物联系起来。比如在谷歌的《好胃口》上,把镜头对准杂志的菜谱,手机就会演示这道菜的烹饪过程。或者可以用在博物馆里。当镜头对准画作时,可以显示出相应的历史故事。
语音阅读的文本识别。比如针对报纸、宣传页,手机可以支持逐句标注,用你熟悉的母语朗读内容。
谷歌计划使该功能支持英语、日语、中文等数十种语言。同时它的代码容量只有100KB左右,所以使用门槛很低,低至35美元的终端设备也可以使用。
Google Lens以上更新的功能都可以在最新的Android Q中应用。
谷歌助手:引领下一代语音助手作为谷歌的语音助手,谷歌助手在Android智能手机、智能音箱及其启用的第三方硬件中发挥着重要作用。目前,Google Assistant的装机量已累计超过10亿台,与全球合作的智能设备覆盖3500多个品牌的3万种,提供80个国家/地区的30多种语言。
在这次大会上,谷歌表示,他们创造了“下一代助手”,通过内部努力,谷歌助手在响应速度和处理多项任务的能力方面取得了显著进步。
基于Google的神经网络和机器学习算法,Google Assistant的100GB语音识别模型在运行中占用不到0.5 GB字节,使得理解语音和提供结果的速度比上一代产品快10倍,并且可以在手机本地运行。Google Assistant的未来愿景是实现无联网(本地处理)和零延迟。
新一代谷歌助手具备持续快速处理多项任务的能力。在现场演示环节中,谷歌发言人连续使用手机上的谷歌助手执行多项任务,如浏览照片、设置定时器、打开手电筒、在线预订汽车等。期间表现非常流畅,一点都不卡顿,也不用用“嘿谷歌”叫醒助手。
更重要的是,以后Google Home的闹钟睡觉时,只需喊一声“停”就可以停止闹铃。
在另一次演示中,演讲者使用谷歌助手通过语音命令编写和发送电子邮件,快速准确,AI可以在根据语音传输电子邮件的过程中有意识地预测下一句话。
“为你挑选”个性化推荐的能力。基于过往对话的知识图谱,Google Assistant可以快速准确地理解用户的意图和需求,以及具体的单词代表什么,并提供精准的个性化推荐。今年晚些时候,这一功能将在菜谱、博客、活动等应用中得到体现。
场景的“驾驶模式”,这是新一代谷歌助手在驾驶场景的探索。在“Hey Google,let’s drive”的语音命令之后,Google Assistant带来了全新的信息仪表盘和个性化功能,包括打电话告知联系方式、询问是否接听、恢复上次暂停的博客、根据日历上的餐厅预订信息导航到目的地。
Duplex AI: Duplex AI于去年在网络上首次亮相,已经能够接听来电和骚扰,并在美国43个州为个人用户提供餐厅预订服务。
时隔一年,Duplex AI迎来更新:将调用服务能力转移到网页的web端。比如在网上租车、买电影票,你只要告诉哪个商家你需要预定某项服务,剩下的就交给Assistant自动帮你在网页上填写个人信息。
Euphonia项目:让AI理解每个人。目前大量语音识别技术的训练只是针对语音表达正常的人群,而对于很多特殊人群的了解,比如失语症(ALS)的了解是缺乏的。谷歌这次推出了Project Euphonia的新项目,想在这方面做一些努力。
Project Euphonia的项目旨在为这一特殊人群获取机器学习模型,并训练更具包容性的语音理解模型。谷歌希望所有的语音交互设备都能理解并服务于每个人。
部分项目参与者(语言障碍患者)提供的语料库训练模型
2.Android Q在会上,谷歌宣布目前搭载Android系统的活跃设备数量已经超过25亿,并强调了Android的三大核心主题:——创新、安全与隐私、数字健康。
正如之前透露的,Android Q官方提供了黑暗模式,更省电。
隐私方面,Android Q增加了50项隐私安全设置。用户可以设置应用程序在使用过程中是否可以访问位置和其他信息,以及允许的访问时间段。同时,系统会主动告知用户哪些应用在后台收集数据。
此外,出于隐私考虑,谷歌对谷歌地图和YouTube应用了隐名模式,即Chrome过去使用的隐身模式。
随着新一代操作系统的推出,谷歌去年演示的谷歌地图实景AR导航功能终于上线了。
基于On-Device machine learning,Google推出了Live Caption功能,可以通过将音频转换成视频中的文本,实时显示在屏幕上。有了这个功能,尤其是听障用户,看视频就方便多了,关键是还可以离线使用。谷歌还表示,即使关闭视频声音,文字也会正确再现。
此外,谷歌还推出了Live Relay功能,支持离线实时将对方的语音转换成文本,帮助听障用户拨打电话。
添加一个聚焦模式。去年,Android P首次加入防沉迷系统。这种聚焦模式避免了前者“一刀切”的情况,为用户提供了更加智能灵活的屏蔽管理。在你努力工作的时候,可以选择屏幕上一些容易分散注意力的app。
迎合未来折叠手机和5G的趋势,谷歌还展示了Android的折叠交互体验。
最后,Google公布了Android Q的首批合作伙伴,中国的华为、小米、一加、OV都在列表页面。
3.带摄像头的智能音箱,低价手机。
会上正式发布了之前爆料的两款硬件家用智能音箱和Pixel 3a系列中端手机。
Nest Hub Max:广角镜头,人脸手势识别,立体。这款带屏幕的智能音箱新品名字叫Nest Hub Max。顾名思义,谷歌把Nest搬到了音箱上,弥补了去年Home Hub没有摄像头的遗憾,并加大了屏幕尺寸。谷歌表示,让房子成为“有帮助的家”是他们创造这一新产品的主要动力。
Nest Hub Max的外观完全继承了上一代产品,相当于一个大尺寸的家用Hub。它具有更大的显示屏(10英寸),更好的音质(立体声)和广角摄像头,可以实现与其他同类产品相同的功能,如视频通话,安全监控,拍照,食谱,家庭控制等。它已经完全有能力对亚马逊Echo Show和脸书门户进行基准测试。
为了体现Nest Hub Max的独特性,谷歌的演讲还重点介绍了它的人工智能能力:
面部功能识别面部匹配可以被认证。
17广角镜头支持追踪用户,让用户在视频通话中途停留。
手势识别暂停音乐和视频播放。
对此,谷歌再次强调Face Match人脸识别功能不依赖云端,而是在本地运行,消除大家对隐私保护的顾虑。
Nest Hub Max售价229美元,预计今年夏天率先在美国上市。
Pixel 3a系列:价格低廉的好相机。传闻中的谷歌Pixel系列中端机型Pixel 3a也在本次发布会上亮相,起价399美元,相当于去年Pixel 3/3 XL价格的一半。谷歌官方有这么多强大的AI技术,也是希望更多的人能以更低的价格享受到这些AI带来的便利。
Pixel 3a/3a XL完全延续了Pixel 3系列的设计风格,提供黑、白、紫三种颜色,保留了3.5mm耳机孔和Active Edge。此外,Pixel 3依靠AI的夜拍增强功能和人像模式景深调节,这些都在本机上得到了保留。
Pixel 3a/3a XL配备的电池容量分别为3000 mAh和3700 mA。得益于谷歌的机器学习,Pixel 3a/3a XL的电池寿命得到了有效的管理。充电1小时可续航长达30小时,快充15分钟可获得7小时。
其他配置和功能:
芯片:高通骁龙670
系统:安卓Q
屏幕:Pixel 3a配备5.6英寸有机发光二极管屏幕,2,220 x 1,080分辨率,441ppiPixel XL配备了6英寸有机发光二极管屏幕,2,160 x 1,080分辨率,401 ppi。
摄像头:前置800万像素,后置1220像素摄像头;支持Top Shot、动态自动对焦、超分辨率变焦、夜视和照相亭模式。
存储:4GB,64GB,不支持外扩。
价格:399美元/479美元
过去,Pixel 3只在威瑞森销售。该系列Pixel 3a进一步拓展了T-Mobile、Sprint、US Cellular等运营商的销售渠道。目前Pixel 3a支持包括美国在内的13个国家和地区的销售。
4.总结可能是因为事前一堆爆料,也可能是新鲜感真的太少了。今年的I/O软件(Android Q)和硬件(手机和音箱)场景都没那么精彩。
好在每一轮介绍结束后,艾都把全场引入了一个激动人心、高潮迭起的氛围。
让人感到心酸的是,在这次I/O中,Google所呈现的AI已经完全褪去了“炫耀技能”的阴影,真正的被实现了,尽可能的造福人类,给生活带来便利。
版权声明:本文由深圳湾原创。转载或摘抄前请获得授权。
深圳微信微信官方账号:shenzhenware。同时,深圳湾在头条、企鹅、知乎等主流媒体站开设专栏。欢迎关注。转载、组稿、投稿文章、团队报道,请在微信官方账号对话框回复关键词并留下联系方式。