谷歌新科技：能把照片变立体 - 行业动态

谷歌新科技：能把照片变立体

2015/7/11 8:33:15　来源:中国产业发展研究网　【字体：大中小】【收藏本页】【打印】【关闭】

核心提示： 北京时间7月10日下午消息，据美国科技博客Gizmodo报道，本周《麻省理工科技评论》杂志发布的一篇论文披露了谷歌研发的新系统Deep Stereo，该系统可

　　北京时间7月10日下午消息，据美国科技博客Gizmodo报道，本周《麻省理工科技评论》杂志发布的一篇论文披露了谷歌研发的新系统Deep Stereo，该系统可以通过人工智能技术将一系列照片无缝组合成为视频。
　　论文作者名为约翰-弗林，是一名谷歌工程师，其他三位合著者也都在谷歌工作。在论文中，弗林阐述了谷歌研发DeepStereo系统的全过程。
　　早在Deep Stereo之前，就有类似利用静态图片输出动画的技术存在。美国计算机协会计算机图形专业组（SIGGRAPH）就曾通过网上图像制作过延时动画。
　　但与其他静态图像生成动画技术相比，Deep Stereo系统最大的不同在于，它可以猜测出图像的缺失部分，在空白处创造出来源图片中没有的新图像。据英国媒体Register报道，和传统动画利用视觉暂停的原理不同，Deep Steoreo可以“想象出”两幅静止图像之间的画面。
　　弗林和他的合著者在论文中写道，“这项技术与之前的产品截然不同，我们尝试采用新型深度架构直接合成新图像，不需要预先设置景深、焦距等训练数据。”
　　该系统背后的网络架构原理十分复杂，借鉴了各种先例。但作者在文中介绍了该技术的独到之处：系统在工作时会采用两套独立的网络架构。其中之一会根据已有的2D数据预测各个像素的景深。另外一个则会对色彩作出预测。两者共同以2D图像的形式完成对景深和色彩的预测，最终合成视频。
　　Deep Stereo仍有不足之处：视频角落的画面很不清晰。“算法没有涉及到的区域往往是模糊的，无法被覆盖，也无法使用像素填充，”开发团队解释说。不过，这套系统暗藏了一个通过模糊的图源生成物体的小技巧：“移动对象在训练数据中非常常见，我们的模型可以优雅地完成这个动作：开始出现的时候是模糊的，然后逐渐转换为运动模糊效果。”
　　虽然该系统生成的最终产品与通过图像简单合成的动画区别不大，但该技术能够为谷歌的街景技术锦上添花。同时也能为谷歌的人工智能技术提供一个更加实用的范例。
　　本月，谷歌的“梦想机器人”在互联网上走红，这是该公司超级先进的人工神经网络，由谷歌的工程师团队开发而成。设计初衷是要找到一种切实可行的方法，让计算机辩认出图像中的内容。谷歌工程师正在教这些不可理喻的人工“大脑”辨识动物或架构，顺便也做做“梦”，此举令人感到震惊和恐惧。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如有侵权行为，请第一时间联系我们修改或删除，邮箱：cidr@chinaidr.com。
- 上一篇：2015年二季度全球PC市场份额排行榜出炉：联想第一
- 下一篇：2015最热门智能手机快充技术一览
- 直达16个行业
- 热点资讯
- 24小时
- 周排行
- 月排行

	高级搜索
	热线电话：400-680-5790　订购合同下载订购流程及付款方式