突破机器视觉障碍和人工智能革命

导读2015年12月,谷歌公布了其云视觉API,来执行这些任务,如识别人脸、标志和文字,探测物体并了解其环境的使用。一些用户都对这些功用感到十分振奋,在市场上其它企业也正在寻找类似的一种服务,为使其适应

谷歌于2015年12月发布了其云视觉API,以执行这些任务,如识别人脸、标志和单词、检测对象和了解其环境的使用。 一些用户对这些功能非常兴奋,市场上的其他公司正在寻找类似的服务,以使其适应其交易模式。

突破机器视觉障碍和人工智能革命

为什么机器和设备需要视觉? 视觉是主要的感觉。 为了能够理解人类并带来他们所需要的支持,机器和设备需要能够在视觉行业中观察和反思。 这可能是一种小型相机的方法,可以关心盲人去“看”,并感觉绕着他们在国外。 或家庭监控系统,正确识别一群流浪猫之间的差异,或移动树枝,以及一种防盗的方法。

突破机器视觉障碍和人工智能革命

在过去的一年里,围绕人工智能的嗡嗡声一直非常微弱。 我们从未如此接近看到这种技能的好处。在2016年,新的人工智能分发设备将被看到,由于我们在人工智能方面面临的最困难的挑战之一,也取得了类似的进展:让我们的设备了解他们所看到的。

突破机器视觉障碍和人工智能革命

在我们的日常生活中,随着设备逐渐成为我们不可分割的一部分,我们类似于看到没有足够的视觉天赋,越来越多的使用程序将失败。 这些包括空中无人机碰撞和机器人吸尘器,“吃”他们不应该吃的东西。

突破机器视觉障碍和人工智能革命

视觉系统是人工智能的一个快速发展的分支,旨在使机器和设备与人类视觉相媲美。 随着研究人员使用专门的神经网络来关心识别和理解实际外国图像的机器和设备,视觉系统在过去几年中取得了很大的进展。 今天的电脑正在可视化从在网络上识别猫到在许多照片中识别特定的面孔。 只是,这种技能还有很长的路要走。 今天,我们看到,视觉系统可以离开数据中心,能够将我们的食物从自主无人机打包到机器人人员。

为了更好地理解视觉系统,一个常见的类比,机器人人类视觉和人类视觉,就像天空中的飞鸟和飞机。 两者最终都将依赖于基本的物理来关心它们在空中的飞行,但这并不意味着飞机将带着翅膀飞行。 仅仅因为人和机器很可能看到同样的东西,而解决这些图片的方法很可能有一定的共性,最终的结果仍然很可能是非常不同的。

虽然类似的图片分类变得更加容易,但当它涉及从抽象场景中提取意义和信息时,机器人设备面临着一系列新的问题。幻觉是一个很好的例子,机器和设备人类的视觉还有很长的路要走。

例如,当人们看两张脸的轮廓时,他们看到的不仅仅是抽象的外观。 他们的大脑走得更远,允许他们识别图片的多个部分,看到两张脸,或者看到一个花瓶。 但是对于机器设备来说,这样的图片很难理解。 类似的分类器无法区分两个面和花瓶。 它可以看到物体,如短柄斧头、钩子、避难所甚至吉他。 该系统没有确定物体在图像附近,这表明这种图像的识别对于机器和设备来说是具有挑战性的。

如果我们看到更复杂的事情,这个问题甚至会变得比就像贝弗利·杜利特尔的一幅画一样,虽然每个看到这幅画的人都很可能找不到,但事实上,每个人的脸都在这张画布上,他们几乎立即看到的图片比他们眼皮上看到的要多。 此外,作为复杂的图片,实际的外国也是非常混乱的。 边界附近的正常飞行不能通过开发和设计分析数据的算法来完成。 它需要对真实的场景有一个清晰的理解,并能相应地采取行动。

免责声明:本文章由会员“马楠明”发布如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系