你可能每天都在使用计算机视觉,甚至都感受不到它的存在。喜欢看拍照软件上最新的滤镜吗?这是计算机视觉。用你的脸解锁你的iPhone?这也是计算机视觉。用手机存最近的工资,在银行账户里存点现金?这也是计算机视觉。
我们所知道的计算机视觉正处于一个转折点。由于全行业的开发努力以及深度学习算法和图形处理器的进步,我们正在做的事情是十年前是无法想象的。
其中一些技术已经出现了好几年,但过去一年的一些发展已经把计算机视觉带到了一个新的高度。更好的传感器、大量贴有标签的图像、易于使用的深度学习软件,以及经过改进的处理器,这些因素结合在一起,创造出了仅在一年前只有少数几家大型科技公司才具备的功能。
亚马逊发布了一项新发明,可以让任何开发人员使用计算机视觉。微软为OneDrive和SharePoint推出了新的人工智能服务。Google相册让我们的记忆变得可搜索。
未来似乎近在眼前,充满可能性的世界。
我们在年看到的雄心勃勃的计算机视觉项目意味着该技术最终赶上了开发人员长期渴望创建的应用程序。这也意味着开发定制的计算机视觉应用程序很快就会变得更容易。
什么使计算机视觉不同
计算机视觉不同于其他人工智能技术。首先,对于大多数组织来说,计算机视觉是一种全新的能力,而不是其他组织以前尝试过的渐进式改进,比如预测分析。
同时,计算机视觉向人类水平的感知发展也没有内在的障碍。当这些算法从图像中推断信息时,它们并不像其他许多人工智能那样试图预测本质上不确定的未来;它们只是确定了关于图像或图像集的当前内容的绝对真理。这意味着,随着时间的推移,计算机视觉将能够变得更加准确,直到它达到或超过人类图像识别的能力。
最后,计算机视觉能够比其他人工智能工具更快地收集训练数据。大数据集需要在培训数据上进行大量投资,但计算机视觉只需要人们准确地为图片和视频贴上标签——这些都是简单的事情。这就是为什么计算机视觉的采用率在过去的一段时间里提高了这么多。
年及以后的计算机视觉
虽然我们已经开始看到计算机视觉出现在消费产品中,但它的相当大一部分用途将继续用于特定的工业用途。例如,CCC信息服务公司正在帮助汽车保险公司利用热图识别汽车损坏,热图突出显示了最严重的损坏发生在哪里。
这些类型的计算机视觉产品可能不那么耀眼,但重要的是要记住,每一个新的应用程序都意味着开发人员可以获得更多关于什么可行,什么不可行的信息——这将继续使我们越来越接近像智能城市这样的大型项目。
亚马逊(Amazon)、微软(Microsoft)和谷歌公司(谷歌)最近在年展示的跨越式发展,是推动计算机视觉超越临界点的催化剂。产品设计师和人工智能工程师已经在研究使用计算机视觉和增强现实技术的新解决方案。硬件制造商正在改进组件性能和提高成本效率,以使这项技术更好、更容易获得。
近期最大的创新之一将是培训数据。目前,人类仍然需要用人工标记的图像来训练计算机视觉AI。(如果您曾经填写过一个web表单,要求您从一个网格中选择一些图像,这些图像显示的是一个常见的对象,如店面或汽车,那么您实际上已经参与了为计算机视觉项目创建标记数据的工作。)
但随着技术的进步,人工智能将学会培训人工智能,进一步简化流程,加快改进速度。
计算机视觉市场的增长速度几乎和它的功能一样快:预计到年将达到亿美元,每年增长30%以上。人工智能是未来,计算机视觉是未来最有力的体现。很快,它就会无处不在,无处不在——以至于你甚至都不会注意到它。