本篇文章2504字,读完约6分钟
正文来源:机器之心
长期以来,人工智能的研究一直停留在文案水平上,例如著名的图灵测试( turning test ),表明机器可以像人一样智能地回答书面问题。
如果让机器更聪明,光解决文案显然是不够的。 事实上,人类的心灵很善于视觉解决。 在观看中识别图案、物体、文案情景的能力让我们变得聪明。 这个能力也是人类的本质特征。
但是直到最近,电脑一直对图像很头疼。 例如,如果不人为添加标签和注释,机器就不能理解图像,图像就会成为无用的文件。
但是,这种不自然的情况正在改变。 因为来了很多可以看到图像的人工智能技术,接下来让我们来看看机器心里的盘点吧
谷歌资源流量
5月谷歌推出谷歌photos时,媒体关注的是人工智能与图像检索相结合的强大功能。 谷歌(同时顾客也马上确认)声称,搜索特定的人,可以找到从现在到宝宝的照片。 搜索品种名称,可以找到相应品种的狗的照片。 通过将名称和食品类别组合起来,例如输入“最大披萨”,可以锁定特定的图像。
在这个应用发布之初,媒体并不知道谷歌的开发时间有多长。 但是,少量的搜索功能在谷歌+上出现了一年多。
两周前,谷歌作为tensorflow平台开放了人工智能的主体部分。
tensorflow虽然不是开源的人工智能平台,但与谷歌强大的图像检索有着最密切的关系。
开源的tensorflow意味着包括初创企业在内的其他企业可以利用谷歌的开源平台,快速地将人工智能和图像结合起来。 尽管谷歌不开放人工智能的关键技术,但它包含了在很多服务器上运行的能力。 谷歌也没有开放这样强大的客户数据库。 但是,谷歌的这毫无疑问会刺激机器学习和人工智能创业的生态快速发展。
我们也期待着基于tensorflow的各种冲击性的新应用程序明年上市。
脸书照片幻灯片
facebook最近开始在messenger应用程序中测试一种新功能——facebook photo magic。 这是一个可选的应用程序,通过扫描手机相册中的照片来解决面部识别。 我建议photo magic识别照片中的人物(他们也是你的facebook朋友),和他们一起分享这些照片。
毫无疑问,这个功能给脸书带来了双重特征。 首先,鼓励通过messenger进行共享。 其次,改善了认识。 但是,光有这个方便的功能是不够的,客户实际上可以在任意的照明条件、立场和其他参数条件下,赞成或拒绝facebook使用人工智能匹配脸部和名字。 facebook人工智能掌握的照片越多,识别效果也越好。
令人惊讶的是,即使遮住脸,facebook的“脸部识别”也能识别你的脸部。 这个系统也关注发型、姿势、服装、体型。 (虽然不知道facebook是否实现了这样先进的系统,但很明显我们正在从客户的照片中收集数据。 )
facebook的photo magic扩展了图库来源,不仅收集了facebook (社交网站)的数据,还收集了messenger (聊天应用)的数据,扩展了数据量。 photo magic还赞成或否定匹配结果,鼓励提高数据质量。
很明显,facebook的最终目的是识别任意场景的某人,即使在看不见脸的恶劣照明条件下也是如此。 确实,未来facebook的人工智能会扫描环境进行分解,发现可以市场化的线索。 例如,如果有人在照片中经常打棒球,广告商就可以利用这个消息锁定棒球迷。 但是,他没有在入境照片的复印件上表现出这样有趣的事情。
当然,他们也试图通过注意照片中一起出现的人来进一步确立社会交流图像。
牛津项目(项目牛津)
微软前几天也更新了牛津项目。 这是一个工具包,允许开发者通过该公司的azure云平台采用微软的人工智能系统。
该工具包支持人工智能全方位的应用,包括口语、视频和其他媒体。 但是,最具冲击力和强大功能的是牛津项目,目前开发者通过牛津人脸应用平台项目( project oxford face api )检测图像中人物的表情
例如,在牛津项目中解析5人的照片,识别照片的脸部和各自的表情——乐趣、愤怒、恶心。
这个功能是新的高度,像人类一样“理解”图像的质量。 看别人的照片时,人们关注的最重要的特征是个人或群体的感情状况。
即时视觉搜索
pinterest日前推出了一种新的图像检索功能,有助于人们发现和购买在固定照片上看到的产品。
首先,在pinterest图像中选择任意物体(前后拖动框标记)。 然后,搜索工具找到具有相似图案和颜色的相似物,系统将最匹配的结果链接到购买按钮,点击这里就可以购买该产品。
该功能基于伯克利视觉学习中心( Berkeleyvisionand Learning Center )的深度学习人工智能。
这种照片人工智能的应用,可以说是一幅画中的单个物体与等价物或类似物、相关物相互关联的网络照片雏形。
云信号
一家名为camfind的图像识别和视觉检索公司今年推出了“云视觉”( cloudsight )公共应用平台。
这个api支持开发者利用camfind的人工智能分解图像拷贝。 这样的扫描大多具有高度的特定性,例如能够识别汽车的制造和型号、狗的品种和食品的具体类型等。 从图片中取出东西后,开发者可以使用这些新闻获得网上的文案新闻。
深度矩阵
deepomatic开发了可识别图像中各种数据的服务型软件的智能大规模搜索引擎。 deepomatic热衷于时尚。 识别图像中的物品,以及颜色、图案和其他数据,并与全面的时尚产品数据库进行匹配。
据deepomatic网站介绍,其技术模拟人脑接收视觉新闻的方式,从而理解各种概念。
远大的未来
每当想到这样惊人的新世界,能理解照片复制的人工智能无处不在,当强大的扩展性和唾液触手可及时,这些无限的可能性就会变得惊人。
而且,这只是个开始。 在大部分情况下,该技术可以通过api、开源程序或服务化解决来实现。 因此,我们已经站在未来世界的入口:图像ai将和网络搜索一样普及,成为这个世界的基本特征。 为了真正模拟人工智能,计算机需要视觉,而现在有了它们。
机器心编译产品,参与成员: sane,有点胖
来源:成都新闻网
标题:“这五种人工智能技术可以识别图片”
地址:http://www.cdsdcc.com/cdkjsh/18148.html