首个图像识别软件诞生 用图片定位文件提升搜索效率
20.11.2014 12:45
本文来源: 长春市科学技术局
达特茅斯大学的研究人员开发了一个人工智能软件,在互联网上使用图片来搜索定位文件,这比以往的文件搜索具有更大的准确性。
这个新系统,最初是用图片来搜索定位的,现在也可以应用视频文件,首次显示出机器学习图片识别和检索算法的技术已经成熟,足以提高大量文档的在线搜索效率。该系统采用图像和视频数据而不是文本进行文件的搜索定位。这个系统通过学习基于文本的图像搜索结果,从而在搜索阶段学会识别像素。从这些结果中学到的知识,再应用到其它的那些没有标签或标题的图片文件上,使文件的搜索结果更加准确。 该研究结果发表在《PAMI》杂志上(IEEE交易模式分析与机器智能)。 “图片在互联网上随处可见,我们这个方法意味着在文件搜索时他们将不再被忽略。”这项研究的作者之一,副教授Lorenzo Torresani说,“在过去30年里,互联网已经从一个以文本文件为主的小集合,发展为现代化、大规模、快速增加的多媒体数据集,几乎每一个页面都包括多个图片或视频。当一个人浏览网页的时候,他得到的第一眼信息是图片带给他的。但令人惊讶的是,所有现在流行的搜索引擎,包括谷歌和Bing,都去掉图片中包含的信息,并使用专门的文本网页执行文件检索。我们的研究首次表明现代机器视觉系统是准确和高效的,能够有效利用图片像素中的信息提高文件搜索效率。” 研究人员设计和测试了机器视觉系统(人工智能的一个种类),让计算机在没有明确程序的情况下,从网页图片的像素中提取语义信息。当用搜索引擎搜索文件时,这些信息能够丰富HTML页面的描述。研究人员在拥有5000万网页的数据库中执行了600多次搜索查询来测试他们的方法。他们选择了效率最高的文本搜索引擎,并将它修改用来搜索网页图片中提取的额外的语义信息。他们发现这个方法比之前完全的文本搜索精度提高了30%。本文来源: 长春市科学技术局
20.11.2014 12:45