1 2 3 下一页
随着网上图像信息的急剧膨胀,对这一部分信息的检索给传统的检索理论带来了挑战。由于图像不同于文本,文本本身就可以说明所讲的内容,而图像则需要靠人们各自的理解来说明其蕴义,因此图像检索比起文本的查询和匹配要困难得多。
目前,网上图像信息的检索技术大致可分为两大部分,一是基于整个
网络的图像搜索引擎的检索技术,再就是主要基于图像
数据库的各种图像检索系统。二者从不同的角度出发检索图像信息。比较而言,后者的技术更为成熟,前者由于要求反映信息快速、全面、覆盖面广,因而技术相对粗糙些。并且前者越来越倾向于与后者的检索技术相结合。
一.
图像搜索引擎的检索技术 近年来随着用户对网上图像搜索要求的不断增长,各种基于
Web的图像搜索引擎应运而生,它们各自以不同的工作方式为用户提供各种检索途径,使网上图像信息的搜索变得非常简单,尽管还不很完善,却已经可以满足用户的大多数要求。
1.
工作原理 WWW图像搜索引擎需要为在web上浏览过的图像建立索引信息,能够进行图像分析和判别,为图像加注释,存储抽取出的索引信息建立索引库,理想的图像搜索引擎还应该能支持基于内容的图像检索[1]。
图像搜索引擎主要通过以下两种方法识别图像[2]: (1)自动查找图像文件 可以通过两个HTML标签,即IMG SRC和HREF来检测是否存在可显示的图像文件,IMG SRC表示"显示下面的图像文件",导向的是嵌入式图像;而HREF则表示"下面是一个链接",导向的是被链接的图像。搜索引擎通过检查文件扩展名来判断其导向的是否是图像文件。如果文件扩展名是.GIF或.JPG,即是一个可显示的图像。(2)人工干预找出图像并进行分类 由人工对网上的图像及站点进行选择。这种方法可以产生准确的查询体系,但劳动强度太大,限制处理图像的数量。
2.
图像搜索引擎的检索途径 目前图像搜索引擎大多支持关键词搜索和分类浏览两种检索方式,部分可提供可视属性检索,但也很有限。主要的检索途径有以下三种:
(1)
关键词检索 即基于图像外部信息或人工赋予的关键词进行自由词检索。图像的外部信息包括图像的文件名或目录名、路径名、链路、ALT标签以及图像周围的文本信息。基于这部分信息的检索是目前图像搜索引擎采用最多的方法。在找出图像文件后,图像搜索引擎通过查看文件名或路径名确定文件内容,但这取决于文件名或路径名的描述程度。也可以通过查看图像的标题来匹配检索词,但嵌入式或被链接的图像可能有也可能没有正规标题,即使存在正规标题,可能还是缺少让搜索引擎可识别的一致性标志,如带冒号的"photo"一类的词。但HTML的ALT标签可以起到图像标题的作用,它紧跟在IMG SRC标签后面。也可以查找网站或页面的标题,但这取决于其是否准确描述了该站点的内容,而这几乎是不可能的,所以只是偶尔起作用[2]。
有些图像搜索引擎采用人工对图像的内容(如物体、背景、构成、颜色等)进行描述并分类,给出标引词,检索时,主要在这些标引词中搜索用户的检索词。这种查询方式比较准确,可以获得较好的查准率。但需人工参与,劳动强度大,因而限制了可处理的图像数量,并且需要一定的规范和标准,效果取决于人工描述的精确度。
(2)
分类目录浏览方式
图像搜索引擎将采集到的图像或通过某种自动机制或采用人工进行分类标引,为用户提供按主题浏览的检索方式。适用于检索目标不明确或以一般浏览为目的的用户。如WebSEEK提供了含有16个大类77个小类的极为丰富的类目体系,Yahoo!的Image Surfer的类目体系虽只包括几个流行主题,但对类目的划分比较深入,含有6个大类14个二级类以及更多的三级类,每个类目下的图像从几个到几百个不等。
(3)
基于图像可视属性的检索 又称为基于图像内容(content-based)的检索。由图像分析软件自动抽取图像的颜色、形状、纹理等特征,建立特征索引库,用户只需将要查找的图像的大致特征描述出来,就可以找出与之具有相近特征的图像。这是一种基于图像固有属性的机械匹配,特别适用于检索目标明确的查询要求(例如对商标的检索),产生的结果也比较准确。目前这种较成熟的检索技术主要应用于图像数据库的检索,在基于web的图像搜索引擎中应用这种检索技术虽还具有一定的困难,但已有部分图像搜索引擎进行了尝试,如Yahoo、WebSEEK就提供了基于图像的形状或颜色直方图的粗陋的可视检索功能。本文的第二部分将具体讨论这种检索技术在图像检索软件中的应用。
3.
具代表性的几个图像搜索引擎简介[2] (1)
.Scour(http://www.scour.com)[3][4] Scour成立于1998年,自称是第一个基于web的多媒体搜索引擎。虽严格讲,它并非是一个图像搜索引擎,但可以将检索限制在图像搜索上。
它的工作原理是在文件名、路径名或ALT标签中搜索检索词。主要使用关键词检索,可以用"+"或"-"来增加或排除关键词,使用尽可能少的关键词会更有效。在高级检索中,可以将检索结果图像限制在GIF、BMP、JPEG等格式中。检索结果显示简图、图像类型(如GIF、BMP)、图像大小、最后被查找的日期、检索词的匹配数量、标引使用的关键词、成功
下载的可靠程度等,并同时给出图像文件的URL和源站点的URL。
主要缺陷是标引深度不足,查准率较低,但查全率较好。
(2)
.WebSEEK (http://disney.ctr.columbia.edu/webseek/)[5] WebSEEK是由哥伦比亚大学开发的一种实验性系统。采用代理自动搜索可视信息并对其进行分类,目前已分类的图像有66万多幅,形成了一个极富创新性的图像目录,主题分类是它的主要优点。
WebSEEK的检索途径有三种,一是使用关键词进行自由全文检索,但不支持短语检索;二是利用不同的类目等级进行主题浏览;三是在检出图像的基础上利用其可视属性进一步检索。
其检索结果显示为没有文本的简图及图像大小。单击简图可得到原图。每个简图下面提供三个链接,分别是:"col"-根据该图颜色在检出图像列表中搜索相关图像;"web"-在整个WebSEEK目录中根据该图颜色再次检索相近图像;"his"-通过手动调整该图像的颜色直方图进行另一新的检索。
(3)
.Amazing Picture Machine(http://www.ncrtec.org/picture.htm)[6] 这是由NCRTEC组织开发的一个"真正人工建立的完全的关键词式索引"。 Amazing Picture Machine后面的教师负责选择图像丰富的站点,然后对每幅选定的图像内容进行描述,给出关键词。因此它的最大特点就是人工干预,关键词检索是主要的检索手段。
Amazing Picture Machine的搜索结果将显示一个简短的标题、有关图像的说明(如彩色或黑白)、文件的大小、文件类型及象素多少等,但不显示简图。单击该标题可得到原图像,但需由该URL回溯才能找出源站点。
由于人工干预检索过程,它的查准率极好,但这也限制了它的查全率。它的检索范围很有限,只包括web上人工选择的部分站点。
(4)
.Lycos (http://multimedia.lycos.com/)[7][8] 图像搜索是Lycos 的多媒体检索功能之一,其搜索范围包括整个网络和一个内含80,000幅图像的图库供浏览和检索,并划分为主题目录。
Lycos对所收录的图像进行了详尽的内容描述(description),并支持短语检索,从而使其查准率大大提高。它根据文件扩展名识别图像,在描述词、文件名、目录名或ALT字段中查询检索词。结果显示的信息极为丰富,包括简图、图像大小、最后检索日期、图像文件名、图像内容描述词、图像所在页面等。点击简图将得到原图及更多的信息,如著作权人和更多的相关图像。比较而言它的检索效果很好,速度也很快。
上一篇: 用DirectDraw编写动画程序
下一篇: DIRECTX 5游戏强力制作
1 2 3 下一页