口 山西太原太化职工大学 何洁
摘曼 搜素引擎已从基于文字的攫素朝多媒体方向发展,本文讨论了基于文字和基于圈 自身内窖检素的工作原理,几
种常用圈 搜素引擎及其使用方法。
■欢罔上冲浪的朋友一定不会对雅虎(www.yahoo.COm),
攫狐(WWW.sohu.tom)感翻陌生。目前搜素引擎已经成为广大罔
民量经常使用的罔络服务,这莹传统的基于文字的搜素引擎给
用户提供了一个方便的罔络服务平台,它们会带你到达要去的
罔站和要找的页面。然而,随着互联罔的多媒体化和多媒体检
素技术的不断发展,传统基于文字的搜素引擎已无法满足新的
需求,搜素要向多媒体方向发展,其中圈 搜素成了多媒体信
息检素的第一站。
一
、 什么是图像搜索引擎
图像搜索引擎是专门用来查询图形、图像 (照片)的搜索
引擎。同文字搜索引擎一样,它提供一个分类 目录.并提供关
键词检索的功能。用户可以通过分类在网上浏览 。或者使用关
键词检索.来查找想要的图片。与文字搜索引擎不同的是 ,它
查到的最终结果 .不是文字形式的网站名 网站内容.而是一
幅幅缩微图片,其网站链接 (URL)及对图片的简单文字介绍。
二.图像搜索引擎的工作原理
图像搜索的方法主要有两种:基于文字的搜索与基于内容
的搜索。基于文字的搜索方式是由搜索图像的文字描述或关键
词进而搜索出相关的图像,而基于内容的搜索方式则是由分析
图像本身的内容如颜色特征、形状特征、纹理特征等搜索到相
似的图像。目前许多图像搜索产品与技术都是以上两种技术的
图
不
太
所
管
少
要
所
以图像本身并没有任何可以搜索的部件,除非你利用了某种可
以辨别颜色和形状的机制。那么 Web搜索引擎是如何识别图像
并与你的要求相比较的呢7如果利用一种内部数据库.搜索引
擎就可以查看各个标题和分成若干段的数据。对于几乎没有什
么标准的插入和嵌入图像 (即随页面装载时才装载的图像)和
被链接的图像来说,它们几乎都得用别的技巧才能实现这种搜
索机制。
1.基于文字的搜素方式
这种方法可以看作文本搜索的延伸应用。对于图像文件 .
根据其内容.手工将其标注为一系列关键字 (或者取文件名为
关键字).并对关键字建立索引.这样.图像检索就转化为文本
检索的问题。
这种查找方法首先确定图像文件。它通过IMG SRC和HREF
两个HTML标签检测是否存在可以显示的图像文件。IMG SRC表
示 ”显示下面的图像文件”.而HREF标签则表示 ”下面是一个链
接”,这两种标签经常导向一个图像文件。搜索引擎通过检查文
件扩展名来确定链路所连接的是否是图像文件。如果文件后缀
是GIF、JPG或者PNG,那么它就是一个可显示的图像。
确定图像文件的内容,是通过读文件名,文件名使用的路
径,或者跟在 IMG SRC标签后的ALT标签,这样逐步引向要
搜索的文件。这种搜索方法需人工辅助,并且需要一定的规范
和标准.其效果取决于文件名和路径名描述的精确度。由于命
名方式多种多样 ,只靠文字方式搜索效果并不理想。一是必须
由人工完整地标注所有图像 ,对于小图像集合也许 问题不大.
但随着图像数 目的增加 ,特别是网络上的图像是无穷无尽的,
这种方法显然不可行:第二个问题在于图像所包含的信息量庞
大,不同用户对于同一张图像的看法不尽相同,这就导致对图
像的标注没有一个统一标准,检索出的结果不能很好符合用户
的需求。基于此,人们提出了基于图像 自身内容的搜索。
2、基于内窖的搜素方式
通常,可以抽取图像库中所有文件的特征 ,用户检索的过
程一般是提供一个样例图像,系统抽取该样例图像的特征,如
回
维普资讯
蠢 搜囊
颜色、纹理、形状等 ,然后同数据库中所有的特征进行比较 ,并
将与样例特征相似的图像返回给用户 ,这个过程称之为基于样
例的图像检索。例如分析一张夕阳的图片后得到的颜色分布可
以用以搜索到其它相似颜色分布的夕阳图片;纹理是指局部不
规则而整体有规律的特性.主要包括粗糙性、方向性和对比度;
形状特征是图像的一个显著特征 .很多搜索可能并不针对图像
的颜色,因为同一物体可能有多种不同的颜色 ,但其形状或轮
廓是相似的。如搜索苹果的图像 ,苹果可以是红的黄的绿的,但
形状都是苹果的外形。
基于内容的搜索具有很强的交互性 ,即用户可以参与搜索
过程。如果检索的结果不能令人满意 ,用户可以告诉系统哪些
是符合用户需求的正反馈 图像 ,哪些是不符合的负反馈图像 。
系统根据用户提交的信息 ,对内部搜索参数进行调整,从而优
化搜索结果并提供给用户新的搜索结果。
3、人工找圈并对图 进行分类
图像搜索引擎也有一个分类目录 ,提供某一方面或某一范
围内的图像信息。通常是由专业人员上网搜索图像 ,并对机器
人(robot)或网络蜘蛛(spider)自动搜集到的图像进行人工鉴别和
分类。这种方法可以产生出准确的查询系统 .但是劳动强度大 .
限制了可以处理的图像数量。如何解决上述问题7相关反馈和
Ditto:http://www.ditto.tom
Google:http://images.google.com:
Picsearch:http.//www.picsearch.com:
Tiscali:http://search.tiscali.it/images:
(以上是基于网页的图像搜索)
Gograph:http.//www.gograph.com :
Webshots:http://webshots.com;
Corbis:http://www.corbis.com:
Yahoo:http://gallery.yahoo.com (使用的是Corbis图库):
Gettylmages:http://WWW.gettyimages.com
(以上是基于图库的图像搜索)
M amma:
http://WWW.mamma.com/mammapower.html?qtype=48:
Ixquick:http://www.ixquick.com:
(以上是图像元搜索引擎)
四 如何使用图像搜索引擎
1.分类目录搜索
如果希望了解某一方面或某一范围内的信息.并不严格地
局限于某个关键词 .可以使用分类目录搜索。分类目录搜索的
结果比较精确。
新浪 http://pic。sina.com。ca(eefind图片搜寻 引擎
图像词典:http://cn.gograph。com;
木子网:http://gallery.muzi.com/index2.shtml;
Fotoe无限图像网:httl:l".//WWW.fotoe.com;
tom图像搜索:http://l:licsearch.tom.com:
美亚图库 :http://photo.cnmaya.com
2.英文图 搜索引擎
All The Web(Fast).
http://www.alltheweb。com/advanced?c=im~
2)准确的关键词:搜索引擎要求关键词准确无误,一字不
差。所以,如果找不到想要的图片 ,或者对搜索结果不满意,很
可能是关键词输入有误。比如.输入 ”舒琪 和 舒淇”.得到
的搜索结果是不同的。检查输入的文字是否错误,或者选用意
思相近的词 ,也可以到分类 目录中去查找。
3)逻辑查询:使用空格、+来限制搜索范围,指定搜索结果
要同时满足这多个关键词 (几种形式的搜索结果是相同的)。例
如:输入 ”流氓兔+壁纸”,搜索结果是有关流氓兔的壁纸;输
入 ”流氓兔+玩具 ”,搜索结果是流氓兔的玩具;使用 ”一 来排
团
维普资讯
除无关资料,缩小搜索范围。例如:输入 “黄蓉-周迅”,会找
到除周迅外其他人扮演的黄蓉的图片。
4)热门搜素:搜索引擎统计用户搜索图像的关键字,列出
最近最热门的搜索关键字。
5)在结果中查询:在输入关键词搜索后,可以使用在结果
中查询功能.进一步缩小查询的范围,使搜索的结果更精确。例
如 :输入 “电影”关键词,检索出所有关于电影的图片,这时
想要在当前的搜索结果中查询有关美国的电影图片,这时只需
输入 ”美国”然后选择页面上的 ”在结果中查询”,这样就会得
到在 ”电影”这个范围中有关 ”美国电影”的查询结果。
6)t新查询:使用一个关键词进行搜索后,如果想放弃当
前结果,重新查询.可以单击 ”重新查询”按钮。
五 圈像检索的应用
图像检索将更多走进我们的生活。现在的报纸.杂志、甚
至我们日常做的报表 、幻灯片中经常会用到各种各样的小图片 .
不但美观 ,还可以方便他人理解。比如要做一个关于长城的报
告,想在报告里加入一些长城的图片,而手头又没有这些图片,
这时你就可以找图像搜索引擎帮忙了。
随着数码相机的普及和扫描仪进入家庭 ,越来越多的家庭
将家庭相册存入了计算机,一方面可以方便地进行各种特殊图
像处理.还有一个很大的好处就是方便检索,你可能经常为找
到一张想要的照片在一大堆相册里翻来翻去,特别是年代久的
相片,更是很难找到。如果家庭的所有相片都存在计算机中.我
们就可以方便地用图像检索的工具简单输入一些诸如人名、时
间或地点信息,很快就能找到你想要的那些相片了。
随着现代影像和图像处理技术的深入发展 ,可供医学lI缶床、
教学和研究使用的医学图像数量以指数速度增长。用户如何能
方便地找到所需要的图像7这就需要创建可供检索的图像数据
库,它应该具有检索的实施性。现代化医院信息系统发展迅速,
电子病历将成为不可缺少的组成部分。据预测.五年内,美国
将有一半以上的医院配备电子病历系统,同时将配有高级图像
检索数据库 。它可以按 日期、特征、疾病、症状、解剖部位 图
像类型、医疗仪器等属性进行布尔检索(基于是非判断的检索)。
基于Internet的全球虚拟病历系统已经在开发之中。这个项目完
成以后 ,到地球上任何地方旅行的人发病时可以通过Internet调
出他们自己的病历。
其实图像检索已经运用在很多领域,例如公安的罪犯数据、
医学研究机构的病理图像资料管理,气象局的卫星照片管理等
等方面,随着各行各业信息化水平的逐步提高,图像检索技术
的日趋成熟,将来会有更多的运用 ,给我们的工作和生活带来
更多的方便和快乐。
回
维普资讯