PIDALION:基于Java的实现问题多媒体搜索引擎外文翻译资料

 2022-11-26 08:11

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


PIDALION:基于Java的实现问题多媒体搜索引擎
Dimitris E. Charilas,Ourania I. Markaki
雅典国立技术大学电气与计算机工程系,
Heroon Polytechneiou 9,Athens,15773,Greece
电话:( 30)210-772 2078电子邮件:omarkaki@gmail.com
关键词:多媒体内容,查询,基于内容的检索,多媒体检索器,元数据,图像直方图,
分层呈现

摘要 - 受宽带快速扩张的推动连接性和对网络多媒体的兴趣日益增加应用,数字多媒体内容的成长已经有了暴涨。其中,这种增长是复杂的需要更有效的搜索多媒体方法信息。自动化的网页搜索引擎目前使用的仅依赖于文本描述,结果提供多媒体内容的质量较差的比赛。

因此,多媒体搜索引擎的服务是一个互联网用户仍然缺乏的可能性。因此,范围本文将介一种实现方法个性化的基于Web的多媒体搜索引擎在Java中编程语言这种方法结合了当前搜索引擎的特点以及新的创新功能同时保证系统的快速响应和更好的搜索结果。在本文中读者可以找到所有的分析性介绍组成多媒体搜索引擎所需的组件,如以及如何实现关键算法的指示

功能介绍

网络为信息检索创造了新的挑战。网络上的信息量正在迅速增长在这个艺术中没有经验的新用户的数量也是如此网络研究。估计有1-2个Exa-Bytes(百万)Tera-Bytes)每年都会创建新的信息网络。预计这么大量的信息在接下来的两年中增长10倍。

依赖关键字匹配的自动搜索引擎通常返回太多低质量的比赛。情况就多媒体内容而言更糟糕。最多流行的搜索引擎,Google [1]只依赖于关键字搜索图像,不包含任何信息语义内容。基于内容的图像检索系统(CBIR)试图解决这个问题。许多CBIR系统都有最近在文献中提出和实施。例子包括QBIC系统[2],其中颜色信息被利用,PicToSeek系统[3],其中组合颜形状不变特征来执行图像检索和Virage [4],允许用户手动调节提取的重要性描述符根据自己的看法。模糊描述符的组织在[5]中提出提高某个召回值的检索精度,而[6]中讨论了3D搜索的应用基于内容的检索系统在[7]中进行了检查[8]提出了一种关于音乐访问的系统。

在提出的工作中检查个性化检索[9]。最后但并非最不重要的是,Marvel最新更聪明基于内容的搜索引擎,由IBM研究开发中心,2004年[10],试图增加检索通过引入语义注释来提高精度媒体卷。但是,所有采用的方法只能对系统的数据库进行静态和本地访问因此无法从网络中检索内容[11]。此外,上述作品着重于用于高效的基于内容的检索的算法,而不是于实施一个大的实际问题通过网络进行大规模多媒体搜索引擎。至今,制作分布式的几种不同技术已经提出可搜索的多媒体内容。在[12]有关于检查技术的信息传出链接,分析引用页面,挖掘媒体文件中的文本信息并利用元数据使用都柏林核心元数据模型或MPEG-7标准。

本文重点介绍多媒体搜索

引擎,结合了现有搜索引擎的功能并通过创新增强其功能算法和机制。我们的目标不仅仅是描述系统的架构和互联性,也是解释如何在Java中实现算法码。提出的系统,名为PIDALION,运行Windows环境,而JavaServer Pages(JSP)并采用Java Servlet技术来确保系统的互操作性和动态行为。该系统的数据库在SQL Server 2000上运行。其中一个关键提出的搜索引擎的功能是提供完全个性化检索服务:PIDALION的用户可以与所有网络用户或者共享他们的个人内容在团体框架内,以及维护个人个人资料,他们的喜好被存储在哪里。个性化

978-1-4244-4530-1 / 09 / $ 25.00copy;2009 IEEE

可以通过创建社会来实现检索群体和使用动态相关性反馈机制,将系统的性能定制到当前用户的偏好。本文组织如下:第2节介绍系统的架构,简要解释每个人的角色主要成分。第3至7节提供了功能,建筑和关键特征 - 各自的创新零件。关键算法以形式描述伪代码。最后,在第8节中所涉及的问题总结了论文,提出了未来的扩张。本文介绍的平台包括以下子系统:

bull;多媒体爬行子系统,其作用是索引多媒体内容并处理更新索引过程

bull;多媒体元数据子系统,提取根据多媒体内容的元数据以这种方式实现的MPEG-7描述符互通性

bull;检索和显示子系统,即负责扫描多媒体数据库匹配特定标准的内容并转发它到接口子系统。

bull;接口子系统,实现交互以及用户和系统之间的通信,提供检索内容的功能投影并允许组合复杂的查询

bull;多媒体数据库子系统,涵盖了存储大量元数据的必要性缩略图,以及用户个人资料和偏好设置。

上述子系统的交互方式相互配合如图1所示。多媒体克隆子系统所涉及的子系统负责定位和索引多媒体内容。的架构分析多媒体爬行子系统需要解决的问题检测新的网页并存储相关的

系统数据库中的信息。在Google [15],网页爬行由几个分布式爬虫执行。一个URL服务器发送到要抓取的URL的搜索器列表。获取的网页随后发送到存储服务器,将其压缩并存到其中存储库[13]。在PIDALION的框架下,多媒体爬行是通过传输的Java套接字实现的网页和多媒体内容。的建筑和多媒体爬行子系统的功能是如图2所示。如所观察,两种不同的应用方案是可能的:从Web服务器进行内容索引以及家庭个人电脑的内容索引。来自网络内容索引服务涉及多媒体在线分发和可用的信息在整个互联网。根据架构建议,一旦检测的网页并注册它是由多媒体爬行子系统访问和取得那里的内容。执行的任务

一旦新的多媒体内容一直是系统的守护进程位置更详细地扫描了所有相关的记录在数据库中,定义在后者中以前没有访问过,通过插座提取后者的必要内容和存储在数据库中的适当形式。描述该过程通过以下代码中的伪代码。搜索数据库中未检查的位置虽然(找不到位置){打开Java Socket并下载网页解析网页:

- 列出图片链接

- 列出其他网页的链接列表

虽然(列表有更多的图像链接){打开Java Socket并下载图像处理(和存储)图像更新系统数据库}更新数据库(设置网页被检查)将网页链接添加到数据库作为未选中的位置}

3.2家庭电脑的内容索引 - 社会群体脚本在这种情况下,多媒体内容根本不在线次,但位于用户的个人电脑中。这种索引方法在社交方面真的很方便组成一个有趣的Web应用程序允许用户在朋友之间共享多媒体内容共同感兴趣的群体内容索引是在这种情况下通过使用Java来完成应用程序,使家庭用户可以扫描目录他们的个人电脑并将其个人多媒体内容上传到系统服务器一旦用户下载并运行应用程序,他被提示指定远程目录要索引的多媒体内容在哪里。后者然后自动定位,发送到系统服务器,处理和存储。个性化多媒体索引是为此目的创建多媒体元数据子系统这个子系统的功能主要涉及到从多媒体内容中提取元数据网络或用户。多媒体元数据提取每次新的多媒体内容都会激活模块鉴定。其次,这个过程每次都发生一次用户通过示例执行查询。多媒体元数据是编码相对于MPEG-7标准来确保不同类型的分布式内容之间的互操作性。

4.1元数据提取至于图像处理和视觉描述符最初提出了一个新的Image对象创建。通过创建PixelGrabber获取像素对象和调用grabPixels()方法,其中也提供图像的宽度和高度。一旦已经获取像素,应用掩模以隔离,G和B值。每个像素共有8个字节终于收到了。之后,RGB的RGB值提取的像素被转换为HSV值构建图像直方图。自满了要求独立性的图像大小,直方图值被归一化,与总数分开的原始图像中的像素。这个任务与搜索引擎的利用有关由互联网用户提供元数据后者通过多媒体内容提交系统在构成查询框架内的界面。当然,在这种情况下,不需要元数据存储,但只是被转发到检索和显示将执行搜索的子系统。

4.3索引过程在图像的情况下,提取两种数据存储:图像元数据和图像缩略图。的情况下首先提取视频文件,关键帧,使得能够重复元数据提取的过程因为每一帧,因此被视为一个独立形象。更具体地,视频处理器是激活分析视频内容并提取基于视频摘要的适当关键帧算法[14]。该算法的选择是由于事实上a)它是非常快(实时处理)和b)不需要事先知道关键帧的数量被提取(关键帧的数量是根据视频内容自动估算)。该视频处理器已经实现了(http://java.sun.com/products/java-media/jmf)Java Media框架(JMF)API。首先,创建媒体定位器以及作为播放器播放的处理器媒体。视频索引器访问单个视频使用插入的“传递”编解码器的帧数据流路径。当数据通过这个编解码器时,a为每帧视频数据调用回调。在此期间处理器的配置状态,两个编解码器,PreAccessCodec和PostAccessCodec,设置在视频轨道上。这些编解码器用于访问单个视频帧媒体文件。4.4元数据类型提出的搜索引擎采用颜色和纹理视觉描述符的MPEG-7标准。更多具体来说,就颜色信息而言,可扩展颜色描述符(SCD)和主色描述符(DCD),而纹理信息,均匀和非均匀纹理描述符被使用。其他类型的元数据,如文件类型,类别和文本信息用于进一步提高多媒体检索的精度。此外,系统使用元数据来维护社会团体和个性化指标。多媒体专题类别是在这个框架下手动确定的搜索引擎为了最小化错误的数量分类。提出了一种更复杂的方法在[15]中,语义表示形式不同用于创建分层组的抽象级别。MARVEL [11]也支持基于自动注释图案。

5.检索和显示子系统检索和显示子系统都负责访问数据库,执行复杂查询和选择与给定搜索最匹配的注册标准,以及组织和介绍检索结果。5.1检索功能一旦符合搜索条件的注册确定,检索和显示子系统绘制

相应的缩略图,组织他们的投影和将其呈现给用户。检索过程更多复杂,因此需要进一步分析,当用户提供了多个搜索条件。一种方法处理多个搜索条件将是检测满足每一个给定的注册组标准,然后找到他们的部分,从而检测满足所有标准的注册。这种方法构成尽管效率最低的策略,因为很多需要时间,因此系统的效率是明显减少所以,相反,多个搜索条件被纳入复杂的查询中,它们是按照层次结构组成的。这个结构范围从最容易检查的标准,和因此需要较少计算量的标准(底部)到最复杂和耗时(上)。如结果,找到纹理和颜色直方图标准在层次结构之上,因为每一个注册可能符合这些标准,系统必须检查每个组成的三个直方图向量十个值,共计三十个参数每次注册。几句话,这个检索方法可以拒绝尽可能多的注册使用易于检查的标准,使最复杂的标准剩下的是应用于有限一组注册。图3说明了层次结构的搜索条件。到目前为止,只有最简单的搜索方案,涉及到提交图像和搜索图像内容注册,已被分析。但是,PIDALION还提供搜索视频文件甚至可能的可能性提交视频作为检索图像的原型其他视频文件。所以在这一点上,很明显是有的最后四种可能的搜索模式:提交图像并搜索图像

2.提交图像并搜索视频

3.提交视频并搜索图像提交视频和搜索视频处理视频文件的查询更加复杂。当第四种情况发生时,视频文件由用户上传的是帧,每帧都是被视为一个独立的形象。视频的注册数据库中的文件终于被认为是匹配,只有在与原型相似的至少一帧遇到。情景2和3明显地来自于病例1和4的组合。5.2显示功能在启用非线性访问的框架中检索内容,以减少用户所需的访问时间,后者由8组组成,每组1组由一组特定的代数关系决定涉及主要颜色或直方图参考值。这些参考值是主要颜色或用户提交的文件的直方图值(在查询示例),或计算的平均值检索结果在简单查询的情况下。决赛检索内容的投影仅包括一个元素的每一个上述组。哪个是链接到其余的结果,形成层次结构结构,使用户能够浏览他的内容利益。检索内容的非线性投影构成最重要和创新之一PIDALION的功能,因为几乎所有的当前搜索引擎采用串行投影的替代方案。

界面子系统系统的界面是以这样的方式设计的允许在几种可能性之间轻松导航支持的服务,不需要用户应该具有特定的能力或知识。用户界面构成一个动态变化的环境和一个结果它已经使用JSP(Java Server)来实现Pages)和Java Servlet技术动态制作html页面,通过Java代码。其中,界面的主要功能子系统包括

a)多媒体内容声明

b)查询和结果检索的组合系统的界面与检索和交互显示子系统并显示检索结果按照投影方案后的群集提供。 PIDALION的另一个创新功能是评估检索结果的可能性。通过点击下面找到的相应复选框每个检索注册,用户可以提供给关于更多结果类型的系统反馈对他有吸引力或更感兴趣。c)浏览远程IP地址的多媒体内容该服务为用户提供了访问的能力多媒体内容位于远程IP地址。所以以便于浏览用户,多媒体内容提前以层次结构组织。

)用户的个人资料多媒体数据库子系统7.1数据库结构由于数据库与大多数子系统进行交互在存储和检索元数据方面起着重要的作用被分析为搜索引擎的单独组件。虽然存放空间用于保存统运行的必要信息是不可分割,为了简化假设的分析数据库分为以下一般部门,其中每一个都被命名为这里的数据类型包含

?多媒体内容位置:这个部门的存在被多媒体爬行子系统强加有用的是存储新的多媒体网站内容与提交给的数据一起位于系统从用户感兴趣。

?元数据:此部分包含所有提取的元数据从多媒体内容,是一个检索子系统是指检测目的一组与每个搜索条件匹配的注册用户引入查询的时间。

?缩略图:缩略图部分,其功能很明显,包含两个字段:缩略图的名字及其序列号。存储缩略图的注册这里被转发到检索和显示子系统只要这是必要的。

?用户个人资料:搜索引擎的每个用户可能有一个在这个部分注册数据库,让他的系统知道偏好,使得成为可能相关性反馈的观点。

?社会群体信息:为了保持隐形社会群体的内容给未经授权的用户,有关社会团体的相关信息存储在单独的数据库部门。该部门包含有关信息授权用户,索引和共享内容等。7.2实时响应索引组织而不是在提取颜色

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[26144],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。