语义Web及其应用 语义Web及其应用

语义Web及其应用

  • 期刊名字:微计算机应用
  • 文件大小:370kb
  • 论文作者:
  • 作者单位:
  • 更新时间:2020-06-12
  • 下载次数:
论文简介

第26卷第5期VoL 26 No 52005年9月MICROCOMPUIER APPLICATIONSpt2005语义Web及其应用*沈海波12洪帆1(1华中科技大学计算机学院武汉430074;2湖北教育学院计算机科学系武汉430205)摘要:语言文Web是下一代 Interuet的发展方向。语义Web的定义、分层结构进行了概述,详细总结和研究了语义Web在Web服务、P2P网络、知识管理、E- learning、智能信息检索和语义Web挖摑、网格计算等多个领域的应关键词:语义Web本体元數据应用Semantic Web and Its ApplicationsSHEN Haibo.2, HONG Fan'( School of Computer, Huazhong University of Science and Technology, Wuhan, 430074, China2Department of Computer Science, Hubei College of Education, Wuhan, 430205, China)Abstract, Semantic Web is the development direction of the next generation Internet. the definition and layeredstructure of the Semantic Web were outlined, and its applications in some areas, such as Web services, P2P network,knowledge management, E-learning, intelligent information searching and Semantic Web mining, grid computing andso on, were summarized and researched in detaiL语义web追求的目标是让Web上的信息能够被机器理表示,以满足分布式主流计算环境语义互操作的需要使软件解,从而实现Web信息的自动处理,以适应Web信息资源的 Agent对www上异构和分布信息进行智能的有效的访问快速增长,更好地为人类服务。近年来,无论在国际上,还是和检索。在国内,人们对语义Web及其关键技术和应用的研究正在如根据W3C,语义Web研究的主要目的就是扩展当前的火如茶语义Wb的支撑软件与应用开发日益受到重视语Www使得网络中所有信息都具有语义,计算机能够理解和义Web可以看作是新一代的信息基础设施被人们称为第三处理便于人和计算机之间的交互与合作。因而其研究的侧代智能网络重点就是如何把信息表示为计算机能够理解和处理的形式,即带有语义,以支持网络环境下广泛有效的自动推理1语义Web概述1.2语义web的分层模型1.1语义web的定义为了实现语义Web信息服务的智能化与自动化的目标,www的发明者 Tim berners-Le早在1999年就提出语义web研究者们开发了许多新技术并提出了一系列的技了语义Web( Semantic Web)的概念。他所领导的非赢利性术标准。 Tim Berners-Le提出了XML2000语义Web模组织WC于2000年创建了www.SemanticWeb.org网站,型,它是一种分层结构的模型如图1所示并在2001年正式提出语义Web。所谓“语义”就是文本的含(1) Unicode和URI层。是语义Web的最底层。Uni义。语义Wb就是能够根据语义进行判断的网络。因此简code可以保证我们使用国际化、通用化的字符集避免不同类单地说语义Web是一种能理解人类语言的智能网络,它不型字符集之间由于编码不同而造成的存储、传递和使用上的但能够理解人类的语言,而且还可以使人与电脑之间的交流混乱,同时也可以实现多国语言的混合存储和使用。变得像人与人之间交流一样轻松。语义Web是下一代互联中国煤化工的事物—无论是网络网的发展方向,其实质就是增强网络资源内容和功能的语义中的中的某个人、一座房子、CNMHG本文于2004-08-27收到湖北省自然科学基金项目资助(2004ABA055)5期沈海波等:语义Web及其应用别和组织起来同时也通过属性将概念相互联系起来从而建Rules立起概念的语义空间,亦即对某一个领域内事物的共同理解。ProofDa这些概念和属性的名字(即标识构成了 Ontology的词汇表在语义Web的交流/通信中, Ontology担当着语义沟通的重Ontology vocabulary要角色,是其实现的关键技术之一。 Ontology需要用 AntolRDF+rdfscemagy语言描述和建构。常用的 Ontology描述语言有DAMLXML+NS+xmlschemaS、OWL-S等。Unicode(5) Ontology的顶层: Logic、 Proof和 Trust,这三层位于语义Web体系结构的顶部,也是语义表达的高级要求,目图1XML2000语义Web体系结构前正处于研究阶段,也有一些简单的示范性应用系统正在建设中。其中,逻辑层( Logic)提供了推理规则的描述手段,论一张桌子等都可以称为资源。每一个资源都由惟一的URI证层(Poo通过运用这些规则进行逻辑推理和求证,而信任所标识不同的资源拥有不同的URI,通过指定的URI可以层(Trus则负责为应用程序提供一种机制以决定是否信任确定互联网中惟一的资源(即定位的惟一性)。给出的论证2)XML+NS+ XML Schema层。是语义Web中首要(6)数字签名( Digital Signature)。数字签名位于层次模的关键技术也是整个体系结构的基础。ⅪML是一种允许自型的右侧,并贯穿于中间的四层。数字签名是一种基于互联定义标记的通用、结构化描述语言网的安全认证机制。当信息内容从一个层次传递到另一个层命名空间NS为XML文档中的结构化标记提供了上下次时,允许使用数字签名说明内容的来源和安全性,这样接受文环境,一方面为文档中的每一个标记都赋予了确定的含义,方就可通过数字签名鉴别其来源和安全性以决定是否接受。另一方面将不同上下文环境中相同名称的标记区分开来从数字签名保证了交换的信息内容的正确性而避免了语义上的歧义。1.3语义Web的优点XML Schema在标记的使用和文档结构上,为XML文语义Web最大的好处是可让计算机具有对网络空间所档提供了明确的语义限制最终确保每一个XML文档都是储存的数据进行智能评估的能力。这样计算机就可以像人语义合法、结构完整、内容有效的。脑一样“理解”信息的含义,完成“智能代理”的功能。使用语(3)RDF/ RDF Schem层。RDF定义了一种用以描述资义Web搜索引擎搜索的结果比WwW更为精确。源及相互关系的简单模型,是语义Web实现的关键技术之语义Web提供了一种崭新的信息描述和知识表达的手一,也是语义信息描述的有效手段。其基本数据模型包含三段,而要在语义层次上实现信息的互操作就需要对信息涵义类对象:资源属性和陈述;资源之间的关系通过属性和值来的理解达成一致。语义Web采用了本体( ontology)的思想描述。描述特定资源特定属性的值就构成RDF中的一个陈本体描述的是具有共识的概念化的事物它对实现语义层次述,通常可用三元式< subject, predicate, object>描述;其上的知识共享知识重用有着巨大的优势。中,被描述的资源称 subject,描述资源的属性称 predicate,object则是属性对应的值。RDF建立在XML和UR的基础2语义Web的应用上。在信息中加入语义,使得在Web世界中流动的不再是单RDF通过属性和值描述了资源及资源之间的关系,但并纯的数据流而是机器可理解的语义信息。利用这些语义,信没有提供描述这些属性及属性间关系的机制。 RDF Schema息之间的交换就可以建立在语义的层面而非文字的层面,从提供了这种表达机制,它描述了 RDF properties的使用规则,而可以使机器精确地理解、采集和组合信息,同时提供包含数为RDF定义了领域字典,并用类型层次结构来组织该字典,字图书馆、电子商务、医疗保健等各种类型的自动化服务。从而构成完备的语义空间(1)Web服务。Web服务是一种开发的规范,通过网(4) Ontology层。语义信息的交流必须以共同的理解为络可以对基于规范开发的各种应用进行调用、整合,从而在互前提否则双方就会发生误解或不理解。在语义Web中,这联网上成哪复产的仟各Wh服条是一种崭新的分布式“共同的理解”,即共同的语义空间,是由 Ontology建立和计算模中国煤化工有效机制,已成为电提供的子商务CNMHG型框架、高效的执行Ontology是一种用以描述语义的概念化的显式说明。方式、与其他成熟技术有机结合的能力及服务的集成是解决它通过定义属性并建立一个分类层次结构将不同的概念区现实应用问题的重要技术。当前Web正在从一个文本、图588微计算机应用2005年片、音频视频的信息提供者向服务的提供者转变这种转变上,这些 ontologies由不同的个人部门或组织创建。为了能体现了“网络就是计算机,软件就是服务”的思想为不同的个人或组织提取共享的 ontologies,“即时语义”考虑但是,目前的web服务仅对它们的功能提供了语法层的了 ontology定义、概念的使用、与实际数据的关系之间的重描述基本上还是采用标准化分类的方式来描述服务的功能、叠。智能代理将使用这样的定义来确保知识被适当地构造,提供者及如何访问服务并与之交互,缺乏机器可理解的语义,以便它能被容易地重用。对服务的描述能力非常有限而且缺乏灵活性,故在开发的异(4) E-learning。 E-learning主要是指通过 nternet进行构系统中对服务的自动发现和组合还需人类的干预这妨的学习与教学活动它充分利用现代信息技术所提供的、具有碍了Web服务在复杂商业环境中的应用。为了实现智能化全新沟通机制与丰富资源的学习环境,实现一种全新的学习的web服务,需要将语义Web与Web服务结合起来。将本方式这种学习方式将改变传统教学中教师的作用和师生之体的概念和相应技术引入Web服务技术中,可从根本上解决间的关系,从而根本改变教学结构和教学本质, E-learning具以上问题。在语义Web研究中提出的基于本体的一些服务有分布式、面向学生、个性化、非线性或动态性减少学习费用描述语言,如DAML-SOwL-S等,为语义Web与Web服等许多优点已成为一种流行的学习形式。务的结合提供了基础。由语义Web与Web服务结合而产生在目前的 E-learning中,主要采用教育Web资源交换的的语义Web服务必将成为一个重要的应用方向。元数据( metadata)方案,如 IEEE LOM、 ARIADNE、IMs等。增进资源共享是语义web的目标,在语义网中,计算机但这些元数据标准缺乏精确的机器能理解的语义,不能描述会根据关键名称定义的超链接和逻辑推理规则发现语义数据学习对象的内容。必须引进语义Web技术采用基于 antol的含义。其最终结果就是能够刺激开发自动化的网络服务。gy的元数据标准来描述学习材料的内容、文本和结构。这毫无疑问语义Wb将会推动Web服务的深化。实际上基样学习材料就变成了机器可以识别理解并自动处理和使用于Wb服务的应用正是互联网中最重要的资源Web服务与的数据有利于互相理解和共享从而达到教育的“共享知识”语义web的融合是可能而且肯定的。但是,在将本体的概念的目标。和技术应用于Web服务中,还需要全面研究建立基于本体的(5)智能信息检索和语义Web挖掘。面对Www上的web服务描述服务组装与分解、基于本体的服务发现和服大量信息,如何进行智能信息检索一直是信息工作者研究的务管理等问题重要课题。现在所使用的万维网的功能并不尽如人意,如(2)数据交换与知识管理。有效的知识管理印是维持企HTML网页单调枯燥网页仅仅是一个单调的内容显示,电业组织竟争力的关键因素,企业间的数据交换和知识管理一脑只负责将一个网页链接到另一个网页,网络不能按照用户直是基于Web的电子商务和ERP系统的重要组成部分,目的要求自动搜寻和检索网页直至找到所需要的内容等。现前的应用项目围绕着企业Wweb知识管理而展开,而这些的基有互联网技术的核心是超文本系统它的主要思想是通过统础就是假设:企业提供的web信息结构能够转化为一个巨大资源标识符(URI: Uniform Resource Identifier,对互联网上的知识库。知识管理的发展为更多的面向文件的观点转化为的信息进行标记,使人们可迅速地对互联网上的信息资源进更多的面向知识项目的观点铺平了道路。这种转化的重要基行定位。然而,现有互联网技术并没有对信息的含义进行描础就是利用基于本体( ontology)的元数据( metadata),来对企述计算机在处理信息时只是按照URI定位信息,但对信息业发布的信息或企业的内部文档进行注释。围绕这一假设,的内容并不关心。而人们真正关心的是信息的内容,也就是需要开发一系列相关的技术和工具,如企业知识的建模和注互联网上的文本图片等资源所包含的意义(语义)。由于现释工具、 ontology的提取和推理工具等有互联网技术的局限,互联网上信息处理的自动化、智能化程(3)P2P网络。P2P-( Peer to peer)网络可被看作是度很低,计算机处理器强大的功能也没有得到有效的利用。分布式存储器( repository)。P2P让人们通过互联网进行直要实现信息检索的自动化和智能化关键是要研究如何从接交互。P2P技术的一个优势,是能够开发出强大的搜索工HTML页面中提取语义信息,构建出能够描述这些页面的具。借助它用户能够深度搜索文档而且这种搜索无需通过 Ontology,建立相应的 Ontology学习系统,实现 Ontology的Web服务器,也可以不受信息文档格式和宿主设备的限制,自动或半自动提取。不仅对文本信息,可采用语义Web的技可达到传统目录式搜索引擎无可比拟的深度术加强智能检索,而且还可对多媒体信息,结合模式识别和对PP与语义W技术的结合可支持分散的异构的环境,象提V中国煤化工些都正在研究和发展可用较小的努力来分享知识知识分享和发现比较容易。它CNMHG技术和Web结合起来们能否结合成功的关键在于“即时语义( Emergent Seman从wb文档和web活动中抽取感兴趣的潜在的有用模式tics)”的使用。“即时语义”建立在轻载的或重载的 ontologies和隐藏信息的技术。利用Web挖掘技术,可以在文档的自动5期沈海波等:语义Web及其应用分类、自动文摘的形成、检索结果的联机聚类、查询结果的相子商务系统的重要因素。而这种开放性和灵活性的取得可通关度排序方面发挥作用提高搜索引擎获取信息的准确性,并过本体( ontology)技术得到解决。比如建立基于本体的产品可以对用户搜索结果进行相关处理,实现查全率和查准率的描述、分类体系,及对商务处理过程的结构化、标准化及个性有机结合,还会对形成智能搜索引擎提供很大的帮助。语义化的处理已经成目前电子商务领域的研究热点。web挖掘2的目的在于将语义Web与Web挖掘结合起来通过利用新的语义结构来改进Web挖掘的结果。语义Web3结束语的出现和发展,为丰富Web挖掘提供了好的基础:页面的链语义Web的快速发展,引出了许多研究挑战这些挑战接类型被明确地描述,使得知识工程师对Web结构挖掘获得必须用跨学科的方式加以解决。同时,它为以语义为基础的更深的了解;页面的内容增添了正式的语义,使得知识工程师新型应用提供了平台。本文只是简述了语义Web在Web服可使用需要更有结构的输入的挖掘技术。另一方面Web挖务、P2P网络、知识管理、E- learning、智能信息检索和语义掘可帮助建立语义Web,它可帮助从Web为知识组织学习结Web挖掘、网格计算和电子商务等方面的应用包括如何应构(如知识本体 ontologies),并促进这些知识结构的发展。用等许多方面及新的应用还待进一步研究(6)网格与网格计算。网格(grid)6是一种集成的资源参考资料和服务的环境,包括计算能力数据信息和知识、软件、人等各1T. Berners-Le,J. Hander,O. Lassila, The Semantic种相关的资源和服务。网格的目的是利用 Internet把不同地Web. Scientific American, May, 2001.理位置的计箅机组织成一台“虚拟的超级计算机”,实现计算2 R Studer, R. Volz,G. Stumme et al. Semantic Web-资源、存储资源、信息资源软件资源、通信资源、知识资源、专 State of the Art and Future directions. Kunstliche Intelli家资源等的全面共享。网格计算就是网格的问题求解,①充genz 3(special Issue on the Semantic Web), 2003,59分利用分布在网络上的IT设备使IT设施及其所具有的计3岳昆,王晓玲,周傲英.Web服务核心支撑技术:研究综算、存储和软件等资源能够按需应变,随需所用;②解决异构述软件学报,2004,15(3):428~442系统之间的集成问题。网格计算的基础是基于XML的消息4 D. Fense,C. Bussler,v. Karteva et al. Semantic Web传递它用XML格式包装各种数据,消息在各个系统之间进Application Areas. In Proceedings of the 7th International行信息交换。Workshop on Applications of Natural Language to Infor尽管XML为网上数据提供一个好用的语法描述,使用mation Systems, Stockholm, Sweden. June 2002.MML可以在计算机之间方便的解析各种类型的数据。但是,5 L Stojanovic, S Staab, R Studer. eLearning based on theXML并没有对数据本身做出解释。换句话说,XML并没有Semantic Web. In Proceedings of the World Conference on指明数据的用途和语义,所以凡是使用XML表达的内部数the www and Internet WebNet2001, Orlando, Florida据用于交换时,必须在使用前定义它的词汇表、用途和语义。USA,2001.为此,w3C推荐了以资源描述框架(RDF: resource De6 C Goble,D.D. Roure. The grid: An Application of thescription Framework)解决XML的语义局限。但是基于RDFSemantic Web. ACM SIGMOD Record Volume 31, Issue的数据语义描述仍然可能存在语义冲突。为了消解语义冲4( December2002),65~70突,必须在描述数据语义的时候可以通过引用 Ontology的相作者简介关技术,如采用本体论语言(OWL)来描述资源,对语义描述沈海波,男,(1963-),副教授,博士生,主要研究方向:访结果作进一步的约束。总之,要实现网格和网格计算的目标,问控制、网络安全和知识产权保护。在现有的基础上,必须引进语义Web技术洪帆,女,(1942-),教授,博士生导师,主要研究领域:密(7)电子商务。电子商务已经成为一种重要商业模式。码学,计算机安全与保密。开放和灵活的客户关系建立和管理及商业模式是实现有效电中国煤化工CNMHG

论文截图
版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。