一种面向语义关系挖掘的本体映射系统设计

2018年10月04日 04:08来源于:科技资讯

...台湾自己制作,面向台湾观众的电视剧,和我们日本没有关系,?-漫...

史敏军

摘 要:目前对本体语义关系挖掘映射系统都采用多种策略,这种方式对于权值的选取要较高,若权值选取不当,语义信息的利用就不够充分,得出的映射结果就会大相径庭。本文将主要针对语义挖掘的映射多策略及权值计算进行研究,设计一个本体映射原型系统,该系统将能实现本体映射语义关系挖掘的大部分功能,并得到语义映射的实验结果,最后,将得到的实验结果与先进的映射系统的结果进行相互比较,测试系统性能,从而验证本系统的有效性。

关键词:本体映射 權值 语义挖掘

中图分类号:TP39 文献标识码:A 文章编号:1672-3791(2017)11(b)-0031-02

目前本体语义关系挖掘映射系统都采用多种策略[1],其候选映射集的检索方法时间复杂度较高[2]而且得到的候选映射集容易得出错误结果,针对这些问题,本文设计了一种面向语义关系挖掘的本体映射系统,提出了一种全新的本体相关度候选映射集检索方法。该方法首先通过对本体概念间的名称相似度[3]进行比较,获得初始的候选映射集,再利用相关度对其拓展,得出优化的候选映射集。提出了改进了的映射关系挖掘算法,尤其采用权值策略的自适应计算,削弱排除干扰信息,突出价值较高的一个语义信息。

1 系统目标与模块设计

本文设计的系统称之为“S-Mapping”语义挖掘映射子系统,通过本系统要实现高效率的候选映射集检索,优化的候选映射集。本系统由以下几个模块组成。

(1)用户操作模块。

提供一种UI操作界面,可供用户进行界面操作,可以很方便的输入所需要进行验证的映射本体,并能对最终结果进行输出显示。

(2)本体解析模块。

该模块能对本体的各种特征进行提取解析,针对检验本体映射所需要的各种特征值进行预处理,对不同格式的本体做标准化操作,为本体相似度运算以及映射对的最终确定做好初期准备。

(3)本体语义间关系挖掘模块。

该模块是对标准化本体主要用于进行挖掘候选语义关系,通过语义的初步挖掘,缩小需要比对的样本范围,减轻下一步的运算复杂度,并提高最终映射结果的精准性。

(4)映射结果输出模块。

采用优化的自适应映射算法,将得出的结果进行界面可视化输出,为后续的查询和检索等提供参考服务。

(5)映射结果评价模块。

为了检验映射系统的性能,需要对映射结果进行评价,能自动输出评估的结果,根据这个评价结果,便于对系统进行改进。

2 系统实现

本系统选用Java作为编开发平台,Java的与平台无关性,便于系统的移植。系统还用了UML、Jena、Alignment等开发工具。系统采用了一种全新的本体相关度候选映射集检索方法,提出了改进了的映射关系挖掘算法,尤其采用权值策略的自适应计算,削弱排除干扰信息,突出价值较高的一个语义信息。

为了克服传统映射系统采用方法存在的缺点,本文结合本体的标题名称和自身结构等信息为参考要素,确定映射关系候选集合,从而准确而且全面的找出不同的本体中的语义概念本文认为,当两映射关系对的结构关系具有全相关性时,则可在映射关系候选集合中直接添加目标概念,这样与该概念相近的周围概念也将产生更大的加入映射候选集之中;当两映射关系对完全无不相关性时,则可以直接丢弃该概念;除此之外,需要注意的是,目标概念是必须遵循名称相似度和相关性衡量指标来加入映射关系候选集合的。

鉴于此,本文的核心思想是:对源本体和目标本体的概念进一系列预处理操作,如首字母缩写处理、分词操作、缩略语查找、排除同名异义以及词干的抽取等,对于源本体中的任一概念X,经过相似性比较操作,在目标本体中找出与源本体名称最相似的概念Y,然后以Y概念为锚点得到的初始候选概念映射集,然后再进行扩展,最终得到所需要的候选映射关系的集合。

本系统的关键程序代码如下:

public StructrueMatcher(OntClass cls1,OntClass cls2,ExtendedVector structureMatchingResult(){

srccls=csl1;

tarcls=cls2;

this.structureMatchingResult=structureMatchingResult;

}

public boolean hasSameSuperClass(){

boolean flag=false;

OntClass[] spc1=superClassSet(srccls);

OntClass[] spc2=superClassSet(tarcls);

Outer;

for(int i=0;i<3;i++)

for(int j=0;j<3;j++)

if(spc1[i]!=null&&spc2[j]!=null){

MactchingUnitmu=new MatchingUnit(spc1[i].toString(),spc2[j].toString(),true);

if(structureMatchingResult.contains(mu))

flag=true;

break Outer;

}

}

}

return flag;

3 系统性能评估实验

本系统的实验以OAEI提供的标准测试数据集进行实验[4],与2007年参加OM国际本体映射测试比赛的系统[5]在查全和查准方面进行比较。

从实验结果表1分析可以看出,本系统进行语义搜索耗费的时间要优于传统方法,系统性能较传统方法有了一定的提升。系统参数均衡,在有些地方仍有提升的空间,如: 选映射集数目稍低,某些本体信息的处理结果还不够理想等。

4 结语

本文针对语义挖掘的映射多策略及权值计算进行研究,设计一个本体映射原型系统,优化改进了本体映射策略,虽然部分处理的结果还不够理想,还有提升的空间,但这对于今后开展的本体重用和集成等相关研究提供了基础,同时也为不同本体概念间的查询提供了技术支持。

参考文献

[1] 王家琴,李仁发,李仲生,等.一种基于本体的概念语义相似度方法的研究[J].计算机工程,2007,11(33):201-203.

[2] 张芷维.基于语义的本体映射策略以其结合方式[D].中南大学,2008.

[3] 唐杰,梁邦勇,李涓子,等.语义Web中的本体自动映射. 计算机学报,2006,11(29):1956-1976.

[4] Jayant Madhavan Alon Y. Halevy. Composing mappings among data sources[J]. VLDB 2003: Proceedings of 29th International Conference on VeryLarge Data Bases, Los Altos, USA, 2003:572-583.

[5] 潘有能,刘朝霞.本体映射技术在关联数据中的应用研究[J].情报科学,2015,33(1):54-56,62.endprint

 
免责声明:

     本文仅代表作者/企业观点,与【名品家电网】无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,仅供读者参考,并自行核实相关内容。

     【名品家电网】刊载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

      如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行;新闻纠错: lwl#youngchina.cn

关键词: 文章 本体 语义