专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN201410317211.8
申 请 日:20140704
申 请 人:重庆科技学院
申请人地址:401331 重庆市沙坪坝区大学城东路20号
公 开 日:20180327
公 开 号:CN104182454B
代 理 人:王玉芝
代理机构:50223 重庆蕴博君晟知识产权代理事务所(普通合伙)
语 种:中文
摘 要:本发明公开了一种基于领域本体构建的多源异构数据语义集成的模型及方法,多源异构数据语义集成模型包括:局部本体构建模块、领域本体合并模块和语义查询动态扩展及规约模块。多源异构数据语义集成的方法包括:通过本体合并技术构建领域本体,并建立数据源和局部本体、局部本体和领域本体的语义映射关系;结合社会标注及本体在知识表达上的互补优势,对用户的语义查询请求进行查询规约及扩展,生成规范的语义查询语句,对多个数据源分别进行查询,然后将查询结果去重和聚合优化,最终返回给用户。本发明通过领域本体的构建与映射、查询语义扩展及结果聚合优化,提供了一种基于领域本体构建的油气勘探异构数据语义集成模型及方法。
主 权 项:1.一种基于领域本体构建的多源异构数据语义集成的模型,其特征在于,该基于领域本体构建的多源异构数据语义集成模型包括:局部本体构建模块、本体合并模块和语义查询动态扩展及规约模块;局部本体构建模块,根据数据源特征,自适应地选择本体构建策略,从而构建出油气勘探局部本体;本体合并模块,与局部本体构建模块连接,采用将概念匹配和属性匹配相结合的本体合并方法,利用最大信息系数(MIC)方法计算概念语义相似度和概念属性的语义相似度,实现多个局部本体到领域本体的灵活合并;语义查询动态扩展及规约模块,与局部本体构建模块连接,用于查询请求动态扩展的有效性及结果的聚合优化;局部本体构建模块,根据数据源特征,通过自适应本体构建策略,进行局部本体的构建,具体包括:步骤一、基于非结构化数据源构建局部本体:首先,应用文本过滤器将不同的文件格式转成为纯文本文件格式,获得语料数据,并进行一致性检查;然后,采用逆向最大分类中文分词方法对这些语料进行初步的切分处理,得到字串集合;然后,利用最大信息系数(MIC)方法计算字串的内部结合强度,获取合成词集合,并判断合成词和非合成词的领域相关性,提取出概念集合;然后,应用图上随机游走算法推理合成词概念间的分类关系,采用基于隐Markov模型(HMM)的聚类算法提取非合成词概念间的分类关系;接着,运用基于关联规则挖掘的方法获取概念间的非分类关系;最后,应用本体构建工具输出OWL格式的局部本体;步骤二,基于结构化数据源构建局部本体:首先,利用R2O技术建立数据库模式和本体模型之间的语义映射关系,从而把关系数据库中的关系映射为本体中的概念,把属性对应地映射为OWL属性,并把数据库的关系表
关 键 词:领域本体 语义 多源异构数据 局部本体 语义查询 构建 集成模型 数据源 查询 聚合 规约 查询结果 动态扩展 构建模块 规约模块 合并模块 互补优势 技术构建 社会标注 异构数据 油气勘探 语义扩展 语义映射 知识表达 去重 映射 语句 优化 合并 返回
IPC专利分类号:G06F17/30(20060101)
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...