专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN201510394706.5
申 请 日:20150708
申 请 人:哈尔滨工程大学船舶装备科技有限公司
申请人地址:150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学逸夫馆201室
公 开 日:20180123
公 开 号:CN104899340B
代 理 人:张耀华
代理机构:23201 哈尔滨市船大专利事务所
语 种:中文
摘 要:本发明属于交互式电子手册(IETM)技术和XML信息检索技术领域,具体涉及一种利用相似度计算对检索结果进行过滤的基于最紧致片段的IETM技术信息片段检索装置及其检索方法。基于最紧致片段的IETM技术信息片段检索装置,包括发布器、检索器和存储器三个部分:所述发布器通过特征提取模块提取数据模块的主干内容结构并编码;所述检索器通过关键词激励模块进行关键词的语义分析;存储器的主干信息集存贮结构存储符合GJB6600的模式约束特征、片段提取规则和主干信息的数据,以及各数据存放的结构描述。本发明利用片段发布器提取交互式电子手册的信息片段,并存贮起来供用户检索,能够有效缩短信息片段的检索时间,提升检索效率。
主 权 项:1.一种基于最紧致片段的IETM技术信息片段检索装置,包括发布器、检索器和存储器三个部分,其特征在于:所述发布器接收符合GJB6600的交互式电子技术手册,通过特征提取模块提取数据模块的主干内容结构并编码,然后存储在主干信息存贮模块中;所述检索器通过关键词激励模块进行关键词的语义分析,根据关键词进行信息片段的嗅探、提取,应用相似度过滤器对提取的各信息片段进行过滤,对技术信息片段进行检索;存储器的主干信息集存贮结构存储符合GJB6600的模式约束特征、片段提取规则和主干信息的数据,以及各数据存放的结构描述;所述发布器包括特征提取模块、编码模块和主干信息存储接口,其特征在于:所述的特征提取模块通过对GJB6600标准的分析,对段落、图形、表格、多媒体和警示信息的Schema进行简化,将无实际显示意义的子元素和属性以及有显示意义但不参与检索的元素和属性裁减掉,形成数据模块的特征规则,根据特征规则过滤选定装备IETM的各数据模块,只将特征规则中的各类Schema元素及其内容作为主干信息结构抽取出来,表示为XML结构树抽取数据模块的主干信息结构;所述的编码模块通过Dewey编码方式遵循宽度优先遍历的原则为主干信息结构中的各节点编码;将每1个主干信息结构形成1个Dewey码;编码中存储各节点所属层级、路径信息。
关 键 词:发布器 主干 存储器 电子手册 技术信息 片段检索 信息片段 检索器 检索 特征提取模块 相似度计算 存贮结构 激励模块 检索结果 检索效率 结构描述 模式约束 内容结构 片段提取 数据存放 提取数据 用户检索 语义分析 信息集 过滤 存储
IPC专利分类号:G06F17/30(20060101)
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...