登录    注册    忘记密码

北京信息科技大学中文信息处理研究中心 收藏

导出分析报告

研究主题:搜索引擎日志    条件随机场    N    RSS    N+    

研究学科:自动化类    电子信息类    

被引量:462H指数:9WOS: 3 EI: 1 北大核心: 33 CSSCI: 14 CSCD: 20 RDFYBKZL: 2

-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
排序方式:

80 条 记 录,以下是 1-10

基于层叠隐马尔可夫模型的中文命名实体识别 ( EI收录)
1
《通信学报》中国科学院计算技术研究所;北京信息科技大学中文信息处理研究中心 俞鸿魁 张华平 刘群 吕学强 施水才  出版年:2006
国家重点基础研究发展计划("973"计划)基金资助项目(G1998030507-4;G1998030510);计算所领域前沿青年基金资助项目(20026180-23);国家自然科学基金资助项目(60272084);北京市教育委员会科技发展计划重点项目(KZ200310772013)~~
提出了一种基于层叠隐马尔可夫模型的中文命名实体一体化识别方法,旨在将人名识别、地名识别以及机构名识别等命名实体识别融合到一个相对统一的理论模型中。首先在词语粗切分的结果集上采用底层隐马尔可夫模型识别出普通无嵌套的人名、地...
关键词:命名实体识别 角色标注 ICTCLAS
一种改进的基于《知网》的词语语义相似度计算
2
《中文信息学报》北京信息科技大学中文信息处理研究中心 江敏 肖诗斌 王弘蔚 施水才  出版年:2008
国家863计划重点资助项目(2006AA010105);国家自然科学基金资助项目(60772081);北京市属市管高校人才强教计划项目(PXM2007_014224_044677,PXM2007_014224_044676);北京市教委科技发展计划项目(KM200710772010)
中科院刘群的基于《知网》的词语相似度计算是当前比较有代表性的计算词语相似度的方法之一。在测试中我们发现对一些存在对义或反义的词语与同义、近义词语一样具有较高的相似度,一些明显相似的词反而相似度较低,如"美丽"与"贼眉鼠眼...
关键词:计算机应用  中文信息处理 知网 词语相似度 义原  词语极性识别  
基于多层条件随机场的中文命名实体识别
3
《计算机工程与应用》北京信息科技大学中文信息处理研究中心;北京拓尔思信息技术有限公司 胡文博 都云程 吕学强 施水才  出版年:2009
国家高技术研究发展计划(863);北京市属市管高校人才强教计划项目(No.PXM2007_014224_044677,No.PXM2007_014224_044676);北京市教委科技发展计划项目(No.KM200710772010)~~
命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识别...
关键词:条件随机场 命名实体识别 命名实体  
基于条件随机场的领域术语识别研究
4
《计算机工程与应用》北京信息科技大学中文信息处理研究中心;北京拓尔思信息技术股份有限公司 施水才 王锴 韩艳铧 吕学强  出版年:2013
国家自然科学基金(No.60872133);北京市自然科学基金(No.4092015);北京市教委科技发展计划项目(No.KM201110772021);核高基项目
领域术语是各个领域的核心词汇,在研究了大量领域文献的基础上,提出了一种识别领域术语的方法。该方法以现有成熟工具为依托,使用条件随机场模型统计领域术语的词性组合概率。在选定特征集后,通过调整特征和窗口的组合,制定一个最优特...
关键词:领域术语  条件随机场 词性组合  特征模板  
一种通用HTML网页主题信息提取方法
5
《现代图书情报技术》北京信息科技大学中文信息处理研究中心 许文 都云程 李渝勤 施水才  出版年:2007
国家自然科学基金项目"Web数据挖掘技术研究"(项目编号:60272084);北京市教育委员会科技发展计划重点项目"面向大规模真实文本的数据挖掘技术"(项目编号:KZ200310772013);北京市教委项目"中文垃圾邮件过滤和追踪技术研究"(项目编号:KM200510772008);"数字内容的安全身份认证与版权保护技术研究"(项目编号:KM200610772008)的研究成果之一
采用DOM规范,把HTML网页表示成树结构,对不同模板的HTML页面“主题”信息提取进行研究和分析,提出一种新的结点主题相关性判定方法,依据此方法判定出要抽取的主题内容,并删除无关内容,结果输出只含主题信息的HTML文档...
关键词:DOM 信息提取 分块  相关度
基于同义词词林的中文文本主题词提取
6
《广西师范大学学报(自然科学版)》北京信息科技大学中文信息处理研究中心;抚顺市第十五中学 程涛 施水才 王霞 吕学强  出版年:2007
国家自然科学基金资助项目(60272084);北京市教育委员会科技发展计划重点项目(KZ200310772013);北京市教委项目(KM200510772008;KM200610772008)
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下...
关键词:主题词提取 同义词词林 权值 同义词
基于内容的文档图像检索的特征抽取研究
7
《江西师范大学学报(自然科学版)》北京信息科技大学中文信息处理研究中心 马永成 肖诗斌 林春雨 施水才  出版年:2008
863计划重点项目(2006AA010105);国家自然科学基金项目(60772081);北京市属市管高校人才强教计划项目(PXM2007-014224-044677,PXM2007-014224-044676);北京市教委科技发展计划项目(KM200710772010)
随着多媒体资源的飞速增长,多媒体检索技术成为当前检索技术的一个热点,该文将介绍文档图像这类特殊的多媒体资源检索技术中的特征提取方法.根据汉字特点,从几个角度,介绍了几种汉字图像块的特征提取方法及相应的相似度算法,并进行了...
关键词:文档图像 汉字特征提取  特征的相似度计算  
一种抗H.264压缩的低比特率视频水印算法
8
《计算机工程》北京信息科技大学中文信息处理研究中心;中国电子技术标准化研究所 余小军 莫玮 范科峰 王美华  出版年:2008
国家自然科学基金资助项目(60672112);北京市教委科技发展计划基金资助项目(KM200610772008)
为了解决H.264压缩视频版权保护问题,提出一种新的低比特率视频水印算法。根据H.264中DCT系数分布特点,通过系数的符号编码,水印信息被嵌入到I帧DCT量化系数中。引入量化失真补偿的办法,降低了水印嵌入时引起的视频失...
关键词:视频水印 符号编码  量化失真补偿  
搜索引擎日志中“N_1+N_2”型名词短语研究
9
《现代图书情报技术》北京信息科技大学中文信息处理研究中心 刘志杰 吕学强 程涛  出版年:2010
国家社会科学基金项目"搜索引擎用短语词典的语法理论和构建方法研究"(项目编号:09CYY021)的研究成果之一
在基于搜索日志的基础上,根据语料本身具有的特点,对"N1+N2"型结构的名词短语进行全面的描述,其中包括各组成要素的特点和句法功能,并给出该结构类型名词短语挖掘与校对的基本方法。通过对实验结果的分析,进一步说明短语的研究...
关键词:“N1+N2”型结构  搜索日志 名词短语 句法功能  
用户兴趣分类在个性化搜索引擎中的应用
10
《情报学报》北京信息科技大学中文信息处理研究中心;大连工业大学信息学院 李银松 施水才 张玉杰 吕学强  出版年:2008
基金项目:863计划重点项目(2006AA010105);国家自然科学基金项目(60772081);北京市属市管高校人才强教计划项目(PXM2007-014224-044677);北京市教委科技发展计划项目(KM200710772010).
个性化搜索引擎是指在普通搜索引擎的基础上,根据用户的背景,兴趣等调整排序算法,针对不同的用户提供不同的服务。本文对搜索引擎的排序算法和用户行为进行了深入细致的研究,通过隐性方法收集用户行为信息,统计并构建用户长期兴趣模型...
关键词:信息检索 个性化搜索引擎 用户兴趣分类  LUCENE
已选条目 检索报告 聚类工具

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心