登录    注册    忘记密码

北京拓尔思信息技术股份有限公司 收藏

导出分析报告

研究主题:TRS    大数据    知识    条件随机场    内容管理    

研究学科:自动化类    经济学类    哲学类    交通运输类    航空航天类    

被引量:328H指数:10北大核心: 33 CSSCI: 17 CSCD: 27 RDFYBKZL: 1

-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
排序方式:

180 条 记 录,以下是 1-10

基于多层条件随机场的中文命名实体识别
1
《计算机工程与应用》北京信息科技大学中文信息处理研究中心;北京拓尔思信息技术有限公司 胡文博 都云程 吕学强 施水才  出版年:2009
国家高技术研究发展计划(863);北京市属市管高校人才强教计划项目(No.PXM2007_014224_044677,No.PXM2007_014224_044676);北京市教委科技发展计划项目(No.KM200710772010)~~
命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识别...
关键词:条件随机场 命名实体识别 命名实体  
中文微博突发事件检测研究
2
《现代图书情报技术》北京信息科技大学网络文化与数字传播北京市重点实验室;北京拓尔思信息技术股份有限公司 王勇 肖诗斌 郭跇秀 吕学强  出版年:2013
国家自然科学基金项目"基于本体的专利自动标引研究"(项目编号:61271304);国家自然科学基金项目"网页内容真实性评价研究"(项目编号:61171159);北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目"面向领域的互联网多模态信息精准搜索方法研究"(项目编号:KZ201311232037);国家科技支撑计划课题"增强型搜索引擎关键技术研究与示范"(项目编号:2011BAH11B03)的研究成果之一
从微博中准确而高效地挖掘出突发事件是近年来的研究热点。通过词频统计、词增长率计算和TF-PDF算法抽取突发词集,使用突发词表示文本并结合微博突发事件的描述特征进行文本过滤;提出一种"绝对聚类"算法,对描述突发事件的文本进...
关键词:突发事件 突发词  文本过滤 绝对聚类  
内容管理的关键技术
3
《中国传媒科技》北京拓尔思信息技术有限公司 韩啸 曹辉  出版年:2004
内容管理是针对实际问题提出的解决方案,是人、过程与技术的集成,需要从人员组织、业务流程以及内容管理系统的建立等多方面共同协调实现。
关键词:内容管理 内容管理平台技术  XML技术 元数据技术 工作流管理技术 企业 应用集成技术 智能关联技术  内容挖掘技术  
面向互联网舆情的热词分析技术
4
《中文信息学报》北京信息科技大学;北京拓尔思信息技术股份有限公司 李渝勤 孙丽华  出版年:2011
国家863计划重点资助项目(2006AA010105);国家自然科学基金资助项目(60772081);北京市教委科技发展计划资助项目(KM200910772022)
热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题。该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究。在热词发现阶段,首先采用命名实体识别技术和高频串统计技术进行短语串的挖掘,继而采...
关键词:热词 命名实体识别 热度计算  波动权值  词群关系  
企业竞争情报系统中的跨界合作
5
《现代图书情报技术》北京拓尔思信息技术有限公司 倪金松 贺兆辉  出版年:2006
从企业竞争情报系统的应用现状分析出发,指出企业竞争情报系统需要在多方协作的环境下才能真正有效发挥作用。提出由企业、竞争情报系统提供商、情报信息提供商、图书馆、顾问咨询公司、高校等联合建立企业竞争情报协作环境,描述该环境下...
关键词:跨界合作 企业竞争情报系统 跨界合作方式下的企业竞争情报系统环境  
基于条件随机场的领域术语识别研究
6
《计算机工程与应用》北京信息科技大学中文信息处理研究中心;北京拓尔思信息技术股份有限公司 施水才 王锴 韩艳铧 吕学强  出版年:2013
国家自然科学基金(No.60872133);北京市自然科学基金(No.4092015);北京市教委科技发展计划项目(No.KM201110772021);核高基项目
领域术语是各个领域的核心词汇,在研究了大量领域文献的基础上,提出了一种识别领域术语的方法。该方法以现有成熟工具为依托,使用条件随机场模型统计领域术语的词性组合概率。在选定特征集后,通过调整特征和窗口的组合,制定一个最优特...
关键词:领域术语  条件随机场 词性组合  特征模板  
基于改进的LDA主题模型的微博用户聚类研究
7
《情报理论与实践》北京信息科技大学计算机学院;北京拓尔思信息技术股份有限公司 裴超 肖诗斌 江敏  出版年:2016
国家自然科学基金项目"网页内容真实性评价研究"(项目编号:61171159);北京市发改委项目"异构大数据分析挖掘整合技术北京市工程实验室创新能力建设项目"的成果
大规模文档集中潜藏的语义信息一般可以用潜在狄利克雷(LDA)主题模型识别,因为微博短文本语义稀疏,所以在微博短文本聚类中的应用并不理想。利用传统的潜在狄利克雷分布的主题模型来给微博建模,得到的微博用户分布并不直观,通过改...
关键词:微博  主题模型 文本聚类 K均值算法
TRS网络舆情监控解决方案
8
《信息网络安全》北京拓尔思(TRS)信息技术股份有限公司 都云程 王海洋 王洪俊  出版年:2008
随着互联网越来越成为当今社会最重要的舆情载体,网络舆情监控正受到政府、企业及个人的密切关注。通过网络舆情监控,我们能够了解舆论动向,引导舆论发展,从而制定正确的应对策略,并及时采取措施。因此,网络舆情监控对于了解社情民意...
关键词:网络舆情监控  博客  舆论 舆情分析 舆情监控系统  舆情信息 TRS 舆情系统  新闻评论 解决方案  
中文专利文献术语抽取
9
《计算机工程与设计》北京信息科技大学网络文化与数字传播北京市重点实验室;北京拓尔思信息技术股份有限公司 徐川 施水才 房祥 吕学强  出版年:2013
国家自然科学基金项目(61171159);国家科技支撑计划课题基金项目(2011BAH11B03);北京市教委科技发展计划基金项目(KM201110772021;KM201211232023)
为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法。根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度。在此基础...
关键词:术语  边界结合度  串边结合度  双字词性过滤法  
基于融合词性的BiLSTM-CRF的期刊关键词抽取方法
10
《数据分析与知识发现》北京信息科技大学计算机学院;北京拓尔思信息技术股份有限公司 成彬 施水才 都云程 肖诗斌  出版年:2021
【目的】利用CRF模型处理序列标注问题的优势,通过将词性信息和CRF模型融入BiLSTM网络,实现期刊关键词的自动抽取。【方法】将关键词抽取问题视为一个序列标注问题。对期刊文本进行分词和词性标注的预处理;对预处理后的文本...
关键词:抽取 条件随机场 深度学习  双向长短期记忆网络  
已选条目 检索报告 聚类工具

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心