期刊文章详细信息
基于混合深度信念网络的多类文本表示与分类方法
A Model for Text Representation and Classification Based on Hybrid Deep Belief Networks
文献类型:期刊文章
机构地区:[1]北京科技大学计算机科学与技术系,北京100083 [2]中国矿业大学计算机科学与技术系,北京100083
基 金:国家自然科学基金项目:结合前馈和反馈机制的自然场景文本识别技术(61473036)资助
年 份:2016
卷 号:2
期 号:5
起止页码:30-40
语 种:中文
收录情况:NSSD、ZGKJHX、普通刊
摘 要:本文开展了基于混合深度信念网络的多类文本表示与分类方法的研究,以解决传统的Bag-ofWords(BOW)表示方法忽略文本语义信息、特征提取存在高维度高稀疏的问题。文章基于文本关键字,针对多类的分类任务(如新闻文本和生物医学文本),以关键字的词向量表示作为文本输入,同时结合深度信念网络(Deep Belief Network,DBN)和深度玻尔兹曼机网络(Deep Boltzmann Machine,DBM),设计了一种混合深度信念网络(Hybrid Deep Belief Network,HDBN)模型。文本分类和文本检索的实验结果表明,基于词向量嵌入的深度学习模型在性能上优于传统方法。此外,通过二维空间可视化实验,由HDBN模型提取的高层文本表示具有高内聚低耦合的特点。
关 键 词:文本分类 文本表示 深度学习 深度信念网络
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...