期刊文章详细信息
文献类型:期刊文章
机构地区:[1]新疆大学信息工程学院计算机系,新疆乌鲁木齐830046
年 份:2006
卷 号:16
期 号:5
起止页码:56-58
语 种:中文
收录情况:JST、RCCSE、ZGKJHX、普通刊
摘 要:基于XML文档格式良好、层次清晰,可以方便地操纵、分析其结构的特点。文中在将Web上的HTML文档转化为XML文档的基础上,通过Java中的DOM树,分析文档的层次结构。把文档分为层次化的文本段,对传统的VSM算法进行改进,把每个文本段转换为空间向量,实现了N层VSM算法,通过试验证明,改进后算法的查全率和查准率都要优于传统的VSM算法。
关 键 词:XML XHTML N层向量空间模型 查全率 查准率
分 类 号:TP301.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...