登录    注册    忘记密码

期刊文章详细信息

一种面向证券信息披露长文档的表格分类方法    

An Approach for Table Classification in Long Financlal Disclosures

  

文献类型:期刊文章

作  者:罗小清[1] 贾网[2] 李佳静[2,3] 闫宏飞[4] 孟涛[3] 冯科[5]

LUO Xiaoqing;JIA Wang;LI Jiajing;YAN Hongfei;MENG Tao;FENG Ke(National Engineering Research Center for Software Engineering,Peking University,Beijing 100080,China;School of Mechanical Electrical and Information Engineering,China University of Mining and Technology(Beijing),Beijing 100083,China;Wangganzhicha Information Technology Inc,Nanjing,Jiangsu 210000,China;School of Computer Science,Peking University,Beijing 100871,China;School of Economics,Peking University,Beijing 100871,China)

机构地区:[1]北京大学软件工程国家工程研究中心,北京100080 [2]中国矿业大学(北京)机电与信息工程学院,北京100083 [3]南京网感至察信息科技有限公司,江苏南京210000 [4]北京大学计算机学院,北京100871 [5]北京大学经济学院,北京100871

出  处:《中文信息学报》

年  份:2023

卷  号:37

期  号:5

起止页码:70-79

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD2023_2024、JST、RCCSE、ZGKJHX、核心刊

摘  要:针对现有方法在获取证券信息披露长文档中的表格时准确度低的问题,该文提出了一种基于上下文特征融合的表格分类方法。首先对证券信息披露长文档中的表格和其上下文进行抽取和预处理,建立了表格分类的数据集;然后针对表格信息和上下文信息的不同特点,使用不同的多尺度卷积神经网络进行特征提取;进一步设计了一种针对表格分类更有效的特征融合方式。在构建的表格分类数据集上的分类结果相较于基线模型Micro-F_(1)值提升了0.37%,Macro-F_(1)值提升了1.24%,实验结果表明,该文提出的表格分类方法可较好地改善待分析表格获取效果。

关 键 词:证券信息披露长文档  表格分类  卷积神经网络 特征融合  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心