期刊文章详细信息
文献类型:期刊文章
Shu Hongshui
机构地区:[1]西北政法大学反恐怖主义法学院
基 金:国家社科基金项目(项目编号:16BFX059)的阶段性研究成果。
年 份:2020
期 号:7
起止页码:113-129
语 种:中文
收录情况:BDHX、BDHX2017、CSSCI、CSSCI2019_2020、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:大数据时代,计算机数据正以海量速度增长,尤其是非结构化的文字数据最为惊人。利用自动化文本挖掘技术处理非结构化数据,获得有价值的预测或趋势信息,已成为近年来的热门议题。法院判决书是典型的非结构化数据,本研究以中国裁判文书网毒品判决书为文本挖掘对象,利用TF-IDF、N-Gram、关联性分析及CRISP-DM等技术方法,对388份判决书进行自动化分类及数据化转换,并利用统计线性回归方法,实时分析法院判决数据,建构出量刑预测模型。经评估后发现,本研究所提出的判决分类及量刑预测模型均有良好的预测能力。本研究所提出的判决书文本挖掘流程与自动化模型架构,未来可以为司法大数据应用提供参考。
关 键 词:大数据 判决书 文本挖掘 统计回归 量刑预测模型
分 类 号:D914] D916[法学类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...