期刊文章详细信息
基于机器学习的北京市三甲医院疾病诊断名称规范化研究
Research on Standardization of Disease Diagnostic Names in a Grade-A Tertiary Hospital in Beijing Based on Machine Learning
文献类型:期刊文章
Li Yicheng(Department of Health Policy and Management,School of Public Health,Peking University,Beijing,100191)
机构地区:[1]北京大学公共卫生学院卫生政策与管理学系,北京100191 [2]华东师范大学数学科学学院基础数学系,上海200062
年 份:2020
卷 号:33
期 号:8
起止页码:78-83
语 种:中文
收录情况:BDHX、BDHX2017、JST、RCCSE、ZGKJHX、核心刊
摘 要:目的:以国际疾病分类(ICD)为基础标准疾病术语模板,通过扩展ICD-10分类内容和机器学习的方法对多样化和不规范的疾病诊断名称进行识别,并转化为统一的标准疾病诊断术语,以提高门诊疾病诊断名称的计算机识别和分类效率。方法:将标准的疾病诊断术语作为训练集,采用基于“规则+贝叶斯机器学习+惩罚得分机制”的模型进行训练;测试数据为2018年上半年北京市22家三甲医院门诊诊断数据,对其中的783364条非标准化疾病诊断名称进行预处理后得到220258条疾病诊断,然后采用随机抽样的方法从中抽取5个样本作为测试集,每个样本含1000条疾病诊断术语,最后对训练集的标准化结果进行逐一甄别,分别计算准确率、召回率和综合评价指标。结果:应用基于“规则+贝叶斯机器学习+惩罚得分机制”的模型进行疾病诊断名称识别的平均准确率、召回率和综合评价指标分别为95.00%、92.65%和93.79%。模型有效解决了字形相近、多样性、不易分类的疾病诊断名称规范化的问题。结论:在对不规范门诊疾病诊断名称进行人工智能识别时,基于“规则+贝叶斯机器学习+惩罚得分机制”的模型拥有较好的识别效果,能够有效将非标准化的疾病诊断名称匹配到标准的ICD-10诊断术语,并与相应的ICD-10编码产生映射关系。
关 键 词:疾病诊断名称 规范化 机器学习 贝叶斯模型 惩罚机制 北京
分 类 号:R197.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...