期刊文章详细信息
主题模型在基于社交媒体的灾害分类中的应用及比较
Application and Comparison of Topic Model in Identifying Latent Topics from Disaster-Related Tweets
文献类型:期刊文章
SU Kai;CHENG Changxiu;Nikita Murzintcev;ZHANG Ting(Center for Geodata and Analysis,Faculty of Geographical Science,Beijing Normal University,Beijing 100875,China;Instituteof Geographic Sciences and Natural Resources Research,Chinese Academy of Sciences,Beijing 100101,China)
机构地区:[1]北京师范大学地理科学学部,地理数据与应用分析中心,北京100875 [2]中国科学院地理科学与资源研究所,北京100101
基 金:国家重点研发计划项目(2017YFB0504102);中央高校基本科研业务费专项资金资助~~
年 份:2019
卷 号:21
期 号:8
起止页码:1152-1160
语 种:中文
收录情况:BDHX、BDHX2017、CSCD、CSCD2019_2020、JST、RCCSE、ZGKJHX、核心刊
摘 要:“一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语料库的情况下,从海量灾害相关推文中快速聚合出对灾害救援、评估有价值的信息。本文采用BTM模型和LDA模型,对2013年海燕台风相关推文进行细粒度的主题聚类,分析2个模型的精度并测试它们对近似灾害主题的区分能力,并基于“需求相关”主题类的推文,通过地名匹配,分析了海燕台风发生过程中菲律宾物资、医疗等需求程度的空间分布。结果表明:①在区分主题近似的短文本时,BTM总体精度为0.598.LDA的总体精度仅为0.321,说明在海燕台风灾害推文的主题识别中,BTM模型的精度高于LDA模型;②BTM能够较好识别出“灾害地点相关”、“祈福相关”等较为精细的灾害主题;③经初步验证,基于“需求相关”主题文本生成的物资、医疗等需求的需求程度空间分布与实际需求情况基本相符。
关 键 词:主题模型 BTM LDA 推文 主题分类 自然灾害 应急管理
分 类 号:P444[大气科学类] P429
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...