登录    注册    忘记密码

期刊文章详细信息

主题模型在基于社交媒体的灾害分类中的应用及比较    

Application and Comparison of Topic Model in Identifying Latent Topics from Disaster-Related Tweets

  

文献类型:期刊文章

作  者:苏凯[1] 程昌秀[1] Nikita Murzintcev[2] 张婷[1]

SU Kai;CHENG Changxiu;Nikita Murzintcev;ZHANG Ting(Center for Geodata and Analysis,Faculty of Geographical Science,Beijing Normal University,Beijing 100875,China;Instituteof Geographic Sciences and Natural Resources Research,Chinese Academy of Sciences,Beijing 100101,China)

机构地区:[1]北京师范大学地理科学学部,地理数据与应用分析中心,北京100875 [2]中国科学院地理科学与资源研究所,北京100101

出  处:《地球信息科学学报》

基  金:国家重点研发计划项目(2017YFB0504102);中央高校基本科研业务费专项资金资助~~

年  份:2019

卷  号:21

期  号:8

起止页码:1152-1160

语  种:中文

收录情况:BDHX、BDHX2017、CSCD、CSCD2019_2020、JST、RCCSE、ZGKJHX、核心刊

摘  要:“一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语料库的情况下,从海量灾害相关推文中快速聚合出对灾害救援、评估有价值的信息。本文采用BTM模型和LDA模型,对2013年海燕台风相关推文进行细粒度的主题聚类,分析2个模型的精度并测试它们对近似灾害主题的区分能力,并基于“需求相关”主题类的推文,通过地名匹配,分析了海燕台风发生过程中菲律宾物资、医疗等需求程度的空间分布。结果表明:①在区分主题近似的短文本时,BTM总体精度为0.598.LDA的总体精度仅为0.321,说明在海燕台风灾害推文的主题识别中,BTM模型的精度高于LDA模型;②BTM能够较好识别出“灾害地点相关”、“祈福相关”等较为精细的灾害主题;③经初步验证,基于“需求相关”主题文本生成的物资、医疗等需求的需求程度空间分布与实际需求情况基本相符。

关 键 词:主题模型 BTM  LDA 推文  主题分类 自然灾害 应急管理

分 类 号:P444[大气科学类] P429

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心