登录    注册    忘记密码

专利详细信息

一种基于社交媒体平台数据的交通事件信息重构方法       

文献类型:专利

专利类型:发明专利

是否失效:

是否授权:

申 请 号:CN202310270118.5

申 请 日:20230320

发 明 人:管中港 林永杰 徐茹玉 徐建闽

申 请 人:华南理工大学 广州运星科技有限公司

申请人地址:510000 广东省广州市天河区五山路

公 开 日:20230609

公 开 号:CN116245672A

代 理 人:马戎

代理机构:广东良马律师事务所

语  种:中文

摘  要:本发明公开了一种基于社交媒体平台数据的交通事件信息重构方法,通过从社交媒体平台上爬取交通事件数据并构建数据集;对爬取到的文本进行预处理与标注后,将数据集划分为训练集、验证集和测试集;提取预处理后的文本中的关键词,并计算关键词的权重;搭建实体识别模型,将训练集和验证集中的文本序列,以及提取到的具有权重的关键词作为实体识别模型的输入,对实体识别模型进行参数调节;对参数调节后的实体识别模型进行交叉验证,输出对测试集的实体识别结果;对实体识别结果进行实体规范化,得到对应的交通事件重构信息。通过在文本序列的基础上引入关键词的特征,增强了模型对实体边界的敏感度,提高了模型对交通事件的信息重构的准确性。

主 权 项:1.一种基于社交媒体平台数据的交通事件信息重构方法,其特征在于,包括:使用爬虫从社交媒体平台上爬取交通事件数据并构建数据集,爬取的内容包括文本和时间;对爬取到的所述文本进行预处理与标注后,将所述数据集划分为训练集、验证集和测试集;提取预处理后的所述文本中的关键词,并计算所述关键词的权重;搭建实体识别模型,将所述训练集和验证集中的文本序列,以及提取到的具有权重的关键词作为所述实体识别模型的输入,对所述实体识别模型进行参数调节;对参数调节后的实体识别模型进行交叉验证,输出对测试集的实体识别结果;对所述实体识别结果进行实体规范化,得到对应的交通事件重构信息。

关 键 词:实体识别  参数调节  交通事件 媒体平台 文本序列  测试集  数据集  训练集  权重  重构  文本 预处理 交通事件数据  交通事件信息  提取预处理  交叉验证  实体边界  信息重构  敏感度 验证集  构建  标注  验证  规范化  输出  引入  

IPC专利分类号:G06Q50/00;G06F40/289;G06F18/214;G06F40/216;G06N3/08;G06N3/045

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心