专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN202310270118.5
申 请 日:20230320
申 请 人:华南理工大学 广州运星科技有限公司
申请人地址:510000 广东省广州市天河区五山路
公 开 日:20230609
公 开 号:CN116245672A
代 理 人:马戎
代理机构:广东良马律师事务所
语 种:中文
摘 要:本发明公开了一种基于社交媒体平台数据的交通事件信息重构方法,通过从社交媒体平台上爬取交通事件数据并构建数据集;对爬取到的文本进行预处理与标注后,将数据集划分为训练集、验证集和测试集;提取预处理后的文本中的关键词,并计算关键词的权重;搭建实体识别模型,将训练集和验证集中的文本序列,以及提取到的具有权重的关键词作为实体识别模型的输入,对实体识别模型进行参数调节;对参数调节后的实体识别模型进行交叉验证,输出对测试集的实体识别结果;对实体识别结果进行实体规范化,得到对应的交通事件重构信息。通过在文本序列的基础上引入关键词的特征,增强了模型对实体边界的敏感度,提高了模型对交通事件的信息重构的准确性。
主 权 项:1.一种基于社交媒体平台数据的交通事件信息重构方法,其特征在于,包括:使用爬虫从社交媒体平台上爬取交通事件数据并构建数据集,爬取的内容包括文本和时间;对爬取到的所述文本进行预处理与标注后,将所述数据集划分为训练集、验证集和测试集;提取预处理后的所述文本中的关键词,并计算所述关键词的权重;搭建实体识别模型,将所述训练集和验证集中的文本序列,以及提取到的具有权重的关键词作为所述实体识别模型的输入,对所述实体识别模型进行参数调节;对参数调节后的实体识别模型进行交叉验证,输出对测试集的实体识别结果;对所述实体识别结果进行实体规范化,得到对应的交通事件重构信息。
关 键 词:实体识别 参数调节 交通事件 媒体平台 文本序列 测试集 数据集 训练集 权重 重构 文本 预处理 交通事件数据 交通事件信息 提取预处理 交叉验证 实体边界 信息重构 敏感度 验证集 构建 标注 验证 规范化 输出 引入
IPC专利分类号:G06Q50/00;G06F40/289;G06F18/214;G06F40/216;G06N3/08;G06N3/045
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...