期刊文章详细信息
文献类型:期刊文章
机构地区:[1]徐州建筑职业技术学院计算机技术工程系,江苏徐州221008 [2]北京邮电大学计算机科学与技术学院,北京100876
基 金:江苏省科研基金资助项目(04KJD520185)
年 份:2005
卷 号:23
期 号:1
起止页码:32-36
语 种:中文
收录情况:AJ、CAS、CSA、CSA-PROQEUST、IC、INSPEC、JST、RCCSE、ZGKJHX、普通刊
摘 要:大量分散的形式及不同格式的数据给现代数据处理带来了越来越大的困难。为统一数据形式以利于数据操作和处理,讨论了将形式多样的数据格式转换成统一的XML(extensibleMarkupLanguage)格式的问题。在计算机网络中,应用"元数据模型"技术,对数据源中不同格式文件数据,按照预先定义的XML模板,以格式说明文件结构统一描述,并提取数据或作进一步的处理,最后转换为XML格式输出。设计了具体的实现策略以及实现流程:实现了从TXT文件格式数据中提取数据转换成XML格式的代码,将TXT文件数据提取成XML格式的数据;完成了数据说明文件格式的设计,数据路径选择工具的开发,语言分析工具的设计开发等工作。结果表明:能满足同类产品的按行(line)为单位的源数据结构形式处理,还具有同类产品不具备的非行(字符串和关键字)提取处理功能。
关 键 词:数据提取 元数据模型 格式说明文件 可扩充标记语言
分 类 号:TN914.13]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...