期刊文章详细信息
文献类型:期刊文章
机构地区:[1]大连大学物理学系,辽宁大连116622 [2]大连大学数学系,辽宁大连116622
年 份:2001
卷 号:22
期 号:4
起止页码:95-100
语 种:中文
收录情况:NSSD、普通刊
摘 要:DNA序列分类的方法有很多种.本文给出了两种模型都是在图象的基础上,利用图象的直观、易于分析等优点,找到各种碱基不同的特征,得出一个比较合理的方法. 在建立模型时,先计算出给定的前20种DNA序列中各碱基A,G、C、T的含量 (将一串长序列简化成了四个百分含量数值,大大简化了序列),并以此含量为数据作出直角坐标系下的二维曲线.根据曲线的特征,得出了两个算法,一个是以其中的一个DNA序列中碱基的含量大于其它三种含量为特征分出类别,对21至40种序列的分类正确率达到 80%,对于题中所给的 182种序列分类正确率为 42%;另一个是通过转化曲线为直线的方法找出符合分类特征的区间,根据是否在此区间内而分出类别,对21至40种序列的分类正确率达到100%,对于题中所给的182种序列分类正确率为85%. 最后,通过对比两种模型的结果,判断出两种模型的优劣,并分析了其中的原因.
关 键 词:DNA序列 分类方法 碱基 人类基因组计划 生物信息学
分 类 号:Q523]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...