J Integr Plant Biol. ›› 2003, Vol. 45 ›› Issue (7): 766-769.

• Research Articles • Previous Articles     Next Articles

Matrix Generator (MG):a Program for Creating 0/1 Matrix from Sized DNA Fragments

ZHOU Shi-Liang, Peter QIAN   

Abstract:

A computer program called Matrix Generator (MG) was developed for transforming sized DNA fragments into a presence/absence data matrix. Dynamic computation was run to avoid errors introduced using fixed-bin-width arithmetic. MG can be used with bin sized fragments from AFLP, ISSR, RAPD, RFLP, and other molecular markers. The accuracy of MG was tested using fAFLP data of Abelia and the results show that MG results in higher resolution of taxa and is more reliable than programs of the similar usage.

Matrix Generator(MG):一个基于DNA 片段的0/1 矩阵生成程序
周世良  Peter QIAN 2
(1. 中国科学院植物研究所系统与进化植物学重点实验室,北京 100093;
2. 朝阳区北苑家园绣菊园6 号楼1110 ,北京100012)

摘要: 分子群体遗传学研究的特点是取样量大——存在于群体样本中的遗传变异必须要充分代表该群体和该物种的遗传变异量及分析的位点数多——位点样本必须恰当代表基因组。大样本的群体取样和位点取样产生大量的原始数据,使原始数据人工处理非常困难甚至不可能,从而迫切需要原始数据处理的自动化。目前一些大公司提供的凝胶图像收集仪器和配套的软件已经使原始数据的获取基本上自动化或半自动化。获得DNA 片段分子量数据后,必须把这些分子量数据转变成可反映操作单位(样本)之间关系的数据矩阵,原来用于计算分子量的那些软件已不实用或派不上用场。目前,除了用于fAFLP的Binthere弥补了部分不足外,还没有此类软件。Binthere存在固定栏宽(Bin)的缺陷,也就是将分子量最大值与最小值之间等分的方法来归纳不同操作单位(OUT)之间的异同,使得分子量绝对值差很小的数据可能被归入不同的栏,导致结果不正确。为了解决这类问题,我们设计编写了一个新的软件,取名为Matrix Generator(MG)。与同类软件相比,MG 具有两个主要优点:(1)采用动态栏宽和智能归并算法,克服了固定栏宽可能造成的错误; (2)可用于非荧光标记的分子标记技术。MG的基本思路是:分子量差异越小的片段,越可能是同缘片段,越应该处于相同的栏内。为此,我们采用绝对对应的动态过程。也就是说,从最小分子量到最大分子量之间的栏目数不是事先确定,而是由所分析的所有样品的特点和所使用的凝胶的分辨率(用户根据凝胶的特点给出数值)决定的。当两片段的差异小于凝胶所能达到的分辨率时,两片段被认为是同缘片段而归入相同的栏内。归并的过程从差异最小值开始,直至任意两片段的差异都大于凝胶的分辨率为止。这样就排除了同缘片段被隔离或者非同缘片段被合并的错误,从而使最可能同缘的片段归结在同一位点。MG 第一版(V1.0,DOS 版)集中体现了实用和易用的优点而没有包含同类软件所具有的一些功能,所以MG 必须与其他软件结合使用。对于非荧光标记的分子标记技术,如RAPD、RFLP、AFLP 等,可用Quantity One 等软件得到分子量,用Excel生成样品与(分子量数据代表的)DNA 片段矩阵,然后用MG 处理。对于荧光标记的分子标记技术,如fAFLP、fSSR等,除可以用Excel 生成矩阵外,可直接用Binthere 和Genotyper等生成分子量矩阵,然后用MG 处理。MG输出的矩阵经过适当编辑后,就可用后续的软件如Paup、Ntsys、Philip等运算。为了检验MG的有效性,我们用六道木属(Abelia)的AFLP分析数据进行检验,14 个样品的DNA片段分别用Binthere和MG 进行处理。前者得到295个含信息的位点,后者得到210个含信息的位点。用Nei and Li(1979)的算法分别计算距离矩阵并对两距离矩阵作Mantel 检验。结果,两矩阵之间存在一定的差别,但相似性系数高达0.941 63,说明两
种方法总体上会得到相似的结果,但局部会有所不同。用Paup对两矩阵作进一步分析,生成两个Neighbor-joining( N J )树。结果表明,M G 生成的数据更符合实际情况,而且分辨率高。
关键词: 六道木属;AFLP;软件;数据处理;Matrix Generator(MG)

通讯作者。 E-mail: <slzhou@ns.ibcas.ac.cn>。

Editorial Office, Journal of Integrative Plant Biology, Institute of Botany, CAS
No. 20 Nanxincun, Xiangshan, Beijing 100093, China
Tel: +86 10 6283 6133 Fax: +86 10 8259 2636 E-mail: jipb@ibcas.ac.cn
Copyright © 2021 by the Institute of Botany, the Chinese Academy of Sciences
Online ISSN: 1744-7909 Print ISSN: 1672-9072 CN: 11-5067/Q
备案号:京ICP备16067583号-22