Page 22 - 2011no48

Basic HTML Version

盖红梅等
, 2011, SSR
数据处理宏程序
DataTrans 1.0,
分子植物育种
Vol.9 No.48 (doi: 10.5376/mpb.cn.2011.09.0048)
1362
1.3
设计目标
应处理从
SSR
原始数据保存格式转换为
Ntsys
Popgene
PowerMarker
Structure
Tassel
软件所
需的数据格式,而且要求准确无误、快速高效;另
外,需有自己的操作界面,通过点击命令按钮进行
操作,简单易用;最后,对用户友好,无需安装,
不在系统文件夹添加文件、占用系统资源小。
2 DataTrans1.0
简介
DataTrans1.0
是一款
SSR
数据前期处理的
Excel
宏程序,可以将
SSR
原始采集数据准确、高
效的转换为多款统计分析软件
(Ntsys, Popgene,
PowerMarker, Structure
Tassel)
所需的数据格式。
该程序以
VBA
为开发语言,在
Excel
环境下运行,
界面友好
(
3)
,操作简便,是群体遗传学和基因组
学数据分析的重要桥梁工具。与手工转换和使用
Excel
函数相比,使用该软件对提高工作效率和确
保数据的准确性方面具有极大的优势
(
3)
。目前多
数学者采用的是
Excel 2003
,但是由于其仅能容纳
256
列数据,已经无法满足高通量的
SSR
数据保存。
Excel 2007
能容纳
1048576
行和
16384
列的数据,
更适合高通量数据的存储。因此,
DataTrans1.0
发了
DataTrans1.0(2003)
DataTrans1.0(2007)
两个
版本,以满足不同用户的需求。这两个版本在软件
的功能、界面和使用方法上完全相同,两者的区别
仅在于
DataTrans1.0(2007)
能处理更多的
SSR
数据,
可充分满足高通量数据分析的要求。本文将以
DataTrans1.0(2007)
为例进行介绍。
3
DataTrans1.0(2007)
的用户界面
Figure 3 The user interface of DataTrans1.0 (2007)
3 DataTrans1.0
能够大大提高
SSR
数据前期处理的效率
Table 3 Data Trans1.0 can raise the efficiency of pre-processing of SSR data greatly
功能实现
Function implementation
DataTrans1.0
Excel
函数
Excel functions
Excel
查找、替换
Excel searching,exchanging
bp
0
1
格式
“bp” to “0,1” format
5 min
About 5 min
36 h
About 36 h
15 d (d/12 h)
About 15 d (d/12 h)
bp
转基因型格式
“bp” to genotype format
4min
About 4 min
24 h
About 24 h
12 d (d/12h)
About 12 d (d/12 h)
bp
PowerMarker
格式
“bp” to format for PowerMarker
30s
About 30s
4 h
About 4 h
8 d (d/12h)
About 8 d (d/12 h)
bp
Structure
格式
“bp” to format for Structure
40s
About 40s
8 h
About 8 h
10 d (d/12 h)
About 10 d (d/12 h)
bp
Tassel
格式
“bp” to format for Tassel
30s
About 30s
3 h
About 3 h
8 d (d/12 h)
About 8 d (d/12 h)
0, 1
转基因型格式
“0,1” to “bp” format
5 min
About 5 min
48 h
About 48 h
20 d (d/12 h)
About 20 d (d/12 h)
: DataTrans 1.0
的结果为实际运算
, Excel
函数和
Excel
查找、替换的结果为根据经验估计
Note: The data point of DataTrans1.0 obtained by real operation, the data point of Excel function and searching/shifting based on
empirical estimation