MPB -2016v14n5 - page 7

分子植物育种
(
网络版
), 2016
,
14
,
1029
-
1034
Fenzi Zhiwu Yuzhong (Online), 2016, Vol.14, 1029
-
1034
Copyright © 2016 BioPublisher 1032
2
讨论
SSR
标记与其它分子标记相比,具有基因组覆
盖度广,多态性高、重复性好、呈共显性遗传等特
点,在分子群体遗传学研究中得到了广泛应用。而
且随着目前高通量
SSR
分型技术的快速发展,分子
遗传学研究的数据量日益增多,单纯用手工进行数
据转换过于耗时耗力,且易出错。因此,本研究为
了满足
SSR
原始数据快速转换为不同软件的输入文
件,开发出了能即刻把
SSR
原始数据转换为目标软
件输入文件的
DataFormater
软件,该软件运行速度
快,为
SSR
数据的深入分析提供了高效快捷的途径。
DataFormater
软件是对
DataTrans 1.0
的更新换
代,不仅继承了
DataTrans 1.0
无需安装,占用内存
小,不产生系统垃圾的所有优点,而且数据转换速
度比
DataTrans 1.0
更快,同时还增加了过滤稀有等
位和无多态性位点等功能。此外,
DataFormater
件是用
Python
语言编写的,具有独立的操作界面,
能在
Windows
Linux
MacOS
等主流操作系统上
运行,具备很好的兼容性。
DataFormater
软件目前包含了分子群体遗传学
常用软件
Popgene
Ntsys
PowerMarker
Structure
SPAGeDi
Tassel
的数据转换功能,基本上满足了
研究人员数据转换的需求。但是随着科技技术的飞
速发展,日后必定会有新的分子群体遗传学分析软
件问世,因此
DataFormater
软件也会根据发展不断
完善,为广大使用者提供更多的功能支持。
3 材料与方法
3.1
原始数据格式
当前
SSR
检测方法主要有聚丙烯酰胺凝胶电泳
和毛细管凝胶电泳
(
王立新等
, 2012)
。前者的
SSR
型数据一般为“
01
带型”格式,而后者的
SSR
型数据为“
bp
值型”格式
(
盖红梅和任民
, 2011)
。为
此,本研究所用的原始数据包括了“
bp
值型”和
01
带型”
2
种格式。上述
2
种原始数据格式在
Excel
软件中的组织和保存方式如下:
3.1.1
01
带型”原始数据的输入格式
用户的原始数据可以直接用
Excel
表格录入
和保存
(2007
及以上版本
)
DataFormater
支持直接
读取表格内的数据。从
Excel
表格中
C1
单元格开
始,沿第
1
行输入引物名称。在第
1
列输入每个材
料的编号,在第
2
列输入代表居群或其他分类的编
号。其他单元格内输入相应的带型信息,缺失用“
9
表示
(
4)
3.1.2
bp
值型”原始数据的输入格式
同样将原始数据保存
Excel 2007
及其以上版
本中。从
Excel
表格中
C1
单元格开始,沿第
1
输入引物名称,每个引物的数据占
2
列。第
1
列和
2
列的内容与“
01
带型”数据格式相同。其他
单元格内输入带型的
bp
值,空带用英文状态的“
?
表示
(
5)
4 “01
带型
数据在
Excel
表格中的组织形式
Figure 4 Organizational format of “01” data in Excel
5 “bp
值型
数据在
Excel
表格中的组织形式
Figure 5 Organizational format of “bp” data in Excel
3.2
开发语言
该软件基于
Python
高级计算机语言开发,图
形用户界面
(GUI)
采用了
wxPython
图形库,利用
openpyxl
库实现了对
Excel (2007-2013
)
文件读写
的功能。软件的打包采用
pyinstaller 2.1
3.3
运行环境
由于
Python
计算机语言具有良好的跨平台能
力,因此本研究所开发的软件
DataFormater
亦可跨
平台运行在
Windows
Linux
MacOS
等多种操作
系统平台之上。不论何种操作系统平台,为了保证
程序的正确运行,应具备
(
1)
所列的运行环境。
1 DataFormater
软件的运行环境要求
Table 1 Runtime environment of DataFormater
运行环境
Runtime environment
版本
Version
Python
2.X
,推荐
2.7
wxPython
2.8
openpyxl
2.2.5
1,2,3,4,5,6 8,9,10
Powered by FlippingBook