[TOC]
Preparation
Softwares:
- PAUP: 利用SVDQuatets的包计算SNP-based phylogeny
- bcftools
- vcftools
- Figtree
Datasets: 数据来源于Lake Tanganyika cichlid fishes大类群中的各个species,每个species两个体,总共28个samples,来自于14个物种;以Oreochromis niloticus为参考基因组,作GATK call SNP;数据已进行过滤,只保留chr5上的snp。
SNP过滤
- 对14物种的28个体的SNP数据进行过滤,对于SVDQuartets来说需要排除可能的杂交物种,因其对multi-species-coalescent model的推断可能会有问题。此部分较基础,略读。
1 | ## bcftools 相关;见相关教程。http://www.htslib.org/doc/bcftools.html |
利用SVDQuartets计算物种树
- SVDQuartets是利用 multi-species-coalescent模型根据SNP数据计算物种树拓扑结构的工具。计算较为迅速。但缺点是只能生成拓扑结构,支长信息不能展示。
1 | ## 转换vcf为nexus格式,注意很多杂合nucl会以兼并nucl形式。 |
- 利用PAUP软件打开nexus文件,DATA中选定外类群,Analysis中SVDQuartets计算SVDQ值,数据量较大情况,可随机挑选一定数量作计算。Ambiguities选Distribute便会计算兼并的碱基。
结果会显示出拓扑结构。
- 指定样本个体来源的物种,按照物种级别去构建物种树。
1 | # 按照物种划分样本taxpartitions.txt |
- 在同样的SVDQuartets里设置TAXA species,Bootstrap值;threads值。
结果会显示:
再通过Trees 的”Save Trees to File…” in PAUP*’s “Trees” more settings里的As internal node labels。即可保存为带有支持率的newick树文件,可为Figtree所用。