重测序揭示了陆地棉核心系列中纤维质量和产量的基因组变异和遗传位点

摘要: 陆地棉(AADD,2n=52)是一种重要的天然纤维作物,因其适应性广、产量高而在世界各地广泛种植。 长期的自然选择和人工育种,产生了大量的陆地棉种质资源。 随着人们需求的不断增加和纺织技术的提高,对棉纤维的质量提出了更高的要求。 纤维品质性状的遗传改良已成为育种者的重要目标。 然而,棉花品质、产量等复杂性状的有效选择和改良却存在困难。 因此,深化种质资源表型变异的分子基础研究,发现优良的突变位点显得尤为重要。 本研究以世界主要产棉国的419份陆地棉核心种质为材料。 黄河流域棉区安阳、沧州,长江流域棉区荆州、盐城,西北内陆棉区敦煌、阿拉尔等地采集。 在为期 2 年的试点期间,在 12 个环境中鉴定了 13 项纤维质量和产量相关性状,如纤维长度、强度、棉铃重量和衣着评分。 同时,对419份材料进行了基因组重测序,旨在进一步探索纤维品质和产量的控制。 基因组变异位点和候选基因。 419个样本的平均测序深度达到6.55倍,共鉴定出约366万个SNP,其中A亚组和D亚组的SNP数量分别为2,273,433和971,895个。 种质群体可分为G1、G2和G33亚群体,分别包含65个、268个和86个样本。 G1主要包括美棉等早熟品种,花期较晚; G2主要包括来自美国和中国长江流域的品种,花期中等; G3主要包括西北内陆棉区和从前苏联引进的品种,花期较早。 群体θπ为5.39×10~(-4),低于栽培粳稻、籼稻和良种大豆品种。 与陆地棉野生品系相比,陆地棉基因组70,478个基因中,419份材料中有23,876个(33.88%)基因不存在SNP变异,分别有33,899个(40.10%)和6,957个(9.87%)基因出现表达。 SNP 变异的数量减少或增加。 通过全基因组关联分析,共鉴定出7,383个显着相关的SNP位点,并根据这些位点筛选出4,820个候选基因,其中3,089个基因在纤维发育期高表达,其中包括一些与开花期相关的基因。纤维引发)。 与纤维长度(伸长率)和纤维强度(细胞壁增厚)相关的新基因。 通过不同单倍型品种的基因表达分析、拟南芥遗传转化和棉花VIGS实验,鉴定出新的棉花开花和纤维发育起始基因GhCIP1和GhUCE、新的纤维伸长(长度)基因GhFL1和GhFL2以及1个新基因。 纤维次生壁增厚(强度)的新基因。 此外,分析发现,在棉花驯化和选择过程中,13个纤维相关性状的表型选择增加了优良等位基因的频率。