所属栏目:农业论文 时间:2021-09-06
摘要:SNP基因分型芯片是分子育种的重要工具,高密度SNP芯片往往存在标记冗余、价格高、目标性不强等问题,是分子育种走向常规化、规模化的主要限制因素之一。在此,我们开发了一款低密度育种芯片,并就芯片在种质资源评价中的价值进行了分析。首先,我们对份玉米自交系进行0X重测序,获得了8.2Mb的SNP标记,从中挑选2,080个NP;再从已开发55K芯片中挑选3,390个缺失率低、多态性高、ConversionType为PolyHighResolution的标记;最后从apMap3中挑选586个标记,设计的育种芯片共包含6,056个SNP,采用靶向测序基因型检测(Genotypingbytargetsequencing,GBTS)技术对标记进行检测。通过自然群体、双亲群体和多亲本重组自交系(Multiparentadvancedgenerationintercross,MAGIC)群体验证表明,设计的育种芯片平均捕获率为0.6,检测到的原始设计位点数为4,773~5,963个,AF>0.4和IC0.4的标记比例分别为57.6和88.6。用该芯片对26份玉米种质资源进行评价,主成分分析可以将其划分为温带和热带两大类群,PGMA聚类分析进一步将其划分为个已知类群,分别是瑞德、兰卡斯特、旅大红骨、四平头和热带类群,Structure群体结构分析没有出现最佳值,但热带材料都独立成群;类群内和类群间的遗传距离平均值分别为0.394和0.47,其中群内的遗传距离最小(0.316),热带类群内的遗传距离最大(.424);类群间,瑞德与热带之间的遗传距离最大(0.493);类群间的遗传分化系数(ST)表明,类群与其他类群间的ST均较大。
关键词:玉米;NP;育种芯片;种质资源
分子育种技术的大规模推广应用依赖于分子标记成本的降低[1]。相比其他遗传标记,单核苷酸多态性(Singlenucleotidepolymorphisms,SNP)标记在基因组中含量丰富、稳定性强、鉴定效率高3]。在玉米基因组中,每44~75bp就会出现一个SNP[35]。
此外,SNP一般为二等位基因标记,易于估计群体中等位基因频率。随着分子生物学的发展,不同通量的SNP基因分型平台得到了广泛的应用,对于少数NP,主要的技术平台是竞争性等位基因特异性PCR(KompetitiveallelespecificPCR,KASP)和Taqman技术,而高密度SNP标记的鉴定主要通过全基因组重测序、简化基因组测序(Genotypingbysequencing,GBS)、固相芯片和靶向测序基因型检测(Genotypingbytargetsequencing,GBTS)(液相芯片)。
全基因组重测序或者简化基因组测序可以获得大量的NP,适合用于群体遗传研究,但需要配备相应的服务器并建立生物信息学分析平台。固相芯片的理论基础是杂交测序,具有特定的物理载体,目前的两种主要平台是AffymetrixAxiom和IlluminaInfinium,分别使用显微光蚀刻和微珠技术。
利用固相芯片已经在水稻[6]、小麦[78]、大豆[9]等作物上开发了一系列芯片。液相芯片因具有灵活性、广适性、高效性等特点,在动植物中已经开发了余套标记集10]。目前,玉米中已经开发了多款芯片[1113],在种质资源鉴定和分子标记辅助选择(Markerassistedselection,MAS)中发挥了一定的作用。
然而,高密度的芯片在育种中往往存在标记冗余、价格高、目标性不强等问题,是分子育种走向常规化、规模化的主要限制因素之一,开发低密度的育种芯片,不但可以降低成本,还可以提高检测效率。因此,我们根据遗传多样性丰富的份玉米自交系的基因组重测序数据,并结合5K芯片中的优良NP标记,开发了一款高质量、高性价比,适合在育种中应用的低密度育种芯片,并利用该育种芯片对国内外常见的玉米自交系进行了评价。
1材料与方法
1.1实验材料
实验材料共包括两部分,第一部分材料包含份自交系,进行0X重测序,用于芯片的标记开发,材料名称见附表;第二部分材料,包含个自然群体、个双单倍体(DoubledHaploid,DH)群体和个多亲本重组自交系(Multiparentdvancedgenerationintercross,MAGIC)群体,用于芯片的验证。其中自然群体包含了226份玉米自交系,国内常用自交系46份,包括常用自交系73、铁922、丹98等,国外引进自交系份,其中份ML自交系来自于国际小麦玉米改良中心(TheInternationalMaizeandWheatImprovementCenter,IMMYT),其他为ML衍生系。
DH群体包含了171份自交系,亲本分别为B73和CXS161,其中XS161是掖78与旱的回交改良系,系谱为(掖78×旱);MAGIC群体是16份亲本(其中份热带材料,分别为ML290、ML411、ML426、ML43、ML496、R0401、R0505和TMA238,份温带材料,分别为Mo17、Lx9801、旱、吉19、铁922、81565、郑和昌)通过两两杂交,再经过自交产生的,目前已经自交了代,共包含297份自交系,编号分别为~M297,加上亲本共13份。群体的亲本73和X161在不同批次中进行了两次生物学重复。
1.2芯片设计与开发
芯片原始设计6,056个SNP标记,SNP标记共有三个来源:(1)对37份玉米自交系进行0X重测序,共获得963.4的CleanReads,与B73RefGen_v4参考基因组比对后检测到8.2的NP,过滤后的NP数为.8,根据最小等位基因频率(Minorallelefrequency,MAF)和标记的分布挑选了高质量的NP共2,080个;(2)根据已有盘共,072个样品的55K芯片数据,从中挑选缺失率(Missingrate)5.0%、AF0.35、ConversionType为PolyHighResolution的标记,考虑性状相关标记和标记在染色体上的均匀分布,共挑选了3,390个标记,其中包含与抗穗腐病、耐渍和耐低磷相关的标记93个[1416];(3)最后从apMap3中挑选586个标记,用于填补前两个步骤中标记间隔比较大的区间。
标记的检测采用GBTS技术,在中玉金标记生物(北京)技术股份有限公司进行检测。BTS主要包括以下五个步骤[1]:(1)利用超声波将基因组DNA进行片段化并加上测序接头;(2)将带有生物素标记的RNA探针与已经带有接头序列的DNA片段结合;(3)链霉亲和素包裹的磁珠与上一步的双链复合物相结合(探针过量);(4)清洗得到目标区域的DNA,目的是去除非特异性杂交,提高捕获效率;(5)对洗脱下来的DNA产物进行PCR扩增,构建Illumina测序文库; 测序数据下机后使用ATK的模型进行变异检测,用vcftools进行标记过滤。
2结果与分析
2.1标记统计分析
将226个玉米自交系构成的自然群体和71个系的靶向测序数据分别比对到玉米B73RefGen_v4参考基因组上,使用ATK进行变异检测。自交系群体比对获得NP标记58,135个,过滤后剩余83343个,以个体Q10miss0.2maf0.05过滤后获得NP标记5,589个,其中2,217个NPs在设计目标位点上或者上下游00bp内;以个体Q20miss0.1maf0.05过滤获得521个NPs,标记均在目标位点或上下游50bp内,其中原始设计位点4,773个,从NP在基因组中的分布情况看,外显子中NP分布最多,其次为基因上游;每个目标区段平均检测到.1个NP。DH群体使用相同的软件及参数进行分析,在个体符合Q10miss0.2的过滤条件下,上述4,521个SNP在家系中有2,192个被检测到,比例为0.5。
对AGIC群体及亲本的13份份材料目标区域测序后进行比对,ATK检测获得NP标记99,154个,过滤后剩余45646个,以GQ10miss0.2maf0.05过滤后获得586个NPs,其中5,967个NPs是最初设计的原始标记,以GQ10miss0.1maf0.05过滤后获得50130个NPs,其中5,767个NPs是最初设计的原始位点。其中,自然群体和DH群体检测的NP与AGIC群体检测的NP相比,共同检测到的原始设计位点数为,560个。两个材料73和XS161生物学重复的一致性均为9.2,不考虑缺失基因型时一致性均为9.9。
2.2类群划分
主成分分析结果显示,当C=2时,自然群体可以明显地划分为两个类群,分别是热带类群和温带类群,热带类群不同自交系的前两个主成分比较聚集,而温带类群则比较分散。PGMA聚类分析可以将226个自交系分为个类群,依据骨干自交系,这个类群分别是热带、瑞德、兰卡斯特、四平头和旅大红骨。热带材料共有份,包括份ML自交系以及ML衍生的自交系,一些含有热带血缘的自交系如N165也被划分为热带类群;瑞德类群包含了份自交系,骨干自交系73、84、黄及先玉335的母本系H6WC都被划分为瑞德类群。
本次类群划分与之前我们用5K芯片和0K系列芯片划分的类群略有不同[112],区别是将、Iodent类群统一为瑞德,如铁922、辽053、辽114等传统上属于群,由于群与瑞德的关系较近,本次我们将其归为瑞德类群;兰卡斯特、四平头和旅大红骨则分别包含了 和份自交系,与之前的划分结果一致[112],总体上,对226份种质资源的评价结果与已知的我国玉米材料类群划分是一致的[1920]。用tructure软件将值设置为~10,与Lu等[19]的研究结果一样,没有出现最佳值。
3讨论
利用育种芯片进行选择,一般能够缩短世代间隔,提高选择的准确度,加快遗传进展。我国育种芯片研究始于997~1998年,尽管起步晚,但是发展很快,在玉米、水稻、小麦、大豆等主要农作物上开发了不同密度的育种芯片或者微阵列。由于玉米基因组大、结构复杂、重组率高、材料类型丰富,开发高质量、高密度SNP阵列的存在很多障碍[21]。
目前,玉米中开发的芯片包括基于Affymetrix平台的00K芯片[11]、5K芯片[12]和~0K芯片[13],基于Illumina平台的0K芯片[22]和芯片[23],基于GoldenGate平台的36微阵列[24]和3072微阵列[25],基于GenoBaits的0K系列液相芯片[1]等。这些芯片的开发为玉米遗传研究提供了重要的支撑。传统的固相芯片的理论基础是NA双螺旋的互补配对。虽然固相芯片鉴定的准确度比较高,但存在的问题是价格高、鉴定周期受样品量的限制。以我们开发的5K芯片为例,定制规格为384×55K,个样本的生物学重复一致率在7.1~98.9,缺失率平均值为.83[12],虽然略低于目前开发的低密度育种芯片,但相比其他芯片已经具有较高的质量。
然而,在实际应用的时候,往往需要几个科研机构或者育种公司凑足84个样本才能上机,基因型鉴定的周期从天延长到平均两个月甚至更长,大大限制了其在分子标记辅助选择中的应用。我们开发的0K系列液相芯片解决了5K芯片的上述限制[1],0K系列液相芯片适合用于种质资源鉴定、遗传图谱构建和全基因组选择等。利用0K系列液相芯片进行种质资源鉴定和类群划分时,我们发现0K与10K、标记的划分结果完全一致,说明玉米育种中类群的划分使用更低密度的芯片即可,而降低密度可以进一步降低成本。
例如,当标记密度降低到原来的一半时,成本降低为原来的三分之二,而当标记密度降低为原来的四分之一时,成本约为原来的一半[1],因此,有必要开发精准高效的低密度育种芯片。我们利用新开发的低密度育种芯片对国内外常用的自交系进行群体结构和杂种优势群的划分,当C=2时,首先将26份自交系划分为温带与热带两个类群,其中来自于IMMYT的自交系大多属于热带材料,部分含有热带血缘的材料如N165和WM(中糯父)也被划分为热带类群,这与前人的研究结果和育种实际相一致[1226]。
玉米种植论文: 常见的玉米病虫害及其防治技术分析
进一步利用PGMA聚类分析将26份自交系划分为个类群,除热带类群外,温带类群包括瑞德、兰卡斯特、四平头和旅大红骨个亚群,这与我国玉米主要类群相一致[2731],与应用高密度芯片相比,低密度育种芯片能够简化类群划分,如应用55K芯片将S602划分为Iodent类群,将53、J005和A156等划分为类群[1215],此次统一划分为瑞德类群。因此,新开发的低密度育种芯片能够在降低成本的同时优化玉米类群划分。
参考文献
[1]GuoZ,WangH,TaoJ,RenY,XuC,WuK,ZouC,ZhangJ,XuY.DevelopmentofmultipleSNPmarkerpanelsaffordabletobreedersthroughgenotypingbytargetsequencing(GBTS)inmaize.MolecularBreeding,2019,39:37.[2]BrumfieldRT,BeerliP,NickersonDA,EdwardsSV.Theutilityofsinglenucleotidepolymorphismsininferencesofpopulationhistory.TrendsinEcology&Evolution,2003,18:249256.
[3]BevanMW,UauyC.Genomicsrevealsnewlandscapesforcropimprovement.GenomeBiology,2013,14:111.
[4]GoreMA,ChiaJM,ElshireRJ,unQ,ErsozES,HurwitzBL,PeifferJA,McMullenMD,GrillsGS,RossIbarraJ,WareDH,BucklerES.Afirstgenerationhaplotypemapofmaize.Science,2009,326:1115–1117.
[5]VarshneyRK,NayakSN,MayGD,JacksonSA.Nextgenerationsequencingtechnologiesandtheirimplicationsforcropgeneticsandbreeding.TrendsinBiotechnology,2009,27:522530.
作者:郭子锋,王山荭,刘蓓,李文学,王红武
Copyright 2002-2023 www.qikanzj.com 京ICP备16051962号