微信精粹
首页 >   gene-denovo >   群体重测序之基因定位精度的决定因素       Ctrl+D 把这个网页收藏起来,方便下次查看

群体重测序之基因定位精度的决定因素

gene-denovo   2016-12-29

上一期分享周老师跟大家讲到功能基因的定位方法——连锁分析方法原理(戳这里查看~),今天来聊一聊基因定位精度的决定性因素。


在电泳时代,基因定位的精度一个限制因素之一是分子标记密度。不过随着高通量测序的广泛应用,分子标记的数量对于基因定位来说不但足够,简直就是过剩。那么材料本身的特性——染色体片段的重组程度,就成为了基因定位精度的决定性因素




在表型和基因型的相关性分析中,表型的最小单位是某个性状,而基因型的最小单位不是碱基,不是基因,而是染色体片段。如果某个染色体片段在这个群体中没有重组,那么就是这个片段就是这个群体表型-基因型相关性分析的最小片段。


例如下图1,是某个群体(10个个体)的某条染色体基因型示意图。我们可以注意到大括号标注的染色体1号和2号区域内,在这个群体中都没有重组(个体要么这个片段是红色,要么是蓝色,所以在这个区间没有重组发生)。这个染色体片段是群体中基因型的最小单位,因此在开展连锁/关联分析的时候,理论上这个区域内所有分子标记的显著性都是相似的。这也解释了,基因定位结果是个有宽度的峰(图2),而不是一个单一点。这个染色体片段的区间大小,就是这个群体QTL定位精度的极限。依赖于初级杂交作图群体的BSA或QTL定位,几乎不可能把基因定位到厘摩尔级别(或1Mb以内),因为人工群体难以在有限的群体规模或杂交代数的情形下创造足够多的重组(或者说足够小的最小重组片段)。


按照我们的经验,在一个群体大小在100~300大小的初级作图群体中,1个QTL区间可以跨越的范围大概是5~10cM。1cM在水稻中平均大概是300kb,在玉米中平均大概是1.3Mb,所以你可以估算一下10cM的定位区间大概对应多大的范围。



图1 染色体重组最小片段


当然,你也注意到了在图1中,不同区域的最小重组片段大小不同。那是因为染色体不同区域的重组频率不同。通常,染色体着丝粒区(常常在染色体中段)重组较少,端粒区(常常在染色体末端)重组更加频繁。来个图形,你的理解会更加清晰。



图2 连锁分析(左图)和关联分析(右图)结果是个有宽度的峰(区间),不是一个点


图2来自我们公司玉米遗传图谱合作文章[1]。图中X轴是物理坐标,Y轴是遗传坐标,蓝色原点和红色三角形分别代表两个不同作图群体的分子标记数据。总体而言随着物理坐标的增加,遗传坐标也是对应增加,这条曲线的斜率就代表遗传/物理距离比,即单位物理距离(Mb)可以产生多少重组。


我们可以看到这条曲线的斜率并非稳定的,在染色体两侧陡峭(这些区域重组率高),而在中心区域平坦(重组率低)。尤其在着丝粒附近(就是那条黑色竖虚线的位置),你可以注意到从30Mb~100Mb的范围内,物理坐标变化了70Mb,而遗传坐标几乎没有变化。这意味着,这个区域几乎没有重组。


所以QTL定位过程中,如果目标基因落在这类区域,你可以会看到一个跨度达到几十Mb的峰,无形中也增加了定位的难度。SO,对于科研,我觉得人品和实力同样重要(O(∩_∩)O。 



图3 玉米3号染色体体的遗传/物理累积图距示意图


因此,对于基因定位来说,基于某个群体的定位精度极限是群体本身的特性决定的。要尽可能减少最小重组片段的大小,提高定位精度,就只能创造条件让染色体有更多重组,这就需要从3个方面入手:


  1. 增加群体规模——当群体足够大,哪怕万分之一概率的重组事件也能发生。

  2. 增加杂交世代数——即使杂交一代不重组,多代总是可以提高概率的。

  3. 减少其他信号的干扰。在连锁分析中,很重要的是减少背景QTL的干扰(在复合区间作图中讨论过),最有效的方法就是通过回交纯化遗传背景。在关联分析中,更重要的是减少群体结构的影响(在下个章节我们会介绍)。


关于经典的QTL定位过程是如何进行的,之前小师兄解读过一篇经典的文章,可以供大家参考(戳这里查看~)。在这篇文章中,作者采用回交的方法纯化了遗传背景(对于数量性状,这非常重要),然后使群体有效地加大了重组频次,目标基因定位到了一个非常小的范围。


《大牛是这样玩转基因精细定位与克隆》

http://www.omicshare.com/forum/thread-1348-1-12.html


当然,随着其他各类技术的发展,我们QTL定位不需要再定位到一个非常狭窄的区间才能确认目标基因。其实只要定位到一个大概的范围,然后结合其他信息、技术也足以帮助我们从一堆候选基因中命中目标。我们拥有的技术、信息包括:


  1. 1个良好的基因组,本身有良好的注释信息,有助于我们从较大的区间范围筛选候选基因;

  2. 合理的实验设计,例如连锁分析和关联分析的结合(下文再讨论),亲本的合理选择等,也有助于加速定位效率;

  3. 结合其他组学技术,尤其是基于转录组数据的表达差异,以及更高端的调控网络分析,有助于我们筛选候选基因(我们下文会讨论);

  4. 分子实验技术的发展,尤其是基因编辑技术(例如,Crisper技术)的发展,也为大规模的功能实验奠定而来基础。


尽管如此,除了遗传背景高度简单的人工突变(例如,试剂ems诱变),可以使用mutmap类似的策略实现快速定位和基因筛定。如果是自然材料,sorry,基因定位的过程还是有很多不确定的因素,还是需要慢慢来。



往期群体重测序文章请戳下面的题目查看:

群体重测序之适应性进化与功能基因定位

群体重测序之突变、分化与适应性选择

群体重测序之连锁分析的方法原理


参考文献:

[1] Liu H, Niu Y, Gonzalez-Portilla P J, et al. An ultra-high-density map as a community resource for discerning the genetic basis of quantitative traits in maize[J]. BMC genomics, 2015, 16(1): 1.

文献解读/技术贴/教程贴/前沿资讯,

每天一篇干货分享给你~

做行业内最具干货的公众号!

我们的梦想在未来,

基迪奥能助您达到更高的科研领域!


( 版权归本文原作者所有,不代表本站支持作者观点,2016年12月29日。阅读原文 )
立刻分享给您的朋友:
本文作者介绍
gene-denovo
微信号: gene-denovo
广州基迪奥生物官方公众平台,小圆每天分享各种生信软件使用技巧, 搜罗好玩的科研生活,定期还有掉节操的生物界八卦分享,让科研变得有意思咯~
扫描上方二维码可关注作者
用甲基化数据做CNV可靠性如何?
可靠,妥妥的!
2017-05-27
如何绘制精美的PCoA图形?
三个步骤~
2017-05-26
环状RNA的多组学关联思路
关键在于找到起桥梁作用的miRNA~
2017-05-25
代谢组学入门十问!
信息量大。
2017-05-24
如何在24h内拿到细胞器基因组的进化树
一天之内拿到树,你也可以!
2017-05-23
宏转录组测完之后要不要验证?
用Qpcr吗?
2017-05-23
环状RNA翻译和常用验证方法介绍
下周四约定你哦~
2017-05-18
如何挖掘微生物抗性基因?
一招教你挖掘抗性基因
2017-05-17
DNA甲基化如何被写入和擦除?
甲基化的形成机制~
2017-05-16
加印啦加印啦!《转录调控专题讲解》你领了吗?
第二批紧急补货啦~
2017-05-15
查看更多“gene-denovo”的文章...
微信精萃 - 发现每一天的美好 www.wxhaowen.com
欢迎更多公众号加入本站,要加入请联系我们。本站转载的文章版权归原作者所有,转载并不代表本站支持作者观点。 SiteMap
京ICP备16023921号-1 联系邮箱:wxhaowen@126.com