eQTL的全称是expression quantitative trait Loci,译为表达数量性状基因座。eQTL分析本质是在经典的连锁分析(基于家系群体)或全基因组关联分析(基于自然群体)中,使用基因表达信息(通常使用转录组检测的RNA表达丰度)作为表型,开展基因表达量与基因型间的相关性分析。通过eQTL分析,我们可以解析基因(DNA)突变对基因表达的调控关系,进而进一步从基因突变→基因表达→性状变化的角度解析复杂性状的调控机制。

 
 
 
 
应用领域
所有待研究基因型-基因表达关系的材料都可以开展eQTL分析。且eQTL分析结果可以进一步用于解析动植物各类数量性状、人类各类复杂疾病的调控机制。
 
 
 
 
技术路线

备注:转录组数据也可以用检测基因型(检测SNP)。因此仅仅基于转录组数据,也可以开展eQTL分析。

但转录组测序无法检测基因间区的变异,因此为了得到更广泛的eQTL信息,建议采用全基因组重测序进行变异检测。

 

 

分析内容

1.标准分析
1)变异(SNP)检测
2)表达量检测
3)eQTL分析
 
2.高级分析
1)eQTL与靶基因数量统计
2)cis/trans QTL 分类与统计
3)eQTL位点相关基因的功能富集分析
4)eQTL热点分析
3. 个性分析
1)特定类型eQTL分析(例如 splicing eQTL,response eQTL)
2)不同eQTL网络的比较
3)关键eQTL位点上下游的解析
4)eQTL SNP与表型GWAS SNP的比较。
 
 
 
 
 
 
 
样品要求

1.全基因组重测序:DNA浓度≥30ng/μL;总量≥6 μg ;OD260/280 = 1.8~2.0;

2.转录组测序:以对应转录组测序要求为准;

3.推荐样本数:大于300个;

 
 
 
项目周期
一般在70个工作日,具体完成时间视项目具体规模(样本数和表型种类数)而定。
 
 
 
 
参考文献

[1] Lee M, Ye C, Villani A, et al. Common genetic variants modulate pathogen-sensing responses in human dendritic cells.[J]. Science, 2014, 343(6175): 1246980-1246980.

[2] Takata A, Matsumoto N, Kato T, et al. Genome-wide identification of splicing QTLs in the human brain and their enrichment among schizophrenia-associated loci[J]. Nature Communications, 2017.

[3] Wang X, Chen Q, Wu Y, et al. Genome-wide Analysis of Transcriptional Variability in a Large Maize-Teosinte Population[J]. Molecular Plant, 2017, 11(3): 443-459.

Zhu G, Wang S, Huang Z, et al. Rewiring of the Fruit Metabolome in Tomato Breeding[J]. Cell, 2018, 172(1): 249-261.

[4] Galpaz N, Gonda I, Shemtov D, et al. Deciphering genetic factors that determine melon fruit‐quality traits using RNA‐Seq‐based high‐resolution QTL and eQTL mapping[J]. Plant Journal, 2018, 94(1): 169-191.

 

 

Q1: eQTL分析有什么优势?

A: 1)帮助GWAS结果锁定功能基因

2)解析机制,eQTL分析将基因型、表达量以及表型的三类关系整合(交集),就可以构建:DNA→ 基因表达表型的关系网络。从而解析DNA突变影响表达的机制

 

 

 Q2eGWAS和phGWAS的分析方法一样吗?

A: eGWASphGWAS本质一样,只是用了不同信息作为表型。但eGWAS运算量非常大。因为表型数量大,例如人类有2万个基因。解决方案:1)预过滤基因,减少表型数量;2)采用特定更高效的软件,例如Matrix eQTL

 

 

Q3: eQTL热点怎么判断?

A: 如果一个位点可以调控多个基因,本质上这就是一个eQTL 热点(hotspot);转录因子相关突变就往往是eQTL热点(突变会导致大量靶基因表达变化)

 

在人类的GWAS研究中,位于基因CELSR2 的3’UTR区的若干个SNP与血清低密度脂蛋白胆固醇(LDL-C)相关,是与心肌梗死(MI)相关的风险位点。

如果按照一般的逻辑理解,我们或许会以为是3’UTR区的突变,影响了miRNA的调控,从而影响CELSR2的翻译,最终导致疾病。但通过eQTL分析以及后续的多群体重复验证,研究人员发现表达量与这个区域的突变最相关的基因不是CELSR2,而是位于这个3’UTR区40k下游的SORT1。

虽然最显著相关的SNP rs12740374看似位于基因CELSR2内,但这个位点缺失转录因子C/EBP的结合位点。这个位置的突变,直接影响了其下游40k处的SORT1的表达(中间隔了两个编码基因,居然还能调控到,应该是染色体的三维结构有关),从而影响LDL-C的代谢。

图1 3’UTR区的突变影响转录因子结合,从而调控下游基因表达

 

参考文献

Musunuru K, Strong A, Frank-Kamenetsky M, etal. From noncoding variant to phenotype via SORT1 at the 1p13 cholesterollocus[J]. Nature, 2010, 466(7307): 714-719.