Web开发

首页 » 常识 » 常识 » NucleicAcidsReswebT
TUhjnbcbe - 2023/3/20 20:35:00
白癜风贫困公益援助 http://m.39.net/baidianfeng/a_10949167.html

编译

程思雨

今天给大家介绍一篇由电子科技大学长江三角洲地区研究所(衢州)的邹权教授发表于NucleicAcidsResearch的一篇文章“webTWAS:aresourcefordiseasecandidatesusceptibilitygenesidentifiedbytranscriptome-wideassociationstudy”。作者在文章中介绍了一个名为webTWAS的新的数据资源,它集成了一个含有最全面的疾病GWAS数据集(目前可用的)的数据库,其中有由多个TWAS软件包确定的可靠的潜在致病基因集。

具体来说,从个高质量的可下载的欧洲GWAS汇总统计数据中,优先选择了广泛的人类疾病的个基因病关联。关联是根据三种流行且具有代表性的TWAS软件包,用七个不同的统计模型计算的。用户可以在基因或疾病层面探索关联,使用MeSH疾病树轻松搜索相关研究或疾病。由于疾病的影响具有高度的组织特异性,webTWAS应用组织特异性富集分析来识别重要组织。还有一个对用户友好的web服务器可用来对用户提供的GWAS摘要统计数据运行自定义TWAS分析。

1

简介

Gamazon等人在年首次提出了全转录组关联研究(TWAS),它已经成为研究遗传变异和疾病或与疾病相关的复杂性状之间关联的一种强有力的方法。TWAS利用基因型和表达数量性状数据的参考面板(如GTEx)来拟合一个能从基因型预测出目标基因表达的回归模型。该模型用于从全基因组关联研究(GWAS)的基因型数据中推算基因的遗传调节表达(GReX)。然后使用估算的GReX值来发现目标基因和感兴趣的表现型之间的关联。虽然全基因组关联研究(GWAS)也将成千上万的遗传变异与复杂的性状联系起来,但GWAS倾向于识别许多难以解释的非编码、内含子或基因间变异。这个问题是由于因果变异和非因果变异之间的连锁不平衡,它掩盖了因果变异对相关表现型的影响。TWAS通过优先考虑除了遗传变异之外的潜在致病基因缓解了这一解释问题。

近年来已经开发了十几个TWAS软件包,包括PrediXcan、TWAS-FUSION、UTMOST、FOCUS、MR-JTI、TIGAR、moPMR-Egger、kTWASTisCoMM等。为了更好地鉴定表型变异的遗传成分,许多研究都集中在提高GReX估算的准确性上。目前的方法通常使用线性模型,如PrediXcan中的ElasticNet变量选择模型和TWASFUSION的Bayesian稀疏线性混合模型(BSLMM)。为了缓解GTEx等参考面板中许多组织样本量低的问题,UTMOST将多个单组织关联分数结合到一个更强大的联合组织测试中,以量化整个基因疾病关联。根据引文统计,PrediXcan、TWAS-FUSION和UTMOST是目前最受欢迎的三个TWAS工具。生物学家已经使用这些新出现的TWAS软件包来识别和解释多种疾病和域中的致病基因,例如钙化性主动脉瓣狭窄、高级别浆液性卵巢癌、乳腺癌、老年*斑变性和精神分裂症。一些TWAS软件包也被修改以利用摘要统计数据,使生物学家能够分析越来越多的公开可用的GWAS摘要级数据集(例如dbGaP)。

虽然TWAS已经成功地应用于多种疾病的致病基因的发现,但有几个限制因素阻碍了TWAS的普及。首先,目前没有资源提供基于已发布的GWAS摘要统计数据的被TWAS发现的基因-疾病关联的全面清单。虽然有许多资源可用于记录GWAS的重要信号和变体(例如CAUSALdb、GWAS目录、GWASdb、GWASAtlas和GRASP),但是只有一个这样的资源可用于TWAS的发现。然而,TWAS-hub有很大的局限性,因为它只实现了一个TWAS软件包(TWAS-FUSION),只包含种疾病/非疾病特征,并且自年9月以来一直没有更新。第二,TWAS的性能在很大程度上取决于选择适当的因果(疾病相关)组织作为参考板,因为GReX对特定疾病具有高度的组织特异性。目前许多TWAS研究任意选择了一个参考组织,如“全血”,这限制了它们的统计能力。第三,TWAS软件管道的复杂性给生物学家进行自己的TWAS分析设置了重大障碍。

webTWAS数据库是为解决上述三个问题而开发的。webTWAS将三种最常见的TWAS方法(PrediXcan/s-PrediXcan、TWAS-FUSION和UTMOST)应用到一个包含大多数已发布的疾病GWAS数据集的精选集合中,并提供完整的摘要统计数据。webTWAS中的统计模型来自三个软件包:弹性网和Mashr模型来自PrediXcan/s-PrediXcan软件包,BLUP、Lasso、best-TWAS和Top1模型来自TWAS-FUSION软件包,关节组织GBJ模型来自于UTMOST软件包。一个方便的网络界面允许用户在多个研究中探索基因和疾病水平的疾病关联统计,并使用集成的MeSH本体树搜索相关疾病。用户可以方便地下载经过策划的GWAS摘要统计数据以及在webTWAS上找到的任何搜索结果。为了解决与疾病相关的组织特异性问题,组织特异性富集分析被用来从与特定疾病最相关的1-3个组织中优先选择参考板。此外,为了提高TWAS对生物学家的便利性和可访问性,webTWAS提供了一个web服务器应用程序,以便及时对用户上传的GWAS摘要统计数据进行定制的TWAS分析。

2

材料与方法

GWAS管理和本体映射

使用个高质量疾病GWAS摘要统计数据进行TWAS分析。整理GWAS数据的过程遵循我们之前发布的资源CAUSALdb。根据所调查的队列是来自UKBB还是非UKBB,收集了两类公开可用的GWAS摘要统计数据。队列数据收集自Neale实验室UKBBv3、GeneATLAS和GWASATLAS。尽管这些来源都来自于UKBB,但由于样本选择、质量控制过程和所使用的关联模型类型的不同,它们的摘要统计数据可能会有所不同。非UKBB组群包括GWAS公共数据库的摘要统计数据,如GWAS目录、LDHub、GRASP、PhenoScanner和db-GaP;以及来自联盟网站的摘要统计数据,如PGC、MAGIC、SSGAC和JENGER。

通过只保留具有最多可用信息的来源,可以删除来自多个出版物来源的重复摘要统计数据。只有在能够提取有关样本大小、总体和原始出版物的信息的情况下,来源才会被包括。种群信息被映射到来自基因组计划(1KGP)的五个超级种群(AFR、AMR、EAS、EUR和SAS)。webTWAS使用的GTEx参考面板主要由欧洲血统的个体构成,由于不同种群之间基因表达的差异,不适用于非欧洲个体的GTEx参考面板。因此,目前版本的webTWAS只包括来自欧洲超级种群的GWAS统计数据。每个GWAS报告的疾病都被人工映射到医学主题词医学中心。为了确保准确的特质映射,他们包括了来自数据源的附加信息的MeSH标签,与数据源相关的原始出版物,以及来自MeSH网站的相关术语。对于在UKBB群组中报告的性状,ICD10的描述以及UKBB展示中发现的相

1
查看完整版本: NucleicAcidsReswebT