肺动脉高血压知识库(bioinfom_tsdb)
bioinfom_tsdb
肺动脉高血压知识库

TSGene 2.0的数据收集以及如何使用TSGene 2.0:

1。TSGene 2.0数据库的数据收集

为什么使用TSGene 2.0

管理文献的肿瘤抑制基因

2。肿瘤抑制基因的信息

一般信息和文献证据

基因表达谱

基因调控

突变信息

蛋白质相互作用

3所示。查询和搜索数据库

文本搜索的肿瘤抑制基因

快速访问信息数据库

爆炸的所有蛋白质和核苷酸序列

4所示。浏览数据库

染色体和基因型

由不同癌症类型

通过突出显示通路地图

由pan-cancer基因表达模式

通过pan-cancer突变特性

5。数据下载并反馈给我们

下载页面

反馈

TSGene数据库的数据收集

为什么使用TSGene 2.0(最高)

自2013年我们出版TSGene 1.0以来,我们收到了很多询问关于我们TSGene的更多细节。柴鸡蛋,越来越多的癌症数据集,尤其是来自pan-cancer研究,我们发表TSGene以来被释放。在这个更新版本中,我们收集了数以百计的其他文献的肿瘤抑制基因。TSGene2.0现在包含1217个人类基因(1018 199编码和非编码基因)策划的超过9000 PubMed抽象。

TSGene 2.0的主要目的是支持癌症研究通过维持一个高质量的肿瘤抑制基因pan-cancer分析列beplay苹果手机能用吗表。这个数据库提供一个全面的、完全分类,丰富和准确的注释的肿瘤抑制基因知识库,广泛的交叉引用和查询接口自由访问科学界。在这个更新版本,新特性包括:

  • 1,一个额外的572年新报告的肿瘤抑制基因从文学策划被添加到TSGene 2.0。而71年肿瘤抑制与文学证据TSGene 1.0被排除在外,如下图所示。在图中,CG代表了来自宇宙的癌症基因的基因普查;ESS是人类重要的基因;从网络和NCG包括基因癌症基因数据库。
  • 2,Pan-cancer发现数百个基因表达分析常见的肿瘤抑制基因显著抑制多种癌症类型。
  • 3,pan-cancer突变模式帮助用户优先考虑高度突变的癌症类型,比较蛋白质功能域的突变热点。我们现在包括数据可视化功能丧失(LoF)之间的比较突变、错义突变跨多个癌症类型。

管理文献的肿瘤抑制基因(最高)

帘的肿瘤抑制基因文献包括五个步骤:1)。详尽的搜索相关摘要PubMed和Generif数据库使用关键字“肿瘤抑制基因;2). extracting the description for the tumor suppressor gene from text; 3). grouping the descriptions extracted from PubMed abstracts and Generfi records by their topics using Entrez related topic function; 4). extraction of gene name from the grouped descriptions of the tumor suppressor genes; 5). genes mapping the gene name to Entrez geneID.


详尽的搜索:
找到准确的提取相关的肿瘤抑制基因,我们搜索PubMed使用表达式:“肿瘤抑制”[标题]不是(P53[标题]或TP53[标题]),返回6178 PubMed抽象在25日,2015年4月。接下来,我们从3719年PubMed的抽象提取的5454句Generif数据库25日,2015年4月。结合两个详尽的搜索,我们下载所有的文学Medline格式解析。


提取描述:
评价肿瘤抑制基因的信息,包含肿瘤抑制的句子是从超过9000 PubMed抽象提取的。TSGene 2.0,我们只手动策划文学不包括在TSGene 1.0数据库。


摘要:
所有下载的抽象分组基于主题根据Entrez提供的相关文章。快速、轻松地,这允许我们评估是否以及如何确定基因的名字是高度与TSGene 1.0中已知的肿瘤抑制基因。同时,它允许我们访问如果和这些引用如何与其他策划引用从TSGene 1.0。


内容管理:
在这一步中,我们阅读摘要,评估给定的上下文,并将相关评论和功能添加到条目。经常通过阅读摘要,我们可以看到,描述基因属于肿瘤抑制基因。在这些情况下,是注意观察其他引用相同的基因。每个肿瘤抑制的描述行添加新条目。把抽象的9927060作为一个例子。从它的标题是“抑癌基因PTEN抑制细胞入侵,移民,和增长:微分粘着斑激酶和p130Cas的参与,“很容易得出结论PTEN是一个肿瘤抑制基因。


映射的基因符号:
一个主要步骤的过程中组织一篇文章是文本中的基因名称映射到一个Entrez基因ID,这将作为初始信息交联的基因在其他公共数据库中。多是注意同义词的基因标志。把抽象的16828757作为一个例子:它包含句子,“潜在的肿瘤抑制活性CCS-3可能由其与PLZF互动。”In this sentence, CCS-3 was the synonym ofEEF1A1在当前Entrez基因数据库。

肿瘤抑制基因的信息(最高)

六个不同类型的页面上的信息,包括一般信息视图,文学强调的观点,基因表达的观点,基因调控的观点,基因突变的观点,基因交互视图

一般信息页面如下:

在这个页面中,用户可以找到数据源和策划文学描述的肿瘤抑制基因。很容易转向其他注释通过单击超链接在页面的顶部。


用户可以找到的细节文献与文学突出关键字高亮显示页面如下。关键字“肿瘤抑制”被标记为红色;关键词如“癌症”和“路径”标志着棕色;和关键字类别的“致癌基因”用绿色突出显示;关键字“突变”和“表达”等标记为黑色,如下所示。



基因表达页面如下:

在这个页面中,用户可以找到肿瘤和正常组织中的基因表达总结从11 TCGA癌症类型。类似于以前的版本,从184年人类肿瘤的基因表达谱样品和84正常组织样本BioGPS也提出了。很容易查看样本信息的184个肿瘤样本通过单击超链接在这个概要文件的图像。一些基因有多个探针;为用户提供一个公正的观点,我们提出了从所有探测基因表达式没有任何修改。


基因调控的页面示例:

TSGene2.0,我们添加了每个肿瘤抑制基因的上游microrna基于实验验证小分子核糖核酸注释miRTarbase数据库(2015年6月16日)。类似于我们的以前版本,转录因子调控和转录后修改的信息集成TRANSFACdbPTM数据库。此外,启动子区域的甲基化是基于数据的注释DiseaseMeth数据库。


基因突变的页面示例:

收集所有相关突变的宇宙(V72)数据库;我们进一步突变分为三个主要类型,包括“替换”,“插入和删除,”和“其他突变。”


探索多种癌症的癌症突变模式和功能域,我们首先使用块棒棒糖可视化点突变在功能域每次数。蛋白质域注释从UniProt注册数据库。这些情节将帮助用户获得快速印象的热点突变网站每个次数(参见示例如下)。此外,我们使用圆的大小来表示数量的突变。相对更多的突变是策划的网站更大点。


概述最普遍的癌症突变,我们专注于17个主要癌症类型和绘制每个癌症的突变频率。

最近研究名为“累积Haploinsufficiency非整倍体和Triplosensitivity驱动模式形状癌症基因组”(2013年,细胞)显示,肿瘤抑制基因的累积Haploinsufficiency和Triplosensitivity可能推动癌症异倍性。提供消化信息,我们比较丧失突变的突变模式相比,错义突变的肿瘤抑制使用宇宙数据。我们定义了从宇宙丧失突变使用以下注释:删除——转移,整个基因缺失,复杂——删除inframe删除——在框架,插入——转移,转移,替换——废话。接下来,我们数了数为每个肿瘤抑制丧失突变、错义突变。最终结果表示为一个酒吧下面的情节。情节,蓝色显示的相对数量的损失函数突变和绿色显示的相对数量错义突变。使用这些情节,我们发现TP53显示完全丧失功能变异模式。PTEN是中间的两类突变。AKT1代表的损失函数小于TP53突变特性。BRCA1显示略强的损失函数的突变模式而错义突变。 By using this mutation pattern bar plot, users can obtain an overview of tumor suppressor mutational characteristics more easily.


基因交互页面出现如下:

收集所有相关的蛋白质相互作用的PathwayCommon数据库;我们进一步划分为三个主要类型的交互,包括“物理交互,”“代谢相互作用”和“信号相互作用。”

针对数据库查询和序列的搜索(最高)

所有的肿瘤抑制基因及其注释搜索我们的数据库。文本搜索(查询)和基于爆炸(爆炸)提供。

各种注释的文本搜索我们的数据库

用户可以搜索对TSGene通过输入次数的名字,加入id和其特点,包括基因组位置、监管、互动合作伙伴,突变,生物通路和基因疾病。总的来说,我们为用户提供了四种不同的搜索表单,包括“基因一般信息搜索”、“文献检索”、“突变搜索”,和“其他注释搜索”允许用户访问的一般信息,以信息、突变,分别和其他注释信息。

执行的搜索是在任何领域单独或成几个字段输入关键字查询中同时形式。一般来说,文本搜索信息在每个搜索形式主要包括三个步骤。下面以基本信息查询为例。

  • 选择特定的注释或字段下拉菜单的基本的基因信息查询和变异形式。

  • 输入你的有趣的关键字。

  • 此外,基本的基因信息查询和变异形式支持逻辑”,“‘或者’和‘不是’运营商结合多个关键词。

    搜索结果显示的列表匹配的肿瘤抑制基因与基因的详细信息页面。

    快速搜索的基因列表数据库:

    快速访问数据库中的信息,快速搜索表单提供了每个页面的顶部。



    我们所有的基因序列数据库

    在爆炸中菜单,用户可以搜索TSGene数据库基于他们的输入序列。高相似性肿瘤抑制基因与输入序列将在爆炸中被列出的结果页面。在输入页面,用户可以选择各种序列比对选项如创造价值和身份。匹配的序列特征可视化与彩色条包含查询序列比对的得分。

    做一个序列搜索所有的肿瘤抑制基因,请访问爆炸页面。

    爆炸的输出如下

    爆炸的结果页面中点击超链接,用户可以访问数据库的肿瘤抑制基因。


  • 浏览数据库(最高)

    TSGene数据库支持浏览使用癌症类型肿瘤抑制基因和KEGG通路地图。在癌症类型页面,用户可以探索肿瘤抑制基因在特定癌症很容易在组织从NCI癌症类型。此外,为了帮助用户得到一个鸟瞰肿瘤抑制基因的生物学过程,标志着KEGG地图。

    用户可以浏览TSGene的肿瘤抑制基因注释特性列表而不是癌症分类和标记KEGG地图。TSGene还支持基于注解的浏览包括染色体、基因型、数据源,数据质量。

    浏览通过染色体和基因类型

    浏览器页面,用户可以使用六个访问肿瘤抑制基因列表浏览功能:基因位置,TCGA pan-cancer基因表达分析结果、宇宙pan-cancer突变模式,基因类型,主要的癌症类型和KEGG通路有关。对于基因类型,用户可以找到所有的蛋白质编码和在浏览器中最近报道的肿瘤抑制基因非编码页。

    用户可以很容易地据NCI癌症classifiction浏览器所有癌症类型系统。

    用户还可以visulize所有KEGG通路与肿瘤抑制基因记录在我们的数据库。


    或所有编码蛋白质的次数,我们也进行肿瘤和正常之间的微分表达式分析样品在11个癌症类型。我们首先提取RNASeqV2规范化TCGA基因表达数据使用R包TCGA-Assembler(数据发布日期是1月- 05 - 2015)。我们进一步进行t检验次数,每机构在每项癌症类型比较正常和癌症之间差异基因表达模式样本。使用修正后的假定值0.05截止,我们确定了数以百计的次数,显著抑制肿瘤样本。提供一个鸟的表达趋势跨越多种癌症,我们还绘制所有次数的表达在正常和癌症样品11个类型。

    在最近的研究比较肿瘤抑制和致癌基因,这表明,累积haploinsufficiency triplosensitivity肿瘤抑制可能推动癌症非整倍性,我们在数据库基于分类次数丧失突变和误义突变之间的比率。情节,蓝色显示的相对数量的损失因数突变和绿色是相对的错义突变。使用这些情节,我们发现TP53展示完全丧失功能的突变模式。PTEN是显示在中间的两个突变的类别。AKT1也显示损失函数小于TP53突变特性。其他例子BRCA1是有点强功能变异模式比较错义突变。通过使用这个酒吧情节突变模式,使用可以获得更容易肿瘤抑制突变特征的概述。


    数据下载和反馈(最高)

    数据是免费供学术使用。用于商业用途,请联系我们。可以从下载的数据下载页面。


    我们希望你能帮助我们提高我们的数据库。

    如果你有任何建议,或知道一些信息是不正确的,或者有新的肿瘤抑制基因(包括编码和非编码),请寄给我们电子邮件



    ”)
    Baidu