文献标题


The Cancer Genome Atlas Pan-Cancer analysis project

PMID

24071849

发表日期

2013-10

关键词

  • TCGA
  • Cancer Project
  • Pan-Cancer analysis project

概括

TCGA:

TCGA是一个由美国国立卫生研究院(NIH)发起的一个大型肿瘤研究项目(2005年启动)

  • > 30中癌症亚型
  • > 1万个肿瘤样本
  • 基因组、转录组、DNA甲基化、蛋白质组

TCGA Pan-Cancer analysis project:

Pan-Cancer analysis project是TCGA项目的一部分,于2012年启动,旨在利用TCGA数据库中不同类型的肿瘤中产生的大量数据(DNA、RNA、表观、蛋白水平),进行整合分析,寻找潜在非肿瘤特异的的肿瘤标志与靶点,并通过增加样本量以期识别出更多肿瘤特异的分子异常。

好词好句

单词

  • molecular aberrations
  • affect therapeutic response
  • promote oncogenesis
  • positive-selection systems
  • chromothripsis 染色体碎裂
  • chromoplexy (involve the breakage and rearrangement of chromosomes at multiple loci, and kataegis)
  • recurrent events across tumor types
  • global transcriptional signature
  • comprehensive perspective across tumors
  • independent of histopathologic diagnosis
  • shared molecular patterns
  • etiologic 病因学的
  • therapeutic 治疗学的
  • histology 组织学
  • reverse-phase proten arrays (RPPA) 反相蛋白阵列技术
  • whole genome duplication events
  • delineate 描绘
  • demographic 人口学的
  • infectious 有传染性的
  • microdissection 显微切割
  • cell sorting 细胞分选
  • stromal cells 基质细胞
  • mass spectrometry 质谱分析法
  • longitudinal genomic studies 纵向的,经线的
  • heretofore 至今如此
  • predispositions 易患病体质
  • uniqueness 独特性
  • vulnerabilities 缺陷
  • daunting 令人畏惧的
  • metastatic 转移性的
  • pharmacological 药理学的

句子

  • The resulting rich data provide a major opportunity to develop an integrated picture of commonalities, differences and emergent themes across tumor lineages.
  • The use of large cohorts has enabled DNA sequencing to uncover a list of recurrent genomic aberrations (mutations, amplifications, deletions, translocations, fusions and other structural variants), both known and novel, as common events across tumor types.
  • A prime example is provided by the NOTCH gene family, which is inactivated in some squamous cell cancers of the lung, head and neck, skin, and cervix but activated by mutation in leukemias.
  • Importantly, integrative interpretation of the data will help identify how the consequences of mutations vary across tissues, with important therapeutic implications.
  • The goal of the Pan-Cancer project is to identify and analyze aberrations in the tumor genome and phenotype that define cancer lineages as well as to identify aberrations that transcend particular lineages.
  • Analyses of the epigenome, transcriptome and proteome show a strong influence of tissue on the state of altered pathways in tumor cells.
  • Further increasing the number of samples per tumor type and the variety of tumor types will improve our ability to detect rare driver events in heterogeneous tumor samples
  • This expanded analysis will bring focus to disruptions in promoter and enhancer sites and aberrations in noncoding RNAs, as well as the genomic integration processes at work in tumor evolution that result from mobile endogenous and exogenous DNA elements such as retrotransposons and viruses.

笔记

单一肿瘤研究

  • 高质量的单一类型肿瘤大样本数据可以发现新的驱动基因突变、分子标志,并通过这些标志物将某一肿瘤进一步细分。

  • 随着各类新兴技术的开发和应用(表观修饰、单细胞、三代测序等等),越来越多可以被应用于癌症分子分型和靶向治疗的分子标记物被发现。

  • 某些肿瘤类型特异的一些低频分子异常(mini-driver)需要更多的样本进行识别。

多肿瘤研究

  • 通过多肿瘤研究,可以发现在不同肿瘤中共同存在的一些致病异常(突变、CNV、染色体结构变异),从而有助于开发具有普适性的治疗药物。

  • 有时同一基因的异常在不同肿瘤中呈现了完全不一样的效果(既可以是癌基因又可以死抑癌基因)。

项目启动

TCGA在2012年10月26-27日加州圣克鲁兹举行的会议上启动Pan-Cancer分析项目,最初是整合12种类型的肿瘤数据进行分析。

项目提出的几个问题

  • 是否可以通过整合多个肿瘤类型的数据增加识别出驱动基因突变的统计学显著性?
  • 基因组结构变异的组织特异性?
  • 当整合分析这些不同肿瘤数据时,哪些通路异常比较重要?
  • 我们能否通过增加样本量识别出分子异常的共存与互斥关系?从而找出其中的驱动性事件?
  • 我们能否从组织无关的异常中识别出组织特异的分子亚型?
  • 哪些肿瘤事件是可以在不同肿瘤中进行扩展的,比如某个分子异常在A肿瘤预后交差,是否在B肿瘤也适用?

项目的限制(多研究小组)

  • 数据产生过于复杂,平台、技术都可能有一定差异、时间跨度大,需要识别批次效应并保留生物学信号
  • 整合分析的复杂性,没那么容易去直接用数据来评估某些指标(人群特征、行为环境、临床预后)
  • 人们收集数据时的限制性(一般只会收集人们认为相关的数据),没有一个统一的规范去指导人们应该需要哪些数据
  • 传染性的原因,如病毒只在某些类型的肿瘤中被识别
  • 不同肿瘤有其自身的体系,很难去通过多肿瘤研究方法来分析单一肿瘤的时间序列
  • 肿瘤中同一事件可能会带来不同的结果(如同一融合基因的病人有不同表达谱)

将来的方向

  • 非编码区(基因组非编码区与非编码RNA)
  • 病毒相关(病毒整合,EBV、HBV等)
  • 构建通路网络谱
  • 根据分子标志来设计临床队列研究

Figures&Tables


Fig 1


Fig 2


Table 1


TCGA Mission


TCGA Pan-Cancer Tasks