来自Illumina 的一个英文癌症综述:《Cancer Research Review》
本文1.9万字,那篇综述涵盖了癌症研究的各个方面。文末保举一本很不错的癌症科普书。
癌症,一种慢性的基因病。
简介
在癌症研究中,每个癌症样品呈如今研究人员面前的已经是一个发作了改动的基因组,此中包罗着奇特且难以预测的诸多点突变、序列的插入缺失、易位、交融以及其他畸变。而且,那些发作的变异中,许多往往都是之前所未察看到的(Novel mutations),它们也不会只存在于基因组的编码区域中,因而为了可以实正做到全面研究癌症基因组自己所发作的所有突变事务,全基因组测序已被视为肿瘤基因变异研究中独一严谨的办法。
然而,在所有那些变异中,却只要少数的几个主导着癌症那一疾病的开展和演变。要有效提醒那一演变和开展的过程,就需要监控基因表达程度上的变革,那么RNA-Seq即是用以确定那些遗传改动能否会影响疾病开展有用手艺。但遗传改动有可能影响所有的细胞过程,包罗染色量构造、DNA甲基化、RNA剪接异构体、RNA编纂和microRNA(miRNA)等。那就意味着,只要对所有那些独立的过程都停止检测和综合阐发,才气在癌症研究中获得实正的打破。那些内容我们都将鄙人文逐个展开。
当前基因组测序手艺的一大特点是在于可以在很短的时间内并行测得数十亿(以至数百亿)的独立序列片段——read,而每个read来源于单个的DNA分子。由此产生的数据我们可将其视为是对DNA分子的随机抽样,那反过来代表肿瘤样品中每个细胞的基因组的情况。那是我们解开癌症的原因和机造的一种强大东西。
肿瘤异量性
癌症基因组的突变是复杂的。
每小我都照顾一套奇特的来自父母遗传的胚系突变(germline mutations)信息。但跟着癌症的开展,体细胞突变(Somatic mutations)和基因组重排(genomics rearrangements)会逐步增加。那些改动往往会引发耐药性以及转移。越来越多的研究证据表白,那些过程竟然能够是有意的!——它们其实能够认为是癌细胞面对药物刺激的过程中不竭进化的成果。我们想要全面天文解那一复发和耐药性的原因,就有需要停止纵向尝试,根据癌症的开展过程,分阶段收罗样品来停止研究。
如上图,那是处于一般组织布景下的多克隆肿瘤(polyclone tumor)。大大都的肿瘤样品城市同时包罗肿瘤细胞和一般细胞,如基量细胞、血管和免疫细胞。而且肿瘤自己也常常包罗几种差别的克隆亚型(clone types),每一种都有着差别的治疗反响和复发可能。
按照传统病理学的估量,大部门研究的成果其实都只集中在那些肿瘤细胞比例 >60% 的区域中。而且为了确定哪些突变是肿瘤特异的,凡是都要包罗来自统一个别的一般组织样本做为参考。
然而,肿瘤自己也往往是异量性的。在癌症开展的过程中,个别细胞会发作新的突变,包罗那些新突变的细胞会继续增殖,构成克隆亚型。因而,关于晚期癌症我们凡是检测到的都是一个多克隆肿瘤,此中每一个克隆有一套奇特的突变信息、奇特的病理学和药物反响机造。那其实也恰是癌症难以完全治疗的原因,而它的那种异量性其实恰是肿瘤基因组复杂性招致的一种表型性量。目前的深度测序能够检测样本中含量低至1%的克隆。
肿瘤内的异量性。体细胞突变的逐渐累积产生了一个异量的多克隆肿瘤,此中差别克隆可能对治疗的反响差别。
并且,异量性一般还能够分两种情况讨论,第一种情况指的是:统一个病人的肿瘤细胞具有异量性。处于肿瘤发作的差别期间的肿瘤细胞的基因突变情况差别,培养了每一个肿瘤细胞群体内还有许多亚群(subclones),肿瘤细胞在通过转移时,就会有属于差别亚群的肿瘤细胞去侵入新的处所,构成新的肿瘤;第二种情况指的是:除了统一病人的差别肿瘤细胞会形成肿瘤的异量性外,肿瘤的异量性还表现在差别病人可能得了不异的肿瘤,但是阿谁『不异』未必实是不异——仅仅是表型不异,不代表着基因型也不异。
在某些基因中,突变频繁发作在统一个位置,那应该有特定的机造在起感化,那些有规律性的情况城市略微容易对于。然而遗憾的是,关于大大都的基因,突变显然是随机呈现在整个基因中的,那其实申明了DNA的复造和修复机造失灵了。
图中为两个假定的基因,他们有着两种差别的突变形式。深灰色框代表外显子组,而红色柱子代表存在突变的位置。A: 特定位置的频发突变可能暗示有产生突变的生物学机造的参与。B: 散发突变存在于整个基因中,如P53,可能是因为复造和修复机造的失效。我们能够通过测序检测那两种情况下的突变。
参考文献
2012年Ding Li等人颁发在Natrue上的一项研究弄清了急性髓细胞白血病(AML)的复发原因。他们发现了两个一般机理:(1)原发肿瘤中的始发克隆(founding clone)获得突变,进化成复发克隆;(2)始发克隆的一个亚克隆挺过了初度治疗,获得了更多突变并在复发时增殖。在一个病例中,原发肿瘤里本来仅占5.1%的亚克隆在复发后却生长为次要的克隆。并且关于所有的病例,化疗其实不可以肃除那些始发克隆。那项研究间接表白了在诊断后和初度治疗后检测并肃除掉那些本来不起眼的小细胞群体有多么的重要!
Ding L., Ley T. J., Larson D. E., Miller C. A., Koboldt D. C., et al. (2012) Clonal evolution in relapsed acute myeloid leukaemia revealed by whole-genome sequencing. Nature 481: 506-510
同样是2012年,同样是Ding Li那波人,同样是研究AML,他们此次发现大约三分之一的骨髓增生异常综合征患者会开展成继发性急性髓细胞白血病(AML)。那个研究的目标是为了确定骨髓增生异常综合征中的突变,它们有可能预测AML的停顿。他们对七名继发性AML患者的七组皮肤和骨髓样品以及先前的骨髓增生异常综合征的配对骨髓样品一并做了全基因组测序。成果发现,在所有病例中,占主导地位的继发性AML克隆都是来自一个骨髓增生异常综合征的始发克隆。那其实就是说,骨髓增生异常综合征样品包罗了对预后很重要的突变,针对那些突变的治疗计划是可能改善预后的。
Walter M. J., Shen D., Ding L., Shao J., Koboldt D. C., et al. (2012) Clonal architecture of secondary acute myeloid leukemia. N Engl J Med 366: 1090-1098
继续肿瘤治疗和预后的话题,Gerlinger M那一波人倡议了一项研究,操纵全外显子组测序来研究多个样品,那些样品不只来自两名患者体内的原发肾癌,还包罗了患者相关转移部位的空间分隔区域。最初,他们在原发肿瘤中看到了普遍存在的异量性现象!并且还出格指出了在每个肿瘤区域内有63%-69%的体细胞突变是无法检测到的。同时,还检测了统一肿瘤差别区域内预后优良和不良的基因表达特征。那其实仍是凸起了在突变积累之前早期诊断的重要性,以及对较大肿瘤需要停止多个部位的活检。操纵统一名患者的多个样本得到的信息,他们可以重建疾病的开展历程!那是一种极为强大的办法,不只能检测引发事务,还能检测表示出平行进化的基因。平行进化凡是是基因在进化压力下的一种表示,其实也暗示那些基因可能成为有效的治疗靶点。
Gerlinger M., Rowan A. J., Horswell S., Larkin J., Endesfelder D., et al. (2012) Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N Engl J Med 366: 883- 892。
转移
肿瘤的转移是一个复杂的过程,此中癌细胞离开原发肿瘤,通过血液或者淋巴系统轮回到身体的其他部位。在新部位,细胞继续繁衍,最末构成更多肿瘤,那些肿瘤包罗了反映其组织来源的细胞。肿瘤(胰腺癌和葡萄膜肿瘤)转移的才能大大增加了它们的致死性。关于转移肿瘤的克隆构造、转移酶之间的系统发育关系、转移和原发部位的平行进化规模,肿瘤若何扩散,以及肿瘤微情况在转移部位决定中的感化若何等,许多那些根本问标题问题前仍然没有很好地处理。
转移瘤可能来源于原发肿瘤中一个次要克隆(如上图:Metastasis1),也可能来源于次要克隆(Metastasis2)。转移瘤也会履历克隆进化(如Metastasis1所示)
参考文献
Hsieh A. C., Liu Y., Edlind M. P., Ingolia N. T., Janes M. R., et al. (2012) The translational landscape of mTOR signalling steers cancer initiation and metastasis. Nature 485: 55-61
那篇文章证了然前列腺癌基因组经由致癌mTOR通路的特殊翻译机造,那此中产生了一个特定的基因群,它们参与了细胞增殖、代谢和侵袭。随后做者对一类翻译控造前侵袭信使RNA停止了功用判定,并指出了那些mRNA主导了癌症侵袭和转移。
基因组突变
所有的肿瘤在其开展的过程中城市不竭积累体细胞突变(somatic mutations)。大大都常见的肿瘤与差别的癌基因相联系关系,那些癌基因以低频次发作突变。从大型癌症数据库中察看到的一个最令人惊讶的现象是癌症间以至各个癌症类型内的显著遗传异量性。然而,似乎只要有限的细胞通路对肿瘤的细胞生物学很重要。目前良多人正在编纂收录各类癌症类型的体细胞突变综合列表,那关于更好地领会那种疾病背后的机造将有很大的指引感化。
研究参考
Nik-Zainal S., Alexandrov L. B., Wedge D. C., Van Loo P., Greenman C. D., et al. Mutational processes molding the genomes of 21 breast cancers. Cell 149: 979-993
那篇文章中研究了21个乳腺癌基因组,并给出了它的一个别细胞突变列表。发现带BRCA1或者BRCA2突变的癌症会有一种出格的替代突变特征和不同凡响的缺失图谱。文章中还描述了一种部分的超突变现象,那称为『kataegis』(kataegis,希腊语中『雷雨』的意思,文中指的是在一个小区域中呈现大量突变的机造,如下图)。而且那些区域中的碱基替代几乎都发作在TpC二核苷酸的胞嘧啶上!
那是Kataegis图像。纵轴是突变间距(对数刻度)。那个图中基因组内大部门的突变都有着1Mbp摆布的突变间隔。此中超突变区便是表示为突变间距较低的簇。
Govindan R., Ding L., Griffith M., Subramanian J., Dees N. D., et al. Genomic landscape of non-small cell lung cancer in smokers and never-smokers. Cell 150: 1121-1134
那是另一篇文章,次要是对17个非小细胞肺癌(NSCLC)患者的肺癌及癌旁一般组织样本停止了全基因组和转录组测序。值得留意的是抽烟者中所察看到的突变频次比不抽烟者高10倍!那是通过深度测序提醒出的那些群体间所差别的克隆形式。并且此中所有颠末验证的EGFR和KRAS突变都存在于原始克隆中,那其实也就表白了它们在癌症启动中可能阐扬十分重要的感化。
镶嵌性
关于那个现象我们也同样通过现实的研究来申明。AML(急性髓细胞白血病)基因组中发现的大大都突变现实上是随机事务,在造血干细胞/祖细胞(HSPC)获得原始突变之前就存在了;但是跟着克隆的扩增,细胞的突变汗青被『捕捉』了。若何理解那里的『捕捉』?其实说的就是,本来那些突变都没什么鸟用,就摆在那无所事事,但是,在许多情况下,偏偏只需要再来一个或者两个额外的突变来协助就能配合感化,最初产生恶性的原始肿瘤克隆!
原发肿瘤和转移的镶嵌性。非同义点突变和插入缺失(绿色块)的区域散布的假设热图。行代表来自七个原发肿瘤区域和六个转移区域的样品。
研究参考
Abyzov A., Mariani J., Palejev D., Zhang Y., Haney M. S., et al. (2012) Somatic copy number mosaicism in human skin revealed by induced pluripotent stem cells. Nature 492: 438-442
那里做者发现了一个现象:均匀而言,iPSC细胞系表示出2个拷贝数变异(CNV),而那些CNV在iPSC来源的成纤维细胞中不明显。他们发现,至少50%的CNV以低频体细胞变异存在于亲本的成纤维细胞中。按照那一察看,他们估量大约30%的成纤维细胞的基因组中照顾体细胞CNV,那表白体细胞镶嵌性普遍存在于人体中。
基因交融
基因交融长短常遍及的,也是癌症的一个重要特征。如今的研究发现,一个强启动子与一个下流功用基因(好比:原癌基因)的交融在某些癌症中很遍及。据估量,对折的前列腺癌含有TMPRSS2和ETS转录因子家族成员之间的交融。基因交融是由两个本来分隔的基因或位点交融构成的。他们可能构成一种基因产品,良多时候表示出来的功用都是全新的,与两个交融的基因个别都差别。那种鬼使神差的情况可能引起致癌机造的激活,就像费城染色体阳性急性淋巴细胞白血病一样。那种基因交融招致BCR-ABL酪氨酸激酶表达,从而激活细胞增殖。有几种机造会招致基因交融的发作,那个现象是一些癌症类型的特点。胰腺癌的特点即是染色体重排的频繁断裂-交融-桥轮回。目前有几种办法能够通过测序研究交融事务,如对肿瘤的全基因组测序和mRNA-Seq。
mRNA-Seq与全基因组测序组合的办法关于发现基因交融及其机造出格高效。原因就是mRNA-Seq能够供给间接的证据,来撑持察看到的交融能否发作,并同时为交融基因能否表达供给了证据。而全基因组测序能够发现那些mRNA-Seq所发现不了的区域的信息,如基因间区和UTR。
由折回倒位所引起的交融事务可捕捉基因组中遥远区域的片段,如着丝粒反复或参与体细胞重排的区域。在那个例子中,6号染色体上的片段被插入到19号染色体上的反复区域之间。留意19号染色体的第二个拷贝是倒置的,那是折回倒位的特点。
MED1(红色)与几个伙伴基因(蓝色):ACSF2,USP32 和 STXBP4构成基因交融。
尝试上的设想参考
以Pair-end停止全基因组测序是目前检测基因交融最准确、最全面的东西,那些交融包罗反复、倒位、通读和单碱基插入缺失。能够说Pair-end是检测交融基因胜利与否的一个关键因素。
别的就是深邃度测序连系更长的读长能够分辩交融毗连中微同源的单碱基。并且那种才能是测序独有的。
研究参考
Robinson D. R., Wu Y. M., Kalyana-Sundaram S., Cao X., Lonigro R. J., et al. Identification of recurrent NAB2-STAT6 gene fusions in solitary fibrous tumor by integrative sequencing. Nat Genet 45: 180-185
文章次要是操纵了全外显子组和转录组测序发现了转录按捺因子NAB2与转录激活因子STAT6的基因交融现象。此中27个独立性纤维性肿瘤(SFT)的转录组测序发现所有肿瘤中存在NAB2-STAT6基因交融。NAB2-STAT6基因交融的过表达诱导了培育细胞的增殖,并激活了EGR应答基因的表达,最初招致了肿瘤。
Seshagiri S., Stawiski E. W., Durinck S., Modrusan Z., Storm E. E., et al. Recurrent R- spondin fusions in colon cancer. Nature 488: 660-664
那一篇文章则次要阐发了70个原发性人结肠癌的外显子组、转录组和拷贝数变异。拷贝数和RNA-Seq的数据阐发确定了在一部门结曲肠癌中存在IGF2的扩增和响应过表达。他们还操纵RNA-Seq,在10%的结曲肠癌中发现了与R-脊椎卵白家族成员(RSPO2和RSPO3)相关的基因交融。那项研究表白了综合多项手艺去领会复杂的癌症基因组很重要。
Thompson-Wicking K., Francis R. W., Stirnweiss A., Ferrari E., Welch M. D., et al. (2012) Novel BRD4-NUT fusion isoforms increase the pathogenic complexity in NUT midline carcinoma. Oncogene
那篇文章则提到了PER-624中一种新的BRD4-NUT交融竟然编码了一种功用卵白,而且它对那些细胞的致癌机造很关键。BRD4-NUT交融转录本是通过易位后的RNA剪接而产生的,那似乎是那些癌症的一个配合特征。那种有助于交融基因的替代异构体表达的机造是第一次报导。
Wen H., Li Y., Malek S. N., Kim Y. C., Xu J., et al. (2012) New fusion transcripts identified in normal karyotype acute myeloid leukemia. PLoS ONE 7: e51203
在那项研究中,做者运用双端RNA-Seq来发现染色体核型中的交融,它们经传统的细胞遗传学阐发未检测到异常。他们发现了临近基因间的交融转录本以及7个只存在于一般核型中的交融本。
染色体碎裂
那是一个不希望发作的现象,染色体碎裂是一个一次性的细胞危机,在单次事务中发作数十次至数百次基因组重排。那种灾难性事务的后果是复杂的部分重排和拷贝数变异,此中染色体上2个(偶然3个)拷贝的有限范畴可被检测。那种单次灾难性事务的形式差别于癌症开展的逐渐积累突变的典型形式。在突变积累的癌症开展形式中,拷贝数无上限,因而凡是有一个较大的范畴。据估量,在所有癌症及其差别亚型之间,染色体碎裂的发作概率约2-3%,而在骨癌中发作概率则大约25%。
染色体碎裂的图示
研究参考
Rausch T., Jones D. T., Zapatka M., Stutz A. M., Zichner T., et al. (2012) Genome Sequencing of Pediatric Medulloblastoma Links Catastrophic DNA Rearrangements with TP53 Mutations. Cell 148: 59-71
文章提到一名Sonic-Hedgehong髓母细胞瘤(SHH-MB)患者的大量、复杂的染色体重排,此患者带有生殖细胞系TP53突变(Li-Fraumeni综合征)。同时将规模扩大到11名Li-Fraumeni综合征患者的筛查,发现有36%的肿瘤表示出与染色体碎裂一致的重排。那比一般肿瘤群体所察看到的2%染色体碎裂发作率要高得多。P53的生殖细胞系突变与一些肿瘤中凋亡中行招致染色体碎裂的假说是一致的。
拷贝数变异(CNV)
构造性变异影响基因量——可转录基因的功用拷贝数。肿瘤开展、药物反响及耐药性的发作凡是是由根本的基因扩增和删除来驱动的。那些基因组上的改动可分红大的畸变和小的畸变。大的畸变包罗整个染色体或部门染色体的丧失或反复,那被称为非整倍体。小的畸变可能只包罗一个碱基,好比点突变和小片段的插入缺失。与安康的基因组差别,那些基因表达的改动会遭到转录因子的严酷调控,癌症基因组则通过基因的反复和删除来适应和逃避那种调控。癌症耐药性的发作恰是此反响的速度和效率的绝佳证明。
基因表达
基因表达阐发测定基因转录、RNA加工和表不雅遗传控造的产品。因而,基因表达阐发不只能够看出那些过程的『安康』水平,也能够深切研究细胞里面的分子机造。基于芯片的mRNA阐发曾在癌症的基因变得研究中普遍利用,但基于测序的mRNA阐发(mRNA-Seq)的呈现代表我们测定息争析基因表达产品才能的又一次飞跃。mRNA-Seq可检测润色过的RNA和表达程度极低的RNA的才能让它出格合适癌症研究。基于mRNA-Seq的办法也可检测十分快的转录变革、剪接异构体、交融基因以及可变聚腺苷酸化位点。
Feng H., Qin Z. and Zhang X. (2012) Opportunities and methods for studying alternative splicing in cancer with RNA-Seq. Cancer Lett
那篇综述存眷了RNA-Seq在研究癌症相关的可变剪切中的应用。文中包罗一个生物信息学东西列表,以及有关估量可变剪切异构体的表达程度的详尽讨论。
操纵RNA-Seq研究癌症中基因表达和选择性剪接的典型生物信息学流程。起首,将短read定位到参考基因组或转录组。在定位之后,预算正文基因和转录本的表达与剪接。
van Delft J., Gaj S., Lienhard M., Albrecht M. W., Kirpiy A., et al. (2012) RNA-Seq provides new insights in the transcriptome responses induced by the carcinogen benzo[a]pyrene. Toxicol Sci 130: 427-439
做者发现,RNA-Seq所检测到的基因比芯片手艺多约20%,而表达差别明显的基因更是接近三倍之多。因而,他们检测到的受影响的通路和生物学机造达2-5倍。做者还在许多基因中发现了可变异构体的表达,包罗细胞灭亡和DNA修复的调控因子,如TP53、BCL2和XPA,它们与基因毒性反响相关。他们还发现了功用未知的新亚型,如已知转录本的片段、带有额外外显子的转录本、内含子保留或外显子跳跃事务。
Kaur H., Mao S., Li Q., Sameni M., Krawetz S. A., et al. (2012) RNA-Seq of human breast ductal carcinoma in situ models reveals aldehyde dehydrogenase isoform 5A1 as a novel potential target. PLoS ONE 7: e50249
做者将三个DCIS模子(MCF10.DCIS、SUM102和SUM225)的表达与三维(3D)笼盖培育的非致癌乳腺上皮细胞的MCF10A模子停止了比力,确定了DCIS模子共用的表达变革。他们发现,差别表达的基因编码了与多个信号通路相关的卵白。
Meyer J. A., Wang J., Hogan L. E., Yang J. J., Dandekar S., et al. (2013) Relapse-specific mutations in NT5C2 in childhood acute lymphoblastic leukemia. Nat Genet 45: 290-294
做者操纵RNA测序,报导了诊断和复发相配对的骨髓标本的转录本图谱,那些标原来自十名患有小儿B淋巴细胞白血病的个别。转录组测序判定出20个新获得的突变,它们不存在于最后的诊断中,而2名个别带有复发特异的突变。带有NT52C2突变的所有个别都在初步诊断后36个月内复发。
尝试设想上的留意事项
RNA-Seq已成为一种研究肿瘤分子变革的常规应用,大部门研究人员接纳消费商的试验流程。rRNA的去除可进步信噪比,实现低表达转录本的检测。
癌症中的体细胞突变根本上是 de novo。测序不需要关于突变的先验常识,即可准确定位突变以及得到转录本品貌。
肿瘤凡是包罗各类细胞。mRNA-Seq的可延伸检测范畴和准确性对检测细小的表达变革十分贵重。只要肿瘤转录本包罗了奇特的体细胞突变或剪接变异体,那么就可将它与一般的细胞区分隔来。
二代双端对读测序检测基因交融的灵敏度取决于许多因素,包罗表达程度、转录本长度、所利用的样品造备办法以及cDNA文库的片段长度。
大部门尝试计划接纳poly(A)富集的RNA造备办法来测定mRNA程度。然而,非编码RNA,如miRNA,也在细胞的生物学中阐扬重要感化,并常常介导对肿瘤生长和存活很关键的过程。非编码RNA可通过现有的poly(A)-(rRNA去除)尝试计划轻松阐发。
RNA表达是组织和细胞类型特异的。在选择肿瘤-一般对照中的对照时,应考虑那一点。
选择性剪接
癌症的生物起源、开展、转移与转录组中的许多变异相联系关系。癌症特异的选择性剪接是个遍及存在的现象,也是个次要的转录后调控机造,涉及到许多癌症类型。
Seo J. S., Ju Y. S., Lee W. C., Shin J. Y., Lee J. K., et al. (2012) The transcriptional landscape and mutational profile of lung adenocarcinoma. Genome Res 22: 2109-2119
做者阐发了韩国200个肺腺癌。他们在LMTK2、ARID1A、NOTCH2和SMARCA4中发现了新的驱动突变。他们还发现了45个交融基因,此中8个是嵌合的络氨酸激酶。在17个频频发作的选择性剪接事务中,原癌基因MET中的第14号外显子跳过可能是癌症驱动因素。那项研究表白了那种癌症的复杂性以及运用几种手艺的价值。
Liu J., Lee W., Jiang Z., Chen Z., Jhunjhunwala S., et al. (2012) Genome and transcriptome sequencing of lung cancers reveal diverse mutational and splicing events. Genome Res 22: 2315- 2327
做者对19个肺癌细胞系和3组肺部肿瘤/一般样本配对开展了全基因组测序和转录组测序。他们判定出106个与癌症特异性的异常剪接相关的剪接位点突变,包罗一些已知的癌症相关基因中的突变。RAC1b是RAC1 GTP酶的一个异构体,含有一个额外的外显子,被认为在肺癌中优先上调,并对MAP2K(MEK)按捺剂PD-0325901敏感。
Thompson-Wicking K., Francis R. W., Stirnweiss A., Ferrari E., Welch M. D., et al. (2012) Novel BRD4-NUT fusion isoforms increase the pathogenic complexity in NUT midline carcinoma. Oncogene
那篇文章发现了PER-624中一种新的BRD4-NUT基因交融编码了一种功用卵白,它对那些细胞的致癌机造很关键。BRD4-NUT交融转录本是通过易位后的RNA剪接而产生的,那似乎是那些癌症的一个配合特征。那种现象以及促进交融基因的可变异构体表达的机造,过去不断未被发现。
RNA编纂
在我们人体中,DNA和RNA序列之间的差别也被称之为RNA编纂,那是一种普遍存在的现象。最频繁的RNA编纂类型是通过腺苷脱氨酶感化于RNA(ADAR)从而实现由腺苷到肌苷的转换。然后紧接着,剪接和翻译机造会将肌识别为鸟苷。在一些肿瘤基因组比一般基因组有着更更比例的RNA-DNA差别。
Jiang Q., Crews L. A., Barrett C. L., Chun H. J., Court A. C., et al. (2013) ADAR1 promotes malignant progenitor reprogramming in chronic myeloid leukemia. Proc Natl Acad Sci U S A 110: 1041-1046
做者发现,慢性髓细胞白血病(CML)急变期的祖细胞有着更高的IFN-r通路基因表达以及BCR-ABL扩增。在CML开展期间,他们还发现IFN应答的ADAR1 p150亚型的表达加强,而且腺苷-肌苷的RNA编纂增加。
MicroRNA和非编码RNA
MicroRNA(miRNA)的长度很短,大小集中在17bp-25bp之间,属于非编码RNA(ncRNA)家族的成员。它们调控多种差别的生物学功用,包罗发育、细胞增殖、细胞分化、信号转导、凋亡、代谢和细胞寿命。
通过RNA-诱导缄默复合物(RISC)与转录本的3-UTR或者与编码区中的识别位点彼此感化。miRNA的一个次要感化是按捺基因的转录后表达。在多种癌症中,许多miRNA位于存在序列缺失删除或扩增的基因组区域,那表白它们很可能在癌症的开展过程中饰演很重要的角色。miRNA的编纂位点已经在近年来的研究中被发现了,表白RNA编纂和miRNA介导的调控之间可能存在着联系关系。同时因为miRNA的测定简单、相对不变,而且在大量mRNA的控造上起感化,那就让miRNA成为癌症诊断以及治疗期间的检测和分期过程中极具吸引力的标记物。
Law P. T., Qin H., Ching A. K., Lai K. P., Co N. N., et al. (2013) Deep sequencing of small RNA transcriptome reveals novel non-coding RNAs in hepatocellular carcinoma. J Hepatol
那篇文章描述了一种新的PIWI-互做RNA(piRNA)piR-Hep1,它参与了肝脏肿瘤开展。与四周一般肝脏比拟,46.6%的肝癌细胞(HCC)存在piR-Hep1表达上调。piR-Hep1的缄默按捺了细胞活力、运动和侵袭。做者还发现miR-1323在HCC中的大量表达,以及它与肝硬化布景下所产生的肿瘤的奇特联系关系。
尝试设想上的留意事项
测序深度与检测灵敏度是间接相关的。在典型的尝试中,若是测序活动槽(Flowcell)的一条通道(lane)只上一个样本,那么测序深度会十分高,那能实现极其灵敏的检测。基于此原因,miRNA的测序深度很少成为考虑因素。在筛查应用中,或不需要如斯深邃度检测的研究中,样品可加上测序Index标签,从而可以在统一个测序lane中上样多个差别的样本。需要留意的是,在设想miRNA的测序深度时,要时刻记住miRNA控造基因表达,因而miRNA程度的小变革可能影响许多编码卵白。
新发现的miRNA应当通过功用阐发(如Ago2连系或敲除尝试)来确认。
尝试应当包罗足够的样品,以便结论具有实正的统计意义和高的可信度。一般来说,成立一个可能的假设相对来说是比力容易的,只要能证明miRNA存在于患者的肿瘤中,即使样本数量不多也是足够的。但是要实正验证假设就没那么容易了,凡是需要大量的患者来查验,并成立统计学可信度。目前,关于若何在测序研究中成立统计学可信度和多重查验纠正,还没有出格公认的办法。当前基于测序的miRNA阐发并没有实现miRNA表达的绝对定量,而仅是差别miRNA(如肿瘤-一般配对)的相对量。
样品分层是癌症样品的一个问题。一个特定的癌症表型可能代表几种差别的病因和机理。为了要停止严酷的阐发,应当有足够多的样品量,从而可以充实代表每个肿瘤亚型。而miRNA的表达会跟着肿瘤的开展而变革,因而在尝试设想时应成立肿瘤分期和分级。
RNA-卵白连系(CLIP-Seq)
在人类细胞中,大大都mRNA(或前体mRNA)与核不均一性核糖卵白(hnRNP)相连系,构成大的hnRNP-RNA复合物。hnRNA卵白在RNA加工的所有关键环节中都阐扬重要感化,包罗前体mRNA剪接以及mRNA出核、定位、翻译和不变性。几十种RNA连系卵白(RBP)和基因的hnRNP卵白与癌症相联系关系。
RNA-卵白的彼此感化可通过交联免疫沉淀测序(CLIP-Seq)来测定。在CLIP-Seq中,细胞颠末紫外线处置,让RBP与RNA复合物共价交联。细胞随后被裂解,RBP-RNA复合物被免疫共沉淀,从而测序响应的RNA。
Wilbert M. L., Huelga S. C., Kapeli K., Stark T. J., Liang T. Y., et al. LIN28 binds messenger RNAs at GGAGA motifs and regulates splicing factor abundance. Mol Cell 48: 195-206
LIN28是个守旧的RNA连系卵白,它与多能性、重编程和肿瘤的构成相关。在各类差别的癌细胞和原发肿瘤组织中都发现LIN28的异常上调。在那篇文章中,做者操纵CLIP-Seq判定了大约四分之一散布于人类转录本中LIN28的连系位点。从那些连系位点中他们发现,LIN28与mRNA中富含环构造的GGAGA序列连系。同时还发现了,LIN28的表达可以招致可变剪切中的下流变革。
表不雅遗传和甲基化
癌症开展过程中的表不雅遗传改动与异常的基因表达相联系关系。近期的研究证据表白,表不雅遗传上的改动可能在癌症起始中阐扬感化。表不雅遗传的控造是通过多个差别过程停止介导的,包罗DNA润色(甲基化或乙酰化)、组卵白润色和核小体重塑。发现控造表不雅基因组的基因发作突变,在人类癌症中是一个相当遍及的现象。NGS测序手艺供给了一整套东西,可定位突变并测定它们对癌症开展的影响。
癌症中表不雅遗传润色物的基因突变。在差别类型的癌症中经常察看到三类表不雅遗传润色物发作突变,那凸起了遗传学和表不雅遗传学之间的串扰。表不雅遗传润色物的突变有可能引起癌症的全基因组表不雅遗传改动。领会遗传和表不雅遗传变革的关系将为癌症治疗供给新的见解。
DNA润色
DNA润色目前能够很容易地通过多种手艺来停止测定。差别手艺的选择取决于所需的通量和分辩率。
Bert S. A., Robinson M. D., Strbenac D., Statham A. L., Song J. Z., et al. Regional activation of the cancer genome by long-range epigenetic remodeling. Cancer Cell 23: 9-22
文章做者通过协同的长间隔表不雅遗传激活(LREA)手艺,判定出一种构造域基因去调控的机造。那些区域凡是会逾越1Mb的基因组长度,包罗关键癌基因、microRNA和癌症的生物标记物基因。LREA构造域中基因启动子的特点是活性染色体标识表记标帜的的获得和按捺标识表记标帜的丧失。
Brastianos P. K., Horowitz P. M., Santagata S., Jones R. T., McKenna A., et al. Genomic sequencing of meningiomas identifies oncogenic SMO and AKT1 mutations. Nat Genet 45: 285-289
为了判定和验证脑膜瘤中的体细胞遗传改动,做者对17个脑膜瘤停止了全基因组或外显子组测序,并对别的48个肿瘤停止了靶向测序。他们所察看到的突变谱是散布普遍,但他们证明了43%的肿瘤中存在病灶NF2失活,并在别的8%的肿瘤中发现表不雅遗传润色物的改动。
Duncan C. G., Barwick B. G., Jin G., Rago C., Kapoor-Vazirani P., et al. A heterozygous IDH1R132H/WT mutation induces genome-wide alterations in DNA methylation. Genome Res 22: 2339-2355
脑胶量瘤、急性骨髓性白血病和软骨瘤中经常发作NADP+依赖的异柠檬酸脱氢酶IDH1和IDH2的单等位点基因点突变。做者表白,IDH1R132H等位基因的杂合表达足以诱导那些肿瘤特有的以DNA甲基化为特征的全基因组改动。那申明了IDH1R132H/WT突变体是鞭策人类癌细胞的表不雅遗传不不变性的原因。
Zhang J., Benavente C. A., McEvoy J., Flores-Otero J., Ding L., et al. A novel retinoblastoma therapy from genomic and epigenetic analyses. Nature 481: 329-334
视网膜母细胞瘤是一种发作于视网膜的侵袭性儿童癌症,由RB1失活所引发,但潜在机理仍然未知。在此类高度侵袭性的癌症中,许多基因都参与此中,但RB1是独一的已知发作突变的癌基因。与有限的体细胞突变差别,相对一般的成视网膜细胞,肿瘤的甲基化图谱表示出庞大的改动。最惊人的成果之一是人视网膜母细胞瘤中原癌基因脾络氨酸激酶(SYK)的诱导表达。SYK是肿瘤细胞保存所必须的。研究人员接着表白,小分子按捺剂对SYK的按捺招致培育和体内的视网膜母细胞瘤的细胞灭亡。
尝试设想上的留意事项
每种组织和细胞类型都有着奇特的甲基化形式;因而必需获得感兴趣的组织以便阐发。癌症研究中,肿瘤组织-癌旁一般组织的配对可简化阐发。
通过重亚硝酸氢盐测序所产生的超大量CpG标记物很难解释,且可靠的统计学阐发目前仍然困难重重。不外,下面一些现实的办法可简化阐发:
RRBS-Seq通过限造笼盖度而简化阐发;综合阐发大大改善告终果的可解释性。例如,将表达阐发与甲基化阐发相连系,让我们可专注于表达程度改动的基因;将阐发限造在某个感兴趣的基因或区域中。那种办法对GWAS的后续研究很有效,也合适已有尝试证据申明目标区域存在基因调控或染色量重塑的研究。与降低代表性的办法差别。那种办法实现了更多区域的阐发,因而可获得更多信息。组织培育物应当隆重利用。跟着时间的推移和组织增殖,培育物的甲基化程度可能已经改动,不大能代表原先的组织样本。
组卵白润色
组卵白润色凡是指的是甲基化和乙酰化。组卵白H3K9、H3K27和H4K20的甲基化与基因转录的按捺相关,而H3K4和H3K36的三甲基化与活性转录的染色量相关。组卵白乙酰化几乎老是与染色量可接近性和转录活性程度的增高相关。通过操控染色量形态和DNA可接近性,表不雅遗传润色在各个发育阶段、组织类型和疾病中都对基因表达的控造起着关键感化。
Wilkinson A. C., Ballabio E., Geng H., North P., Tapia M., et al. (2013) RUNX1 is a key target in t(4;11) leukemias that contributes to gene activation through an AF4-MLL complex interaction. Cell Rep 3: 116-127
那篇文章报导了一种转化机造,此中两个致癌交融卵白合做激活目标基因,然后调理其下流产品的功用。
尝试设想上的留意事项
每种组织和细胞类型都有着奇特的甲基化形式;因而必需获得目标组织以便阐发。
组卵白润色能够通过各类ChIP-Seq办法停止检测,原理是通过抗体与目的甲基化组卵白停止特异连系。
同样,组织培育物应当隆重利用。跟着时间的推移和组织增殖,培育物的甲基化程度可能已经改动,不大能代表原先的组织样本。
染色量构造与重排
染色体重排需要DNA双链断裂的构成和毗连。那些事务的发作,会毁坏基因组的完好性,并经常在白血病、淋巴瘤和肉瘤中察看到。而且特定基因间的频频的基因交融在差别的个别中均察看到,那表白那些基因必然在细胞周期中的某个阶段他们之间的物理位置十分接近。
那是一个设想的三维、具有转录活性的复合物,它包罗了致密的环化位置。那个示企图是基于检测到的成环事务,并假设所有成环事务都能发作在单个细胞内。在那个模子中,所有小环聚集到一个配合的核心(蓝色球)。环降低了转录活性复合物的物理大小,从而鞭策转录因子接近待定的基因组位点。
检测染色量彼此感化。在三维空间中,不异或差别染色体上远端的基因组区域彼此感化,而那种彼此感化是由一个或多个DNA连系卵白介导的。a) ChIP-Seq 操纵染色量免疫共沉淀来判定DNA和卵白的彼此感化。人们接纳各类DNA-片段化办法和核酸外切酶,来缩小片段的大小散布。b)染色量构像捕捉尝试操纵一个毗连步调将互做的染色量片段相毗连。那种办法可判定与遥远序列相连系的卵白。c)配对末端标签测序阐发染色量彼此感化(ChIA-PET)同样也操纵毗连步调来检测染色量彼此感化,将不相邻的互做区域配对。然而,ChIA-PET操纵染色量免疫共沉淀(ChIP)步调,只能判定特定卵白的彼此感化,如RNA聚合酶II。
参考文献
Papantonis A., Kohro T., Baboo S., Larkin J. D., Deng B., et al. TNFalpha signals through specialized factories where responsive coding and miRNA genes are transcribed. EMBO J 31: 4404- 4414
做者操纵测序以及染色体构像捕捉(3C)和ChIA-PET表白,TNF_alpha诱导响应基因聚集在分离的『NF-B工场』。一些『工场』还专门转录编码miRNA的响应基因,那些miRNA靶定下调的mRNA。
Rocha P. P., Micsinai M., Kim J. R., Hewitt S. L., Souza P. P., et al. Close proximity to Igh is a contributing factor to AID-mediated translocations. Mol Cell 47: 873-885
细胞核组织可决定『脱靶』活性以及交融朋友的选择。那项研究表白,绝大大都已知的活化诱导胞嘧啶核苷脱氨酶(AID)介导的Igh转位朋友在类型转换过程中与此位点接触的染色体构造中被发现。此外,那些彼此感化构造域可用来判定被AID靶定的其他基因。
Theodoratou E., Montazeri Z., Hawken S., Allum G. C., Gong J., et al. Systematic meta- analyses and field synopsis of genetic association studies in colorectal cancer. J Natl Cancer Inst 104: 1433-1457
那篇研究文章表白,T细胞特异的转录因子GATA3在介导加强子接近调控区域上饰演了重要角色,那些调控区域参与了雌激素受体(ESR1)介导的转录。GATA3缄默招致在雌激素刺激之前辅助因子和活性组卵白标识表记标帜的整体从头分配。
Hakim O., Resch W., Yamane A., Klein I., Kieffer-Kwon K. R., et al. (2012) DNA damage defines sites of recurrent chromosomal translocations in B lymphocytes. Nature 484: 69-74
做者发现,在培育的小鼠B淋巴细胞中,缺乏经常性的DNA损伤时,Igh或Myc与其他所有基因之间的易位与它们的接触频次间接相关。反过来,与经常性位点指向的DNA损伤相关的易位与DNA断裂构成的速度成反比。他们认为,非定向重排反映了细胞核构造,而DNA断裂构成决定了包罗驱动B细胞恶性肿瘤在内的经常性易位的位置和频次。
综合阐发(多组学阐发)
所有的生物过程都是彼此联系关系的,而在癌细胞发作过程的任何一个变革城市影响其他所有过程。突变可能影响所表达的活性,继而又影响DNA甲基化,再就影响其他许多基因的表达等等连续串的反响。每个个别都有着大量的特有突变,再加上那连续串的事务,可以让人们深切研究各类用于区分癌症的疾病表型。综合阐发能够使提醒癌症生物学的实正复杂性向前迈进了一步。研究人员现在可以检测大部门的单个过程,但认识和治疗癌症的实正前进未来自于对所有那些过程的综合阐发,也就是常说的多组学阐发。
参考文献
Weischenfeldt J., Simon R., Feuerbach L., Schlangen K., Weichenhan D., et al. (2013) Integrative genomic analyses reveal an androgen-driven somatic alteration landscape in early-onset prostate cancer. Cancer Cell 23: 159-170
做者发现,早发性前列腺癌的构成涉及到雄激素驱动的构造重排。比拟之下,老年发病的前列腺癌积累了非雄激素相关的构造重排,表白一种差别的肿瘤构成机造。
Cowper-Sal lari R., Zhang X., Wright J. B., Bailey S. D., Cole M. D., et al. (2012) Breast cancer risk- associated SNPs modulate the affinity of chromatin for FOXA1 and alter gene expression. Nat Genet 44: 1191-1198
做者表白,与乳腺癌风险相关的SNP集中在FOXA1和ESR1的顺反组(cistrome),以及组卵白H3赖氨酸4单甲基化(H3K4me1)的表不雅基因组。大大都的风险相关SNP调控FOXA1在远端调控元件的染色量亲和力,那招致等位基因特异的基因表达。
Peifer M., Fernandez-Cuesta L., Sos M. L., George J., Seidel D., et al. (2012) Integrative genome analyses identify key somatic driver mutations of small-cell lung cancer. Nat Genet 44: 1104-1110
做者发现了TP53和RB1失活的证据,并在编码组卵白润色物的基因中发现了频频的突变。此外,他们还在PTEN、SLIT2和EPHA7中察看到突变,以及FGFR1络氨酸激酶基因的病灶扩增。那种综合阐发表白,组卵白润色可能与小细胞肺癌(SCLC)有关。
手艺参考
一个优良的尝试设想能够进步手艺性能,从而产生最易解释和可靠的成果。那里重点强调研究人员在设想尝试时必需服膺的生物学和手艺的特征。
癌症中的尝试设想面对一些奇特的挑战。典型的肿瘤样本包罗两个基因组:遗传自父母的生殖细胞系(germline)和在疾病开展过程中积累的体细胞突变(somatic mutations)。肿瘤细胞在样本中的比例可能在10%-100%之间。肿瘤基因组也是动态的,会快速积累 de novo 突变。因而,每一个肿瘤中又可能同时包罗几个克隆亚型。
目前大部门已颁发研究的样本量都十分小,可被视为仅是提出了相关的假说。而跟着越来越多的测序信息被我们所获得,大部门癌症类型可按照其分子表型,被分红多个亚群。那严峻降低了尝试的才能,并增加了严酷阐发所需的样本数量。部门处理那一难题的计划是在摸索阶段操纵全基因组测序来寻找新的突变。在第二阶段,操纵全外显子组或靶向测序来确认新发现的那些突变,并确定他们在大型队列中的品貌。然而,在将来,统计学上严谨的全基因组测序尝试有可能长短常大的,需要数千个样本。
利用NGS测序手艺停止深度测序是指屡次生成定位到统一区域的序列片段,有时达上百次。但因为每条序列片段是从单个DNA分子中产生的,故进步深度测序可以实现原始样品中低至1%的克隆的检测。比力统一个别的肿瘤和癌旁一般组织的序列,我们能够很容易识别浸润组织的序列片段。更佳的读取深度将取决于癌症类型和所需的灵敏度,但一般建议为一般基因组更低为40倍的笼盖深度,而癌症基因组需要80倍以上的笼盖深度。在肿瘤高度异量时,可能需要肿瘤差别部位的屡次活检,才气包罗所有的细胞类型。
在那个假定的例子中,肿瘤含有两个癌症克隆和临近组织。肿瘤样本中一般细胞所产生的序列(图中:比对中的前两个序列)可通过与临近一般组织所产生的序列比力后确定。肿瘤样本中的剩余序列可分为两组,别离代表次要和次要的肿瘤克隆。次要克隆,若不及时治疗,可能在复发时成为肿瘤的次要组分。在现实阐发中,肿瘤样本至少要有40倍的笼盖深度,并笼盖靶定的基因集合、全外显子组或全基因组。
检测癌症基因组中的体细胞突变凡是有三种办法:全基因组测序、全外显子组测序和靶向基因测序。下表简要介绍了每种办法的有点和缺点。在比力多发性骨髓瘤的全基因组和外显子组测序时,对折的卵白编码突变通过染色体畸变(如易位)而存在,此中大部门不克不及零丁被外显子组测序而发现。靶向重测序是一种有用的手艺,可收录超大队列中已知癌症相关基因的突变。从久远来看,跟着我们对基因组的领会日益加深,而且我们处置息争释大型数据集的才能的进步,全基因组测序无疑是更好的肿瘤分子判定办法。而在短期内,靶向基因测序可为患者婚配出市场上已有的药物,让他们立即受益。
参考来源
Illumina cancer research

评论列表