关键词:甲基化 变性高效液相色谱 前列腺癌
摘要
启动子的高甲基化被认为是人类癌症的标志,同时也是导致基因失活的常见机制。因此,在过去的二十年中,发展出了许多新的技术来寻找新的甲基化靶点以及解释复杂的表观遗传机制。然而受限于寡核苷酸杂交序列或者酶解位点等原因,许多方法比较费时费力,或提供的信息有限,不能够应用于大量序列或样本的检测。本文提供了一种利用变性高效液相色谱(DHPLC)技术来筛查甲基化的方法,这种方法基于基因组DNA的亚硫酸氢盐修饰。我们使用GSTP1这种已知的前列腺癌甲基化基因来进行DHPLC作为甲基化筛查工具的方法学验证。我们利用DHPLC方法对LGALS3和SMAD4两个基因的甲基化进行了筛查。结果发现,DHPLC可以作为一种快速、敏感、高通量及经济的方法来对新靶点或DNA样本进行DNA甲基化的筛查。
简介
近来在基因组学及生物技术领域所取得的成就极大地增加了与人类癌症研究相关的分子信息的数量及可实现性。已经发现了大量的基因表达的改变,这些结果指向了一个广泛的、复杂的分子变化的网络。揭示这些基因的表达是如何改变的对于我们了解癌症的发展十分重要,并且能够帮助我们识别分子生物学标记物及新的化学预防及治疗的靶点。表观遗传学修饰——如启动子的高甲基化——正在成为如肿瘤抑制因子及在癌症发生过程中发挥重要作用的调控基因等多种基因无法表达的重要机制。1
通过对前列腺癌中已知的由于CpG岛的存在而导致下调的超过800种的基因进行筛查,我们发展了一种芯片技术对前列腺癌中启动子高甲基化的潜在靶点进行识别。用这种方法识别的新靶点中的大部分都具有大而多的CpG岛,我们希望能够建立一种对于这些靶点的甲基化程度进行快速筛查的技术。
目前检测启动子高甲基化的方法在很大程度上依赖于对基因组DNA的亚硫酸氢盐修饰,通过修饰可以将未甲基化的胞嘧啶转化成尿嘧啶,而甲基化的胞嘧啶则不被改变。2 亚硫酸氢盐处理后测序、MSP和COBRA等现有的方法对于精确的甲基化研究具有巨大的价值,但是它们对于甲基化筛查来说却有明显的局限性,因为它们或是耗费大量的时间在亚硫酸氢盐处理后测序上,或者只能对CpG岛中很小的区域进行检测(MSP和COBRA)。很明显,我们需要一种快速全面地检测新靶点甲基化的替代方法,尤其是对于那些含有大的CpG岛的基因启动子和比较大的调控区域的基因启动子。
为了达到以上目的,我们采用了变性高效液相色谱(DHPLC)方法。DHPLC方法是基于突变型和野生型序列变性温度不同的原理来工作的,目前已经被普遍应用于单个碱基替换、短片段插入和缺失的自动检测。3,4 DHPLC进行甲基化筛选的原理不同于传统DHPLC过程,而是对靶序列亚硫酸氢盐处理后产生的“多重突变”进行检测。这种从胞嘧啶向尿嘧啶的转变导致了甲基化和未甲基化的扩增序列变性温度的剧烈变化,从而造成部分变性条件下色谱柱保留时间时间(column?retention times)的改变(图1)。
我们考察了DHPLC是否能够适用于对经过亚硫酸氢盐修饰处理和无差别PCR扩增的异源前列腺癌样本中潜在靶点的DNA高甲基化进行筛查。利用这种方法,我们对前列腺癌中已知的、可能是启动子高甲基化潜在靶点的两个基因进行了筛查,对它们含有CpG岛的约1kb的序列的甲基化程度进行了检测。

图1 利用DHPLC进行甲基化分析。一个特定的DNA序列的两个等位基因可以同时是甲基化的或非甲基化的(如图中i和ii),也可能只有一个拷贝被甲基化(图中iii)。在将DNA或PCR扩增产物进行亚硫酸氢盐处理以后,其CpG岛的内容反映了扩增产物的甲基化水平。对于相同的序列来说,甲基化的模板与未甲基化的模板相比具有更高的GC含量,并因此具有更高的融解温度。这意味着,在部分变性温度下,甲基化序列的保留时间要长于未甲基化的序列。因此,一个序列的甲基化含量可以从它的DHPLC色谱图中读出。纯合的甲基化序列在特定时间被洗脱(i),它要晚于纯合的未甲基化序列(ii)。而由于部分甲基化的产物同时含有甲基化的和未甲基化的DNA,因此可以在这两个时间点被洗脱(iii)。
材料与方法
患者资料及细胞系。前列腺癌样本来自人类组织合作网(Cooperative Human Tissue Network,http://www.chtn.ims.nci.nih.gov/)。十四份快速冰冻样品(手术后30分钟内获得的)及九份混有福尔马林的石蜡包埋(FFPE)的样品来自于前列腺切除手术患者。FFPE样品使用二甲苯脱蜡并用梯度乙醇(100%,95%,70%)再水化。组织切片中的DNA使用QIAamp DNA微量提取试剂盒(Qiagen,Valencia,CA)按说明书上步骤提取。

LNCap雄激素依赖性前列腺癌上皮细胞系、DU145及PC-3雄激素依赖性前列腺癌上皮细胞系、PZ-HPV7正常前列腺上皮细胞系及PRC30前列腺基质细胞系来自于美国标准生物品收藏中心(ATCC,Manassas,VA)并在标准环境下培养。细胞系中的DNA使用QIAamp DNA试剂盒(Qiagen,Valencia,CA)提取。
甲基化对照。体外甲基化的DNA(Chemicon International, Temecula, CA)作为甲基化的阳性对照,人类胎盘DNA(Sigma, St. Louis, MO)作为甲基化的阴性对照。亚硫酸氢盐修饰前配制甲基化/未甲基化的DNA溶液。1μg 甲基化的DNA与1μg胎盘DNA混合配制成50%浓度的甲基化对照。10%的甲基化对照由0.2μg甲基化的DNA与1.8μg的胎盘DNA混合配制而成。

启动子CpG岛的鉴定。在前列腺癌中利用芯片方法鉴定启动子高甲基化的潜在靶点。首先,建立一个与正常前列腺相比在前列腺癌中表达下调的基因列表;然后,挑选其中含有5’CpG岛的基因,以便识别出那些由于启动子高甲基化而下调的基因。两个免费的基因表达数据库网站(Gene Expression Atlas accessed:http://expression.gnf.org及Digital Differential Display accessed at www.ncbi.nlm.nih.gov/UniGene/ddd)和四篇已发表的基因芯片研究结果7-10被用来建立一个在前列腺细胞中正常表达而在前列腺癌中mRNA低表达的基因库。每个基因分别使用UCSC Human Genome Browser accessed(http://genome. ucsc.edu/)对其5’CpG岛的存在进行评估。从中获得338个前列腺癌启动子高甲基化的潜在靶点。从这个数据库中挑选两个基因(LFALS3和SMAD4)使用DHPLC进行甲基化筛查。这两个基因中的CpG岛利用Promoter Scan(http://thr.cit.nih.gov/molbio/proscan/)进行了转录因子结合位点及启动子元件的鉴定。
亚硫酸氢盐修饰。用亚硫酸氢钠对基因组DNA进行修饰,从而使得未甲基化的(而不是甲基化的)胞嘧啶残基转化成尿嘧啶。从组织样品中提取的约20ng的DNA、500ng的甲基化DNA对照(100%, 50%, 10%, 0%)、细胞系((PZ?HPV7, PC?3, DU145 and PRC30)、10倍连续稀释的LNCaP DNA(从100ng到0.1ng)使用EZ DNA甲基化试剂盒(Zymo Research, Orange, CA)按照说明书进行亚硫酸氢盐修饰。修饰产物使用微型YM-100(Millipore, Ireland)滤器进行纯化并用1X Tris EDTA(Sigma, St. Louis, MO)稀释到50ul。
PCR。无差别PCR用来将含有预测的具有转录因子结合位点的启动子核心区域的CpG岛全长中甲基化及未甲基化的、经亚硫酸氢盐修饰的DNA扩增(表1)。实验重叠并跨越大部分CpG岛(约1 kb的序列)。50ul的PCR反应体系中含有10X 缓冲液,10μM引物,10mM dNTP,15 mM MgCL2及一单位Amplitaq Gold(Applied Biosystems, Foster City, CA),扩增之前95℃变性10分钟。
DHPLC。PCR产物直接进行DHPLC分析。DHPLC使用自动化DHPLC仪器(WAVE?, Transgenomic Inc, Cambridge,MA)及Transgenomic DNASep?色谱柱。样品用2%的buffer B(25%乙腈及100mM的三乙基乙酸铵的混合物)线性梯度洗脱,buffer B起始浓度为40%,以0.9ml/min的流速检测12分钟。每个样品的部分变性温度根据实验的不同使用WAVE Navigator软件确定。甲基化的扩增产物的平均部分变性温度用来区分不同甲基化程度的目的片段。
亚硫酸氢盐处理后测序。使用2%的低融点琼脂糖凝胶(Invitrogen Inc., Carlsbad, CA)检测20ul的PCR产物。PCR产物使用无菌刀片切割并用QIAquick胶提取试剂盒(Qiagen, Valencia, CA)纯化。测序使用BigDye Terminator v3.1循环测序试剂盒(Applied Biosystems, Foster City, CA),按说明书步骤操作。测序产物使用DyeEx spin columns (Qiagen, Valencia, CA)纯化。DNA沉淀使用10ul HiDi甲酰胺(Applied Biosystems, UK)重悬,转移至96孔光学反应板内并用隔板封闭(所有部件来自Applied Biosystems, Foster City, CA)。序列使用ABI PRISM 3100自动DNA序列检测系统(Perkin?Elmer, Foster City, CA)分析。
结果
DHPLC的敏感性及定量精确度。在使用DHPLC检测未知靶点的甲基化前,我们先对其检测少量甲基化的效果及甲基化的定量水平进行评估。我们使用前列腺癌中一个已知的甲基化基因GSTP1(glutathione S-Transferase pi)进行检测。11,12
DHPLC的定量精确度通过使用人类胎盘DNA稀释普遍甲基化DNA(100%,50%,10%及0%)来建立。DHPLC对于每一个样本会产生一个洗脱图,这个洗脱图是根据其甲基化及未甲基化产物具有依赖于温度的差异而产生的。100%甲基化的产物洗脱晚于100%未甲基化的产物,它们分别在11.95及9.54分钟被洗脱(图2 A和D)。50%和10%甲基化的样本因为含有甲基化和未甲基化的PCR产物而在以上两个时间点均被洗脱(图2 B和C)。为了确定不同的洗脱时间洗脱的是不同甲基化产物并且没有基因组的点突变,也同样分析了未处理的人类胎盘DNA的PCR产物。在显示亚硫酸氢盐处理的DNA的引物特异性的凝胶电泳以及DHPLC色谱图上均无可见产物(图2 E)。峰面积的分析显示这种方法可以精确地量化甲基化水平。色谱图第二个峰下的区域与样本中存在的甲基化DNA的总量成正比(表2)。
将前列腺癌细胞系LNCaP的DNA连续稀释(从10ng/ul 到0.01 ng/ul)来评估DNPLC方法检测的最低下限。0.05 ng/ul的产物(约100pg input DNA 进行PCR)可被凝胶电泳及DHPLC检测到(表2)。将常见的DHPLC软件13,14以及包括亚硫酸氢盐处理后测序15、MSP16和定量MSP17,18等其他的甲基化技术进行比较。
最后,我们对平板中培养的前列腺癌细胞系的GSTP1进行筛查,其甲基化程度已经预先由非依赖性方法(定量MSP)进行检测。每个细胞系的色谱图显示,GSTP1中的LNCaP被甲基化,DU145及PC-3被部分甲基化,PZ-HPV7和PRC-30未被甲基化(结果未显示),这与之前的报道相一致。19
利用DHPLC对未知靶点进行甲基化的筛查。在验证了这种方法对于检测DNA高甲基化的有效性之后,我们从338个在前列腺癌中下调的并含有5’CpG岛的基因中选择了2个进行检测,它们的甲基化程度在前列腺癌中尚未明确。LGALS3(lectin, galactose binding, soluble 3, GenBank accession number: NM_002306)基因编码一个31kDa的蛋白,它参与包括与含有糖复合物的半乳糖的相互作用、细胞增殖、分化等多种生物学事件中,并具有抗凋亡活性。20 SMAD4 (mothers against DPP homolog 4, GenBank accession number: NM_005359) 基因是Smad转录调控因子家族成员,这个家族介导TGFβ信号级联并抑制上皮细胞生长。21

图2 DHPLC检测验证(A)100%甲基化DNA(B)50甲基化DNA(C)10%甲基化DNA(D)100%未甲基化DNA(E)未处理的人类胎盘DNA。

这两个启动子CpG岛的特征有利于对潜在目标序列周围的检测设计。甲基化/未甲基化洗脱系列(100%,50%,10%及0%)用来鉴定每个PCR检测的DHPLC的洗脱图,或甲基化及未甲基化产物的保留时间(表3)。在前列腺癌细胞系中这两个基因的甲基化都被检测,采用快速冰冻(flash-frozen)和使用混有福尔马林的石蜡处理前列腺样品,样品中含有不同成分的正常以及肿瘤细胞。在LNCaP细胞系中检测LGALS3整个CpG岛中的高甲基化,其中3/14(21%)为快速冰冻的肿瘤,2/9(22%)为石蜡包裹的样品(表4)。与预期相同,异源肿瘤样品既含有甲基化的LGALS3也含有未甲基化的LGALS3,其甲基化含量低于LNCaP。在任何肿瘤样品或细胞系的分析中均没有证据显示SMAD4被甲基化(数据未显示)。

亚硫酸氢盐处理后测序的甲基化模式的分类。为了确定DHPLC检测PCR产物甲基化模式的精确度,DHPLC筛选过LAGLS3甲基化的细胞系进行亚硫酸氢盐处理,这些细胞系包括完全甲基化(LNCaP)、部分甲基化(PrCa5)及未甲基化(PrCa7)。分析100%确认了LNCaP细胞系LGALS3 CpG岛中91个CpG位点的甲基化。然而,前列腺癌组织样本PrCa5中含有重叠的胞嘧啶及贯穿整个岛的CpG二核苷酸胸腺嘧啶峰,确定了存在甲基化的和未甲基化的等位基因,而不是CpG岛的特异甲基化。此前在其他基因中也有相似描述。22,23 相反,肿瘤样本PrCa7中分析的65个CpG岛位点完全没有甲基化(图3)。在LNCaP细胞系及12个前列腺癌样本中检测SMAD4启动子CpG岛的亚硫酸氢盐处理的序列,确定了CpG岛的每个CpG位点都未被甲基化(数据未显示)。
讨论
本文中,我们提供了一种对相关基因的DNA高甲基化进行筛查的方法。我们对前列腺癌基因表达模式进行芯片分析,鉴定了前列腺癌中超过300个潜在的甲基化靶点。因此,我们需要一种快速的方法来对基因启动子中大的CpG岛的甲基化进行筛查,这些基因在肿瘤中的甲基化还未被鉴定。这是第一次关于DHPLC作为一个独立的方法来筛查调控基因启动子中的CpG岛从而揭示未知甲基化热点的报道。
最近Lodygin等人发表在Cancer Research上的文章对于前列腺癌中潜在甲基化靶点的鉴定具有相似的观点。24与我们的生物信息学方法相比,这篇文章在前列腺癌细胞系中利用了DNMT抑制剂5?aza2'deoxycytidine来作用于整个基因组基因表达的再激活。检测再表达的基因和已知肿瘤抑制因子的活性用来确定启动子中CpG岛的存在,从而鉴定高甲基化的潜在靶点。作者鉴定了50个基因用于甲基化分析,其中的一些基因我们也通过我们的方法鉴定出来(THBS1, GSTM1, GPX3, GADD45A, CTGF, IRF1, PTGER4, ZFP36 及SGK)。作者首先通过亚硫酸氢盐处理后测序确定了前列腺癌细胞系及患者样品基因上的甲基化。他们的结果显示,CpG岛上具有不均匀的甲基化形式,部分区域甲基化程度很高,而其他区域则未被甲基化。这显示了检测基因复杂启动子中整个CpG岛的甲基化程度在癌症发生中的重要性。亚硫酸氢盐处理后测序需要耗费大量人力,而DHPLC技术首次被用于识别基因启动子中CpG岛的重要甲基化区域对于科学研究具有重要意义。

图3 利用DHPLC对LGALS3进行甲基化分析(A)三个PCR反应用来对LGALS3的CpG岛进行筛查,从5’调控区域起始并包含5’UTR。箭头表示每个CpG二核苷酸。(B)正常前列腺细胞系PZ-HPV7以及代表前列腺癌的样品中LNCaP的DHPLC色谱洗脱图。(C)将亚硫酸氢盐处理后的样品进行测序确认其甲基化程度。甲基化的CpG二核苷酸被保留,而未甲基化的胞嘧残基被转化为尿嘧啶并扩增为胸腺嘧啶。LNCaP是甲基化的;PZ-HPV7是未甲基化的;肿瘤样本PrCa6表现出重叠的胞嘧啶及胸腺嘧啶核苷酸,显示存在有甲基化的及未甲基化的LGALS3。
已有报道显示,LGALS3在一系列恶性肿瘤中存在另外的表达方式。25前列腺癌中LGALS3的低频率的甲基化与其他肿瘤类型中相一致。有30%(7/23)的垂体瘤中发现有LGALS3的甲基化导致的沉默。26由于在这两个研究中用于分析的样本数量有限,这些发现显示在人类癌症中调控乳糖凝集素-3表达降低的本质机制并不是甲基化。确实,最近的研究证据显示乳糖凝集素-3蛋白的核排斥作用可能是它失去功能的重要原因。27,28然而,还需要对更大量的样本进行更为深入的研究才能揭示LGALS3的高甲基化是否在晚期肿瘤中具有更高的发生频率。
Smad4的失活与胰腺癌及直肠癌有十分密切的联系,然而许多的研究结果显示它与具有侵略性表型的前列腺癌也关系密切。29,30在前列腺癌中尚未发现SMAD4基因启动子高甲基化的证据。在胰腺癌及结肠直肠癌中,SMAD4基因的失活主要是由于纯合缺失及基因内突变造成的。21在所有的恶性肿瘤的研究中我们仅仅只知道一例是关于SMAD4的甲基化程度的,其中在42例结肠直肠癌中也并未发现启动子甲基化的证据。31尽管利用我们的生物信息学方法已经验证SMAD4是一个潜在的启动子甲基化靶点,但是因为很多研究都发现肿瘤抑制因子基因启动子的高甲基化是伴随着其他的分子异常的,所以也不排除有其他的可能。1而在我们的研究中,由于SMAD4是定位于18q21.1这个在许多人类肿瘤中时常会发生缺失的区域,所以可能杂合性的丢失是SMAD4基因失活的主要原因。32
相较于常规的甲基化研究方法,DHPLC具有明显的优势。由于是将引物扩增出的完整DNA进行扫描,因此可以将多个CpG位点(无论扩增产物中有多少个)的甲基化密度进行快速检测。这就比那些需要依赖于甲基化敏感性限制内切酶或者甲基化特异性PCR的技术明显要优越的多,因为这些技术需要仔细地选择含有酶或者引物/探针识别区域的CpG位点,从而对分析造成诸多限制。由于DHPLC是将PCR的产物直接进行检测,而不需要对样品进行任何的预先处理,因此它可以像MSP一样迅速,并且花费时间明显短于费时费力的亚硫酸氢盐处理后测序。另外,我们也展示了对于大部分未甲基化中存在有少量甲基化的样本,DHPLC能够像其他方法一样敏感。我们也成功地利用此技术检测了石蜡样品,结果显示此技术对于处理大量样本具有很大的潜力。
DHPLC的另一项优点在于它的96孔板能够允许同时检测96个样品。最近在高通量甲基化筛查方面的一个进展是寡核苷酸甲基化分析(OMA)。33与我们的方法相似的是,作者利用大量表达研究的结果来选择候选基因,这些基因表达的下调可能是由于启动子的高甲基化。尽管OMA在高通量筛查潜力方面超过DHPLC,但是OMA比较昂贵并且它的设计也是其甲基化筛查可能性的一个限制因素。若想使用OMA同时检测多个基因的甲基化,每一个基因都需要CpG岛的甲基化和未甲基化的寡核苷酸片段,并且长度不能超过25bp。因此,与MSP类似,这种方法辨别甲基化也是在寡核苷酸杂交的水平上。这种方法并不适用于对未知的CpG岛的筛查,因为这些CpG岛可能含有大量的(大于100)CpG二核苷酸。34在整个序列上,CpG岛并不是普遍甲基化的,所以如果只检测一个小片段内的CpG位点的话,可能造成对甲基化程度的低估。反之,我们利用DHPLC进行的甲基化分析则是对启动子很大范围的甲基化程度进行检测的一个十分简便的方法。
本研究最大的意义就在于DHPLC可能作为一种能够快速完善的对相关靶点进行评估的创新的甲基化筛查平台而被广泛接受。我们证明了它在前列腺癌中对可能高甲基化的基因进行筛查的应用。虽然我们关注的焦点是对高甲基化的筛查,DHPLC也同样可以被用于CpG岛之间的DNA低甲基化的检测。
其他信息
作者:Antoinette S. Perry,Hema Liyanage,Mark Lawler,Karen Woodson
发表:[Epigenetics 2:1, 43-49, January/February/March 2007]; ?2007 Landes Bioscience
下载文章
|