當(dāng)生物芯片和樣品探針雜交完畢后,就需要對(duì)雜交結(jié)果進(jìn)行圖象采集和分析。一般膜芯片的雜交都用同位素p32、p33作標(biāo)記,其信號(hào)的檢測(cè)需通過(guò)傳統(tǒng)的磷光成像系統(tǒng)來(lái)完成。而對(duì)于用熒光標(biāo)記的玻璃芯片雜交后的檢測(cè),則需要用專門(mén)的熒光芯片掃描儀。
1. 磷感屏成像系統(tǒng)Cyclone Storage Phosphor System
Cyclone磷屏成像系統(tǒng)為美國(guó)Packard公司生產(chǎn)的第一臺(tái)集高分辨率、高靈敏度和5個(gè)數(shù)量級(jí)的線性范圍于一身的計(jì)算機(jī)控制數(shù)字化自動(dòng)放射成像分析系統(tǒng),由于其使用方便、快捷、自動(dòng)化程度、分辨率、圖像清晰度均很高,既可定位亦可定量,目前已廣泛應(yīng)用于核醫(yī)藥學(xué)、細(xì)胞與分子生物學(xué)、生物化學(xué)、藥理學(xué)、基因工程學(xué)、藥物代謝動(dòng)力學(xué)、放射免疫及受體免疫等多方面實(shí)驗(yàn)研究,成為十分方便的有力工具。其優(yōu)異品質(zhì)主要得益于Packard專利的激光技術(shù)和共聚焦成像系統(tǒng)。應(yīng)用范圍為我們前面介紹的DNA Macroarray以及Northern、Southern、Western Blot.,手工測(cè)序,放射性原位雜交等的同位素結(jié)果檢測(cè)。使用Cyclon磷屏可以大大縮短研究周期,獲得清晰的分辨率。
其工作原理在于:同位素標(biāo)記的雜交結(jié)果在磷屏上曝光,曝光過(guò)程32P等核素核衰變同時(shí)發(fā)射β射線,首先激發(fā)磷屏上分子,使磷屏吸收能量分子發(fā)生氧化反應(yīng),以高能氧化態(tài)形式儲(chǔ)存在磷屏分子中。激光掃描磷屏,對(duì)于激發(fā)態(tài)高能氧化態(tài)磷屏分子發(fā)生還原反應(yīng),即從激發(fā)態(tài)回到基態(tài)時(shí)多余的能量以光子形式釋放,從而在PMT捕獲進(jìn)行光電轉(zhuǎn)換,磷屏分子回到還原態(tài)。計(jì)算機(jī)接受電信號(hào),經(jīng)處理形成屏幕圖像,并進(jìn)一步分析和定量。一般化學(xué)發(fā)光物質(zhì)如熒光染料標(biāo)記樣品成像過(guò)程與放射性類(lèi)似。
系統(tǒng)特點(diǎn)
放射性自顯影成像系統(tǒng)。儲(chǔ)存式磷屏根據(jù)不同樣品厚度、射線能量有多種型號(hào)磷屏可供選擇,磷屏可以多次重復(fù)使用。
靈敏度較X光片高數(shù)十倍,可以檢測(cè)最弱的信號(hào)。曝光時(shí)間可以縮短20倍以上。
快速成像,從對(duì)磷屏進(jìn)行掃描到獲得完整的的數(shù)字化圖像,總共需要不到10min的時(shí)間,實(shí)時(shí)圖像顯示,同時(shí)立即報(bào)告分析結(jié)果。
可對(duì)放射性位置和強(qiáng)度進(jìn)行相關(guān)的定位、定量分析,寬達(dá)105的線性范圍,定量準(zhǔn)確。
不需膠片、暗室設(shè)備、沖洗底片,一步到位完成分析過(guò)程。
可選配Ouant ArrayTM 軟件,用于尼龍膜上同位素標(biāo)計(jì)的Gene Array定量分析。
2. 熒光芯片掃描儀
由于雜交時(shí)產(chǎn)生序列重疊,會(huì)有成百上千的雜交點(diǎn)出現(xiàn)在圖譜上,形成極為復(fù)雜的雜交圖譜。序列重疊雖然可為每個(gè)堿基的正確讀出提供足夠的信息,可提高序列分析的可靠性,但同時(shí)信息處理量也大大增加了。一般說(shuō)來(lái),這些圖譜的多態(tài)性處理與存儲(chǔ)都由專門(mén)設(shè)計(jì)的軟件來(lái)完成,而不是通過(guò)對(duì)比進(jìn)行人工讀譜。用計(jì)算機(jī)處理即可給出目的基因的結(jié)構(gòu)或表達(dá)信息。掃描一張10cm2的芯片大概需要2-6分種的時(shí)間。目前專用于熒光掃描的掃描儀根據(jù)原理不同大致分為兩類(lèi):一是激光共聚焦顯微鏡的原理, 是基于PMT(photomultiplier tube,光電倍增管)的檢測(cè)系統(tǒng)(另文介紹);另一種是CCD(charge-coupled devices,電荷偶合裝置)攝像原理檢測(cè)光子。CCD一次可成像很大面積的區(qū)域,而以PMT為基礎(chǔ)的熒光掃描儀則是以單束固定波長(zhǎng)的激光來(lái)掃描,因此或者需要激光頭,或者需要目的芯片的機(jī)械運(yùn)動(dòng)來(lái)使激光掃到整個(gè)面積,這樣就需要耗費(fèi)較多的時(shí)間來(lái)掃描;但是CCD有其缺點(diǎn):目前性能最優(yōu)越的CCD數(shù)字相機(jī)的成像面積只有16×12mm(像素為10μm),因此要達(dá)到整個(gè)芯片的面積20×60mm的話,需要數(shù)個(gè)數(shù)碼相機(jī)同時(shí)工作,或者也可以以降低分辨率為代價(jià)來(lái)獲得掃描精度不是很高的圖像。由于靈敏度和分辯率較低,比較適合臨床診斷用。
生產(chǎn)商業(yè)化掃描儀的公司包括:Genomic Solutions公司、Packard公司、GSI公司、Molecular Dynamics、Genetic Microsystems公司、Axon Instruments公司等。其中GSI Lumonics 公司ScanArray 系列一直是生物芯片掃描檢測(cè)系統(tǒng)中的領(lǐng)頭產(chǎn)品。2000GSI并入著名的Parkard公司后ScanArray的軟、硬件都得到進(jìn)一步加強(qiáng)。
ScanArray利用其專利的激光共聚焦光學(xué)系統(tǒng),通過(guò)計(jì)算機(jī)控制,對(duì)生物芯片的熒光雜交信號(hào)進(jìn)行全自動(dòng)的掃描采集,并通過(guò)分析軟件對(duì)數(shù)據(jù)結(jié)果進(jìn)行定量分析。
最高靈敏度高:<0.1熒光分子/μm
掃描精度可從5μm-50μm分級(jí)調(diào)整
全范圍掃描時(shí)間僅需5分鐘,快速方便
多達(dá)十種檢測(cè)濾光片,涵蓋所有生物芯片熒光染料的檢測(cè),適用于多種熒光標(biāo)記探針
不同波長(zhǎng)依次掃描避免交叉光污染
掃描后的圖像還需要進(jìn)一步的處理,這要求一定的軟件支持,F(xiàn)有的分析軟件包括:Biodiscovery的ImaGene系列,Axon Instruments的GenePix系列,GSI的QuantArray等
3. 基因芯片上各克隆熒光信號(hào)的分析原理
用激光激發(fā)芯片上的樣品發(fā)射熒光,嚴(yán)格配對(duì)的雜交分子,其熱力學(xué)穩(wěn)定性較高,熒光強(qiáng);不完全雜交的雙鍵分子熱力學(xué)穩(wěn)定性低,熒光信號(hào)弱(不到前者的1/35~1/5),不雜交的無(wú)熒光。不同位點(diǎn)信號(hào)被激光共焦顯微鏡,或落射熒光顯微鏡等檢測(cè)到,由計(jì)算機(jī)軟件處理分析,得用激光激發(fā)芯片上的樣品發(fā)射熒光,嚴(yán)格配對(duì)的雜交分子,其熱力學(xué)穩(wěn)定性較高,熒光強(qiáng);不完全雜交的雙鍵分子熱力學(xué)穩(wěn)定性低,熒光信號(hào)弱(不到前者的1/35~1/5)(2),不雜交的無(wú)熒光。不同位點(diǎn)信號(hào)被激光共焦顯微鏡,或落射熒光顯微鏡等檢測(cè)到,由計(jì)算機(jī)軟件處理分析,得到到有關(guān)基因圖譜。美國(guó)GSI Lumonics 公司開(kāi)發(fā)出專專業(yè)基因芯片檢測(cè)系統(tǒng)(ScanArray 系列),采用激光共聚焦掃描原理進(jìn)行熒光信號(hào)采集,由計(jì)算機(jī)處理熒光信號(hào),并對(duì)每個(gè)點(diǎn)的熒光強(qiáng)度數(shù)字化后進(jìn)行分析。利用QuantArray軟件包對(duì)掃描的熒光信號(hào)進(jìn)行分析,比
較每個(gè)克隆在不同組織間表達(dá)水平的差別。軟件具體分析步驟如下:
首先,同時(shí)導(dǎo)入同一區(qū)域兩個(gè)channel掃描的圖像文件;將兩個(gè)channel掃描的圖像用不同的顏色顯示并重疊;選擇擬分析的區(qū)域,輸入矩陣的行數(shù)及列數(shù)以及矩陣的個(gè)數(shù)等參數(shù);在計(jì)算機(jī)給出的該區(qū)域信號(hào)圖片上標(biāo)定網(wǎng)格,使得網(wǎng)格中所包含的橫線和豎線的交點(diǎn)個(gè)數(shù)同每個(gè)區(qū)域點(diǎn)樣的克隆數(shù)相同,調(diào)整網(wǎng)格,使每個(gè)交點(diǎn)均位于點(diǎn)樣克隆信號(hào)的中心;信號(hào)的中心確定后,計(jì)算機(jī)將自動(dòng)以交點(diǎn)為中心,按照設(shè)定的半徑圈定各克隆,并將其內(nèi)部區(qū)域作為待分析的信號(hào),同時(shí)在圈定的各克隆周?chē)侔凑疹A(yù)設(shè)的值圈定一定范圍的區(qū)域,將該區(qū)域內(nèi)的信號(hào)作為背景噪音;計(jì)算機(jī)分析每個(gè)克隆扣除背景噪音后的信號(hào)強(qiáng)度,并按照不同的要求對(duì)數(shù)據(jù)進(jìn)行分析;利用GenePie方式對(duì)兩個(gè)channel信號(hào)的進(jìn)行定量比較分析,此時(shí)計(jì)算機(jī)根據(jù)各克隆兩個(gè)channel掃描的信號(hào),以餅圖的形式給出兩個(gè)channel信號(hào)強(qiáng)度的相對(duì)比例,同時(shí)可以逐個(gè)克隆讀取計(jì)算機(jī)分析出的兩個(gè)channel信號(hào)的值及所占的比例,進(jìn)而確定各克隆在兩種組織間的表達(dá)差異。
4. Microarray數(shù)據(jù)分析
Microarray數(shù)據(jù)分析簡(jiǎn)單來(lái)說(shuō)就是對(duì)Microarray高密度雜交點(diǎn)陣圖象處理并從中提取雜交點(diǎn)的熒光強(qiáng)度信號(hào)進(jìn)行定量分析,通過(guò)有效數(shù)據(jù)的篩選和相關(guān)基因表達(dá)譜的聚類(lèi),最終整合雜交點(diǎn)的生物學(xué)信息,發(fā)現(xiàn)基因的表達(dá)譜與功能可能存在的聯(lián)系。
Microarray數(shù)據(jù)分析主要包括圖象分析(Biodiscovery Imagene 4.0\Quantarray分析軟件)、標(biāo)準(zhǔn)化處理(normalization)、Ratio值分析、基因聚類(lèi)分析(Gene Clustering)。
1. 圖象分析:激光掃描儀Scaner得到的Cy3/Cy5圖象文件通過(guò)劃格(Griding),確定雜交點(diǎn)范圍,過(guò)濾背景噪音,提取得到基因表達(dá)的熒光信號(hào)強(qiáng)度值,最后以列表形式輸出。
2. 標(biāo)準(zhǔn)化處理(Normalization):由于樣本差異、熒光標(biāo)記效率和檢出率的不平衡,需對(duì)cy3和cy5的原始提取信號(hào)進(jìn)行均衡和修正才能進(jìn)一步分析實(shí)驗(yàn)數(shù)據(jù),Normalization正是基于此種目的。Normalization的方法有多種:一組內(nèi)參照基因(如一組看家基因)校正Microarray所有的基因、陽(yáng)性基因、陰性基因、單個(gè)基因。
3. Ratio分析(Ratio Analysis):cy3/cy5的比值,又稱R/G值。一般0.5-2.0范圍內(nèi)的基因不存在顯著表達(dá)差異,該范圍之外則認(rèn)為基因的表達(dá)出現(xiàn)顯著改變。由于實(shí)驗(yàn)條件的不同,此域值范圍會(huì)根據(jù)可信區(qū)間有所調(diào)整。處理后得到的信息再根據(jù)不同要求以各種形式輸出,如柱形圖、餅形圖、點(diǎn)圖、原始圖象拼圖等。將每個(gè)Spot的所有相關(guān)信息如位標(biāo)、基因名稱、克隆號(hào)、PCR結(jié)果、信號(hào)強(qiáng)度、Ratio值等自動(dòng)關(guān)聯(lián)并根據(jù)需要篩選數(shù)據(jù)。每個(gè)Spot的原始圖象另存文件,可根據(jù)需要任意排序,得到原始圖象的拼圖,對(duì)于結(jié)果分析十分有利。
4. 聚類(lèi)分析(Clustering Analysis):實(shí)際是一種數(shù)據(jù)統(tǒng)計(jì)分析。通過(guò)建立各種不同的數(shù)學(xué)模型,可以得到各種統(tǒng)計(jì)分析結(jié)果,確定不同基因在表達(dá)上的相關(guān)性,從而找到未知基因的功能信息或已知基因的未知功能。Gene Clustering就是根據(jù)統(tǒng)計(jì)分析原理,對(duì)具有相同統(tǒng)計(jì)行為的多個(gè)基因進(jìn)行歸類(lèi)的分析方法,歸為一個(gè)簇的基因在功能上可能相似或關(guān)聯(lián)。目前以直觀圖形顯示GeneCluster結(jié)果的程序已有人開(kāi)發(fā)出來(lái),可將抽象的數(shù)據(jù)結(jié)果轉(zhuǎn)化成直觀的樹(shù)形圖,便于研究人員理解和分析。
盡管基因芯片技術(shù)受到了廣泛關(guān)注,但在基因表達(dá)譜分析中起著關(guān)鍵作用的生物信息學(xué)卻沒(méi)能引起大家的足夠重視,認(rèn)為簡(jiǎn)單人工處理一下原始數(shù)據(jù)就可以得到有價(jià)值的生物學(xué)信息,大量有價(jià)值的信息就這樣被浪費(fèi)和湮沒(méi)了。可以肯定地說(shuō),沒(méi)有生物信息學(xué)的有效參與,基因芯片技術(shù)就不能發(fā)揮最大效能。加大基因芯片技術(shù)中生物信息學(xué)的研究開(kāi)發(fā)力度已成為當(dāng)務(wù)之急。國(guó)內(nèi)外已經(jīng)進(jìn)行了有益的嘗試,初步開(kāi)發(fā)出供芯片平臺(tái)管理實(shí)驗(yàn)數(shù)據(jù)的軟件包,就目前實(shí)際情況來(lái)看,生物信息學(xué)在基因芯片研究開(kāi)發(fā)中介入的程度已經(jīng)越來(lái)越深,主要涉及基因表達(dá)信息分析管理系統(tǒng)及其分析工具和分析方法,簡(jiǎn)單概括為以下幾個(gè)方面:
基因表達(dá)數(shù)據(jù)庫(kù)
基因表達(dá)數(shù)據(jù)庫(kù)是整個(gè)基因表達(dá)信息分析管理系統(tǒng)的核心。Microarray數(shù)據(jù)庫(kù)起著數(shù)據(jù)儲(chǔ)存和查詢、各種相關(guān)信息的整合的作用。Microarray數(shù)據(jù)庫(kù)可以包含用戶的管理信息、原始實(shí)驗(yàn)結(jié)果(圖象文件、信號(hào)強(qiáng)度值、背景平均值行列號(hào)、基因號(hào)等)、各種實(shí)驗(yàn)參數(shù)(Plates/unigene/Sets/Clusters)、探針相關(guān)信息、 clone相關(guān)信息(基因名稱、基因序列、GenBank accession號(hào)、克隆標(biāo)志符(IMAGE和內(nèi)部)、代謝途徑標(biāo)志符、內(nèi)部克隆標(biāo)志符)、分析處理結(jié)果、芯片設(shè)計(jì)相關(guān)的資源和數(shù)據(jù),等等。
分析方法:
選擇分析方法的基本標(biāo)準(zhǔn):能夠簡(jiǎn)化原始數(shù)據(jù),結(jié)果直觀,使研究者能在海量基因表達(dá)數(shù)據(jù)中解析出正確的基因表達(dá)譜和功能信息。一個(gè)理想的分析方法是建立在合理的算法基礎(chǔ)之上的,應(yīng)該能全面綜合并直觀地解析原始數(shù)據(jù),修正已有數(shù)據(jù),并從結(jié)構(gòu)、序列、功能之間找到新聯(lián)系。目前已有報(bào)道用于microarray數(shù)據(jù)分析的方法主要有以下幾種:
手工分類(lèi)法(Manual classification Method)
該方法在Botstein 實(shí)驗(yàn)室的Michael Eisen提出新的分析方法之前是唯一用來(lái)分析microarray數(shù)據(jù)的方法。其基本原理是通過(guò)對(duì)microarray的ratio值從大到小排序,篩出表達(dá)顯著性改變的基因。結(jié)果可直觀地從二維plot圖得到。優(yōu)點(diǎn)是能夠有效篩選潛在的腫瘤標(biāo)記基因和藥物靶位點(diǎn);可以構(gòu)建多組基因誘導(dǎo)或抑制的時(shí)間表達(dá)譜。缺點(diǎn)是結(jié)論過(guò)于簡(jiǎn)單;很難發(fā)現(xiàn)更高層次功能線索;處理耗時(shí)且不能充分利用數(shù)據(jù),也不能發(fā)現(xiàn)實(shí)驗(yàn)錯(cuò)誤。
非監(jiān)督聚類(lèi)法(Unsupervised Clustering)又稱配對(duì)平均連鎖聚類(lèi)分析(Pairwise average-linkage cluster analysis)。該方法是分層聚類(lèi)的一種形式,非常類(lèi)似系統(tǒng)發(fā)生分析。該方法是基于標(biāo)準(zhǔn)相關(guān)系數(shù)的計(jì)算。K -mean方法是unsupervised聚類(lèi)法的一個(gè)變化,目前Stanford University 的Botstein實(shí)驗(yàn)室和NHGRI的Trent實(shí)驗(yàn)室都采用該分析方法。
混合聚類(lèi)法(Hybrid clustering approach)該聚類(lèi)方法通過(guò)將每一數(shù)據(jù)點(diǎn)傅立葉變換尋找那些表達(dá)呈周期性變化的基因,比如細(xì)胞周期涉及的基因。所謂混合聚類(lèi)就是先unsupervised聚類(lèi)再supervised聚類(lèi)。優(yōu)點(diǎn)是可以整合以前手工聚類(lèi)法得到的數(shù)據(jù);尤其適合確認(rèn)細(xì)胞周期調(diào)控的特征性表達(dá)譜。
神經(jīng)網(wǎng)絡(luò)方法(Neural network approach)運(yùn)用自組織圖(Self organizing maps)并結(jié)合supervised法進(jìn)行聚類(lèi)。優(yōu)點(diǎn)是分類(lèi)標(biāo)準(zhǔn)明確;優(yōu)化的次序好于其它聚類(lèi)法;用一種次序風(fēng)格處理大量數(shù)據(jù)易于被生物學(xué)家接受。