NimbleGen疊式探針設計芯片用于RNA CaptureSeq技術進行轉錄子信息深度挖掘
最近《Nature》雜志上發布了一個稱為RNA CaptureSeq的技術1, 它結合了RNA序列捕獲以及飽和測序方法(sequencing-to-saturation),用于深度挖掘轉錄組信息。該技術的最大特點是深度的提高。
實驗中使用了NimbleGen定制型的基因芯片,疊式覆蓋的探針針對目標區域的轉錄子序列設計,同時包括基因組中可能出現的未知可變剪切的位點。實驗中,RNA反轉錄后,與NimbleGen DNA芯片雜交,然后通過測序盡可能多地獲得目標區域的轉錄子序列,高深度的測序結果能夠發現普通RNA測序無法發現的蛋白質編碼序列的異構體及長非編碼RNA(lncRNAs)。
此次實驗富集前胎足成纖維細胞轉錄組中的近2300個區域,最終的測序結果相比普通的RNA測序,得到在目標區域內近400倍的測序數據。實驗發現的新的轉錄子,包括一些已經被廣泛研究的基因如P53和HOX基因。此外,還確定了一系列長非編碼RNA和數百個罕見的對應基因間序列的轉錄子。
雖然RNA CaptureSeq方法不能提供轉錄組的全貌,但提供了特定區域詳細的編碼和非編碼轉錄子信息。通過深度測序結果,即使轉錄水平很低或者只是在細胞亞群中出現的轉錄子也能鑒定。這種定向的方法,可以得到普通轉錄組測序不能得到的覆蓋深度。對于只對特定區域的序列感興趣的研究人員就可以通過這個方法,低成本高效益的獲取相關信息。
在此次研究中,研究人員使用定制的是NimbleGen Titanium Optimized Sequence Capture序列捕獲385K芯片,捕獲2265個基因區域的77萬RNA堿基序列,這些區域包含大約50個已知的蛋白編碼基因和lncRNAs。此外還包括了知之甚少的基因間區段,這些區段與核小體修飾有關,影響到基因的轉錄。只有利用NimbleGen Sequence Capture芯片的疊式覆蓋探針設計,才能在相同區段覆蓋多條探針,從而確定核小體包裝的特征,而核小體的不同包裝會影響表達水平。
在進行序列捕獲之后,研究人員使用了一短讀長測序平臺和羅氏454長讀長測序兩種二代測序平臺進行測序。短讀長測序平臺的數據提供了轉錄子的各種亞型,長度長的羅氏454平臺提供了詳細的剪接位點、遺傳變異及基因編輯(gene editing)信息。研究人員首先將兩個平臺獨立數據分別于進行序列比對,再組合兩者的信息進行對比,獲得了人類胎兒腳成纖維細胞(human fetal foot fibroblasts)目標區域的轉錄子多樣性以及剪接模式。
RNA捕獲富集前的樣本中有48091多個轉錄子序列,其中落在目標區域內的序列比例非常低。普通的RNA測序結果中, 2040萬個測序序列中只有0.21%的序列對準目標區域,而進行的捕獲富集后測序實驗產生的2580萬pair-end序列中超過80%落在目標區域內,相當于平均測序深度提高了4607倍。有近四分之一的轉錄子未曾通過普通RNA測序技術發現,而另外10%的轉錄子在普通RNA測序中最多只獲得過一個序列讀數。
使用羅氏454的GS FLX Titanium平臺,大約獲得31萬條序列。長讀長數據幫助驗證了近65%的短讀長平臺測序獲得的轉錄子序列,并且確認了新的、罕見的轉錄子剪切位點,其中一些位于實驗設計中覆蓋的基因間隙序列。
數百個新發現的在基因間隙剪切或連接的轉錄子,大多未曾在普通的RNA測序實驗數據中獲得,可能因為他們表達水平很低或者只是存在于一部分細胞亞群中。這些結果表明各發育階段的細胞和不同組織的細胞,轉錄差異之大可能超過從前的估計。
通過定制不同的NimbleGen芯片,RNA CaptureSeq的實驗技術還可以應用到其他領域他,如括宿主 - 病原體相互作用,不同物種鑒別,GWAS研究后定向區段的研究,癌癥相關區域轉錄子深度測序等。RNA CaptureSeq方法將幫助研究人員聚焦轉錄組中的目標區域,通過在較低成本下提高測序深度,更全面了解特定區域轉錄子的全面信息。
1. Mercer, T. R., Gerhardt, D. J., Dinger, M. E., Crawford, J., Trapnell, C., Jeddeloh, J. A., Mattick, J. S., & Rinn, J. (2011). Targeted RNA sequencing reveals the deep complexity of the human transcriptome. Nat Biotech, 1546-1696. doi:10.1038/nbt.2024