2. 單個細胞系的轉(zhuǎn)錄組異質(zhì)性
根據(jù)轉(zhuǎn)錄組異質(zhì)性的模式。在UMAP中,42個細胞系大致可以分為離散型和連續(xù)型兩種類型(圖2a)。由于這些細胞系中存在亞克隆,不同的亞簇在空間上被觀察到是離散的,而連續(xù)的亞簇在亞簇之間沒有明確的邊界。總共有25個細胞系(57%)和17個細胞系(43%)分別屬于離散組和連續(xù)組(圖2b)。總體而言,離散/連續(xù)分類與多樣性得分相關性較好,其中多樣性得分最高的前25%的細胞系大多數(shù)是離散模式(圖2b),并且離散組的多樣性評分明顯高于連續(xù)組,這表明具有高度異質(zhì)性的細胞系通常派生出不同的亞類。然而,也有一些離散細胞系的多樣性評分較低,如SW620,而連續(xù)模式細胞系的多樣性評分較高,如SK-BR-3(圖2b)。對于前者,簇內(nèi)距離明顯小于簇間距離。因此,盡管在集體距離不是很大的情況下,該細胞系的多樣性得分較低,但根據(jù)分類,該細胞系呈現(xiàn)出離散的模式。對于后者,集體距離可以很大,而簇內(nèi)距離與簇間距離沒有顯著差異。綜上所述,兩個指標顯示的細胞系內(nèi)異質(zhì)性表明,轉(zhuǎn)錄組多樣性可能受到不同亞克隆的存在以及細胞系內(nèi)在可塑性的影響,這兩個因素對細胞系內(nèi)異質(zhì)性的貢獻在單個細胞系中有所不同。
3. 轉(zhuǎn)錄組異質(zhì)性形成的分子特征
接下來,將相似的NMF合并到NMF集群中,以確定40個癌細胞系中的復發(fā)性NMF程序。在3個以上的細胞系中鑒定出了12個異質(zhì)性激活的簇(圖2c)。隨后,基于同一簇內(nèi)單個程序之間的共有基因,其中出現(xiàn)在超過25%的程序中的基因被用作標志基因。大多數(shù)細胞系共有的兩個最突出的簇與細胞周期有關,包括G1/S和G2/M程序(圖2c、d),這表明細胞周期變化是大多數(shù)細胞系中觀察到的轉(zhuǎn)錄組異質(zhì)性的主要原因。除了細胞周期相關的程序外,另外10個簇代表了各種關鍵的生物過程(圖2d)。
4. 人細胞系的泛癌scATAC-seq
進一步使用scATAC-seq在單細胞分辨率下研究單個細胞系內(nèi)的表觀基因組異質(zhì)性。為了提高通量和降低scATACseq實驗的成本,每次運行scATACseq時,最多合并6個具有不同表達譜的細胞系,然后根據(jù)差異表達基因的可及性特征計算分配給相應的細胞系(圖3a)。經(jīng)過質(zhì)量過濾,獲得54,597個高質(zhì)量的單核,每個細胞系的中位數(shù)為1170個核(范圍從203到4391個核),每個細胞核的中位數(shù)片段為11,702個。然后,我們匯總scATAC-seq譜來計算開放染色質(zhì)區(qū)域的基因組分布,結(jié)果顯示35.5%的ATAC峰定位在啟動子-近端區(qū)域(<±1.5 kb TSS)。使用UMAP將39個細胞系一起繪制,以呈現(xiàn)染色質(zhì)水平上的細胞系間距離,每個細胞系形成一個不同的簇(圖3b)。為了在表觀基因組水平上評估細胞系內(nèi)的異質(zhì)性,我們將細胞劃分為細胞系內(nèi)的初步集群。結(jié)果,62%的細胞系表現(xiàn)為無差別模式,38%的細胞系表現(xiàn)為差異模式(圖3c)。總體而言,不加區(qū)分差異分類與多樣性評分相關性良好,屬于差異組的細胞系的多樣性評分明顯高于不加區(qū)分組的細胞系(圖3d、e),這表明具有高度異質(zhì)性的細胞系通常派生出不同的亞簇。
5. 與CNVs相關的轉(zhuǎn)錄組異質(zhì)性
為明確觀察到轉(zhuǎn)錄異質(zhì)性的起源,我們首先轉(zhuǎn)向惡性腫瘤常見的遺傳變異。使用scRNA-seq數(shù)據(jù)分析大規(guī)模拷貝數(shù)變異(CNV),計算了與正常細胞相比,每個位點周圍400個基因平均表達水平。該分析在40個(62.5%)癌細胞系中鑒定出25個CNV亞克隆(圖4a、b),表明CNV誘導的拷貝數(shù)變異在很大程度上有助于轉(zhuǎn)錄變異;17個(42.5%)細胞系未顯示相關性(圖4b)。在這25個細胞系中,分別有18個和7個細胞系表現(xiàn)為離散型和連續(xù)型,其余15個細胞系中分別有6個和9個細胞系表現(xiàn)為離散型和連續(xù)型。這表明,當遺傳變異導致細胞系內(nèi)部異質(zhì)性時,細胞系傾向于以更離散的方式呈現(xiàn)異質(zhì)性轉(zhuǎn)錄組活性。然后,研究了位于CNV區(qū)域的基因是否有助于這些匹配細胞系的轉(zhuǎn)錄組變異性。結(jié)果顯示,差異表達的基因確實在CNV區(qū)域顯著富集(圖4c),表明遺傳變異是決定離散型細胞系細胞系內(nèi)異質(zhì)性的重要因素。這一事實也表明,即使對于那些具有不同模式的細胞系,也存在其他因素影響轉(zhuǎn)錄組異質(zhì)性。
6. 染色質(zhì)可及性調(diào)控轉(zhuǎn)錄組異質(zhì)性
為了探索表觀基因組異質(zhì)性的機制,我們采用了包括ArchR28和ChromVAR30在內(nèi)的兩種方法,試圖推斷驅(qū)動細胞亞簇之間差異染色質(zhì)可及性的潛在轉(zhuǎn)錄因子,并重點研究了至少三種細胞系中出現(xiàn)的常見TF(圖5a)。參與調(diào)節(jié)IFN應答的IRF1、IRF2、IRF9和STAT2,在LS 174T和hnscum - 02t細胞系中被異質(zhì)激活。然后,我們將重點放在分別在scRNA-seq和scATAC-seq數(shù)據(jù)中表現(xiàn)出離散和差異模式的7個細胞系上,試圖在兩個數(shù)據(jù)集之間匹配子簇。根據(jù)scATAC-seq數(shù)據(jù)計算基因評分矩陣,然后根據(jù)基因評分與基因表達的相似性進行比對。結(jié)果,在7個細胞系中的3個,包括MDA-MB-231、RPMI 8226和SNB75,細胞亞簇可以在兩個數(shù)據(jù)集之間自如匹配(圖5b、c、d)。根據(jù)scATAC-seq和scRNA-seq數(shù)據(jù),MDA-MB-231細胞分別聚為4個和3個亞組,其中scATAC-seq數(shù)據(jù)集的亞組2與scRNA-seq數(shù)據(jù)集的亞組1和2的混合匹配。對于SNB75,,scATAC-seq數(shù)據(jù)的3亞組與scRNA-seq數(shù)據(jù)的0和1亞組的混合匹配,其余scATAC-seq數(shù)據(jù)的亞組與scRNA-seq亞組呈一對一的相關性(圖5b、c、d)。這表明染色質(zhì)可及性和CNV的異質(zhì)性可以獨立促成轉(zhuǎn)錄組異質(zhì)性,對于這三種細胞系,染色質(zhì)可及性對轉(zhuǎn)錄組異質(zhì)性有很大貢獻。
為了進一步探索驅(qū)動異質(zhì)染色質(zhì)可及性和RNA表達的分子機制,我們試圖推斷結(jié)合差異可及性染色質(zhì)區(qū)域的潛在TF。通過測量基因組特征集內(nèi)染色質(zhì)可及性的增益或損失來推斷TF活性,同時控制技術(shù)偏差,揭示潛在的TF在亞群之間表現(xiàn)出可變性(圖5e)。在MDA-MB-231中,發(fā)現(xiàn)FOXA2的活性在0亞組中特異性上調(diào)(圖5f),F(xiàn)OXA2的啟動子可及性在0亞組中也有所增加(圖5g)。我們隨后分析了FOXA2的下游靶標,發(fā)現(xiàn)它們與“Kras_signaling_up”相關的基因更多相關(圖5h),這些基因在0亞組中表達上調(diào)(圖5i)。FOXA2可以在腫瘤發(fā)育過程中協(xié)同KrasG12D的激活。我們的結(jié)果表明FOXA2可能在控制異質(zhì)性中起重要作用。
圖 5
7. ecDNA分布誘導的轉(zhuǎn)錄組異質(zhì)性
最近的研究表明,癌基因擴增既存在于染色體上,也存在于染色體外環(huán)狀dna (ecDNAs)上。由于在ecDNA中沒有著絲粒,與染色體擴增子相比,它們不太穩(wěn)定,并且隨機地分離到子細胞,這可能是細胞異質(zhì)性的潛在驅(qū)動力。為了研究ecDNA對轉(zhuǎn)錄組異質(zhì)性的貢獻,我們首先建立了一種分析方法,該方法能夠利用scATAC-seq數(shù)據(jù)檢測高潛力的ecDNA區(qū)域,基于以下假設:(1)ecDNA高度擴增;(2) ecDNA具有更高的可及性。根據(jù)scATAC-seq數(shù)據(jù),在每個單細胞中讀取覆蓋率呈現(xiàn)多個峰,其中第一個峰被認為是兩個拷貝基因組區(qū)域的讀取覆蓋率,因此在這里定義為參考覆蓋率。為了尋找潛在的ecDNA片段,我們首先將整個基因組分成100,000 bp的bin,在歸一化測序深度后量化每個細胞中每個bin的讀取覆蓋率。然后,我們計算相對讀取覆蓋率,作為每個bin的覆蓋率與單元的參考覆蓋率的比率。由于ecDNA具有更高的可及性,相對覆蓋率至少為6的區(qū)域被定義為潛在的ecDNA片段,并通過TSS富集評分和細胞數(shù)量進一步過濾。此外,考慮到scATAC-seq數(shù)據(jù)的稀疏性,如果由于實驗和作圖偏差,該區(qū)域沒有被scATAC-seq讀取均勻和充分覆蓋,即使來自連續(xù)基因組區(qū)域的ecDNA也可以基于scATAC-seq數(shù)據(jù)檢測到多個ecDNA片段。因此,我們已經(jīng)鑒定的ecDNA片段的數(shù)量應該高于在細胞中發(fā)現(xiàn)的不同ecDNA物種的數(shù)量。
為了解決這個問題,研究了它們在單個細胞系中不同潛在ecDNA片段之間的讀取覆蓋率的相關性,并將附近和高度相關的片段合并為潛在的ecDNA區(qū)域。然后,我們將合并的區(qū)域定義為潛在的ecDNA區(qū)域。如圖6a所示,在31個細胞系中,每個細胞系中檢測到229個潛在的ecDNA區(qū)域。我們的方法成功地發(fā)現(xiàn)了實驗證實的ecDNA,如K562中的chr9:130700000-131400000,其中ABL1和NUP214位于11中。致癌基因在潛在的ecDNA區(qū)域顯著富集(圖6a)。與沒有致癌基因的ecDNA相比,在單個細胞系中,含有致癌基因的ecDNA出現(xiàn)在更高比例的細胞中(圖6b),這表明含有致癌基因的ecDNA為細胞提供了生長優(yōu)勢,因此具有異質(zhì)性。考慮到ecDNA可以通過增加DNA拷貝數(shù)來增加轉(zhuǎn)錄RNA的數(shù)量,我們進一步計算了ecDNA上的基因表達與ecDNA在每個細胞中的相對覆蓋數(shù)之間的相關性,發(fā)現(xiàn)它們是部分相關的(圖6c)。例如,位于SCC-4細胞系不同ecDNA中的基因KRT14和KRT17、LGALS2、SERPINE1和PCOLCE在SCC-4細胞系中以不同的三個亞簇特異性表達(圖6d)。鑒定這些基因高表達的細胞比例與含有這些基因的ecDNA的細胞比例高度相關(圖6e)。這一結(jié)果表明,ecDNA的高拷貝數(shù)有助于ecDNA中基因的高表達。為了進一步評估ecDNA對轉(zhuǎn)錄異質(zhì)性的影響,我們選擇了MDA-MB231,其scATAC-seq和scRNA-seq數(shù)據(jù)可以整合(圖5b-d),以反映scRNA-seq數(shù)據(jù)分析的UMAP中ecDNA的拷貝數(shù)。如圖6f所示,Chr12: 5900000_7200000 ecDNA在亞簇0中特別富集。同時,位于該ecDNA上的CD9、LTBR、PTMS、TPI1、ENO2、C12orf57等基因在亞簇0中也有高表達(圖6g), CD9是亞簇0的頂級標記基因之一。這些結(jié)果表明,ecDNAs可以影響基因表達,從而影響細胞聚集。
8. 低氧處理重塑細胞系內(nèi)異質(zhì)性
腫瘤的發(fā)生和發(fā)展是一個動態(tài)的過程,伴隨著微環(huán)境的劇烈變化。微環(huán)境在腫瘤進展、治療抵抗和轉(zhuǎn)移形成中發(fā)揮重要作用,并增加了另一層調(diào)控,可驅(qū)動腫瘤內(nèi)異質(zhì)性。在這里,我們試圖評估這些轉(zhuǎn)錄組異質(zhì)性在不同條件下是靜態(tài)的還是可塑性的。鑒于在實體瘤中,腫瘤細胞經(jīng)常處于不同程度的缺氧狀態(tài),我們選擇缺氧處理作為環(huán)境應激進行擾動,結(jié)果顯示,缺氧處理后,低氧相關基因發(fā)生了顯著變化。為了匹配缺氧治療前后的細胞亞群,我們觀察到兩種類型的相關模式:(1)細胞簇在缺氧處理前后是一對一匹配的,這表明缺氧處理沒有改變細胞簇之間的差異,如ZR-75-1(圖7a);(2)一些細胞簇從一個分裂到多個,這表明一個細胞簇內(nèi)的細胞可能對缺氧有不同的反應,如DLD-1和SW620(圖7c、e)。為了確定在一個亞群中引起對缺氧應激差異反應的潛在機制,我們重點研究了在缺氧下分裂的亞群。例如,在缺氧條件下,DLD-1的子簇0分為2個簇(圖7c)。我們檢查了集群0和0-1/0-2之間的差異表達基因(DEGs):集群0和0-1之間變化最大的基因是缺氧相關基因,如BNIP3L、SLC2A1和ERO1A,而集群0和0-2之間的缺氧相關DEGs有限(圖7d)。這表明原簇0中存在兩組細胞對缺氧的反應不同,但在缺氧處理前的轉(zhuǎn)錄水平差異不明顯。同樣,在SW620細胞中,簇0被分為簇0-1和簇0-2(圖7e);盡管所有細胞都對缺氧有反應,但簇0-1中的細胞顯示了與EMT相關的其他基因的變化(圖7f)。