Mar 07, 2023
단일 암세포에서 염색체외 원형 DNA와 전사체의 병렬 시퀀싱
자연 유전학 55권,
Nature Genetics 55권, 880~890페이지(2023)이 기사 인용
8449 액세스
159 알트메트릭
측정항목 세부정보
염색체외 DNA(ecDNA)는 암에서 흔히 발견되지만 그 기원, 구조적 역학 및 종양 내 이질성에 미치는 영향에 대한 많은 질문이 아직 해결되지 않았습니다. 여기에서는 단일 세포의 원형 DNA와 전체 길이 mRNA의 병렬 시퀀싱 방법인 단일 세포 염색체 외 원형 DNA 및 전사체 시퀀싱(scEC&T-seq)에 대해 설명합니다. scEC&T-seq를 암세포에 적용함으로써 구조적 이질성과 전사 영향을 조사하면서 ecDNA 함량의 세포간 차이를 설명합니다. 종양유전자를 함유한 ecDNA는 암세포에 클론으로 존재하며 세포간 종양유전자 발현 차이를 유발했습니다. 대조적으로, 다른 작은 원형 DNA는 개별 세포에만 배타적이어서 선택과 전파의 차이를 나타냅니다. ecDNA 구조의 세포간 차이는 ecDNA 진화의 메커니즘으로서 원형 재조합을 가리켰습니다. 이러한 결과는 scEC&T-seq가 암세포의 크고 작은 원형 DNA를 체계적으로 특성화하는 접근 방식임을 입증하며, 이는 암과 그 외의 DNA 요소에 대한 분석을 용이하게 합니다.
동일한 세포에서 여러 매개변수를 측정하는 것은 생물학적 시스템과 질병 중 변화를 정확하게 이해하는 데 중요합니다1. 원형 DNA의 경우 DNA 서열 정보를 전사 출력 측정과 통합하여 세포에 대한 기능적 영향을 평가하는 것이 중요합니다. 인간 세포에서는 적어도 세 가지 유형의 원형 DNA가 구별될 수 있습니다2,3,4,5: (1) 작은 원형 DNA(<100kb)6, 이는 eccDNAs6, microDNAs4, apoptotic Circular DNAs6, small을 포함하여 다른 이름으로 기술되었습니다. 다분산된 원형 DNA7 및 텔로미어 원형 DNA 또는 C-원8; (2) T 세포 수용체 절제원(TREC)9; (3) 대형(>100kb), 발암성, 복제수 증폭 원형 염색체외 DNA10,11(ecDNA라고 하며 중기 동안 이중 미세 염색체로 표시됨12). 단일 세포의 여러 특징을 특성화하는 능력이 증가하고 있음에도 불구하고 단일 세포의 원형 DNA 함량, 구조 및 서열에 대한 심층적인 특성화는 현재 접근 방식으로는 여전히 파악하기 어렵습니다.
암에서 ecDNA의 종양유전자 증폭은 유사분열 동안 복제되고 불평등하게 분리되는 고유한 능력을 통해 세포 간 복제 수 이질성을 잠재적으로 유도하기 때문에 특히 중요합니다. 이러한 이질성으로 인해 종양은 치료법에 적응하고 회피할 수 있습니다2,20,21,22. 실제로 ecDNA를 보유한 암 환자는 불리한 임상 결과를 보입니다11. 최근 조사에 따르면 인핸서를 함유한 ecDNA는 핵 허브17,23에서 서로 상호 작용하고 트랜스23,24에서 먼 염색체 위치에 영향을 미칠 수 있습니다. 이는 종양유전자를 보유하지 않는 ecDNA도 기능적일 수 있음을 시사합니다23,24. 더욱이, 우리는 최근 종양이 아직 알려지지 않은 기능적 관련성을 지닌 더 작고 복제수 중립적인 원형 DNA의 예상치 못한 레퍼토리를 보유하고 있음을 밝혔습니다3.
본 연구에서는 크기, 함량, 복제 수에 관계없이 모든 원형 DNA 유형과 전체 길이 mRNA를 단일로 병렬 시퀀싱할 수 있는 방법인 단일 세포 염색체외 원형 DNA 및 전사체 시퀀싱(scEC&T-seq)을 보고합니다. 세포. 우리는 구조적으로 복잡한 다중 단편화된 ecDNA와 작은 원형 DNA를 모두 포함하는 단일 암세포 프로파일링에 대한 유용성을 입증합니다.
현재 최첨단 원형 DNA 정제 접근법에는 세 가지 순차적 단계, 즉 DNA 분리, 엑소뉴클레아제 분해를 통한 선형 DNA 제거 및 롤링 서클 증폭을 통한 원형 DNA 농축이 포함됩니다3,6,25. 우리는 이 접근 방식이 단일 세포로 축소될 수 있으며 Smart-seq2(참조 26)와 결합하면 원형 DNA와 mRNA의 병렬 시퀀싱이 허용될 수 있다고 판단했습니다. 단일 세포에서 우리의 방법을 벤치마킹하기 위해 우리는 이전에 대량 집단에서 특성화한 신경모세포종 암 세포주를 사용했습니다3. 우리는 FACS를 사용하여 세포를 96 웰 플레이트로 분리했습니다 (그림 1a, 보충 그림 1a, b 및 보충 표 1). DNA는 이전 접근법과 유사하게 데옥시티미딘(Oligo dT) 프라이머의 단일 가닥 서열에 결합된 자기 비드에 포획된 폴리아데닐화 RNA로부터 분리되었습니다. 과거에 대량 세포 집단에서 성공적으로 수행된 것처럼 DNA를 엑소뉴클레아제 소화에 적용하여 원형 DNA3,6,25를 풍부하게 했습니다(그림 1b). 엑소뉴클레아제 소화 전에 PmeI 엔도뉴클레아제를 적용한 DNA는 음성 대조군으로 사용되었습니다3. 일부 사례에서는 DNA가 추가 대조군으로 소화되지 않은 상태로 남아 있었습니다(그림 1b). 다양한 소화 요법 후에 남은 DNA가 증폭되었습니다. 증폭된 DNA는 Illumina의 paired-end sequencing과 어떤 경우에는 long-read Nanopore sequencing을 거쳤습니다(그림 1a). 원형 DNA의 서열 구성을 분석하고 원형 DNA 분석을 위해 이전에 확립된 계산 알고리즘을 사용하여 원형화된 영역에서 게놈 기원을 추론했습니다3.
100 kb) circular DNAs containing oncogenes, was observed after 1-day exonuclease digestion (P = 2.10 × 10−5, two-sided Welch's t-test; Supplementary Fig. 1e). This enrichment was not as pronounced as that of smaller circular DNAs after prolonged 5-day exonuclease digestion, suggesting that ecDNA may be less stable in the presence of exonuclease compared to smaller circular DNAs, or that small circular DNAs are more efficiently amplified by φ29 polymerase (Supplementary Fig. 1e,f). PmeI endonuclease incubation before 5-day exonuclease digestion significantly reduced reads mapping to mtDNA by 404.8 fold (P < 2.2 × 10−16, two-sided Welch's t-test; Fig. 1c,d and Supplementary Fig. 1c). Similar depletion was observed for reads mapping to circular DNAs containing PmeI recognition sites, confirming specific enrichment of circular DNA through our scEC&T-seq protocol (P < 2.2 × 10−16, two-sided Welch's t-test; Fig. 1f and Supplementary Fig. 1g,h). Significant concordance between Illumina- and Nanopore-based detection of circular DNAs suggested reproducible detection independent of sequencing technology (two-sided Pearson correlation, R = 0.95, P < 2.2 × 10−16; Supplementary Fig. 2a–d). Thus, scEC&T-seq enables the isolation and sequencing of circular DNAs from single cells./p>95%) circular DNAs detected in single cells were larger than apoptotic circular DNAs, suggesting that most circular DNAs were not a result of apoptosis, as suggested by other reports6 (Fig. 2a and Supplementary Fig. 4a). Thus, each cancer cell contains a wide spectrum of individual circular DNAs from different genomic contexts./p>69.5%). Because scEC&T-seq also detects mtDNA (Fig. 2c,d), we hypothesized that heteroplasmic mitochondrial mutations may enable lineage tracing, as demonstrated in other single-cell assays in the past32 (Fig. 1c,d and Supplementary Fig. 1c). Indeed, unsupervised hierarchical clustering by homoplasmic mtDNA variants accurately genotyped cells (Supplementary Fig. 10a). Heteroplasmic SNVs on mtDNA revealed high intercellular heterogeneity, and unsupervised hierarchical clustering on individual single cells grouped them, which indicates subclonality and may allow lineage tracing (Supplementary Fig. 10b and Supplementary Fig. 11a,b). Thus, scEC&T-seq can detect heteroplasmic variants in mtDNA and ecDNA, allowing for a wide range of SNV-based applications and analyses, including lineage inference./p> 30% and MAF < 0.1% for CHP-212 as well as MAF > 30% and MAF < 0.1% for TR14 were considered uninformative for clustering and removed based on spot checking./p>15% in single cells and >2.5% in nuclei) were also excluded. Data were normalized with a scale factor of 10.000 and scaled using default ScaleData settings. To account for gene length and total read count in each cell, the Smart-seq2 data were normalized using transcripts per million; then, a pseudocount of one was added and natural-log transformation was applied. The first four principal components were significant; therefore, the first five principal components were used for FindNeighbors and RunUMAP to capture as much variation as possible as recommended by the Seurat authors. The resolution for FindClusters was set to 0.5./p> 0.2 and supporting reads ≥ 50×). As for CHP-212 and TR14, a genome graph was built using gGnome61 (v.0.1) and manually curated. To check amplicon structure correctness for the patient samples, in silico-simulated Nanopore reads were sampled from the reconstructed amplicon using an adapted version of PBSIM2 (ref. 72) (https://github.com/madagiurgiu25/pbsim2) and preprocessed as the original patient samples. Lastly, the SV profiles between original samples and in silico simulation were compared. All reconstructed amplicons were visualized using gTrack (v.0.1.0; https://github.com/mskilab/gTrack), including the GRCh37/hg19 reference genome and GENCODE 19 track./p>