빠르게 진화하는 유전체학 분야에서 정보를 보다 길게, 높은 정확도로 해독하는 기술인 시퀀싱 기술은 상당한 발전을 의미합니다. 이러한 기술은 이전 시퀀싱 방법의 한계를 극복할 수 있는 새로운 기능을 제공하여 복잡한 게놈과 생물학적 과정에 대한 더 깊은 통찰력을 제공합니다. 이 글에서는 차세대 롱리드 시퀀싱의 배경, 장점, 단점 및 주요 특성을 자세히 살펴봅니다.
차세대 Long Read Sequencing 등장 배경
Illumina와 같은 플랫폼에서 사용되는 것과 같은 전통적인 짧은 읽기 시퀀싱 기술은 높은 처리량과 비용 효율적인 시퀀싱을 가능하게 하여 유전체학에 혁명을 일으켰습니다. 그러나 이러한 방법은 반복적인 서열과 구조적 변형을 포함하여 게놈의 복잡한 영역을 정확하게 조립하는 데 어려움을 겪습니다. 짧은 읽기 시퀀싱의 한계로 인해 긴 읽기 시퀀싱 기술의 개발이 촉진되었습니다. 이러한 과제를 해결하기 위한 솔루션으로 차세대 긴 읽기 시퀀싱이 등장했습니다. Pacific Biosciences(PacBio) 및 Oxford Nanopore Technologies(ONT)와 같은 플랫폼은 기존 방법에 비해 훨씬 더 긴 판독을 생성하여 이 분야를 개척했습니다. 이러한 기술은 게놈 조립, 구조적 변이 검출 및 RNA 서열 분석에 혁명을 일으켜 게놈 연구 및 임상 적용을 위한 새로운 길을 열었습니다.
장점
차세대 롱리드 시퀀싱은 다음과 같은 몇 가지 뚜렷한 이점을 제공합니다.
완전한 게놈 조립
특히 반복 영역과 구조적 변화가 있는 영역에서 높은 정확도로 복잡한 게놈의 조립을 용이하게 합니다.
구조적 변이체 탐지
넓은 게놈 영역에 걸쳐 있을 수 있으므로 삽입, 삭제, 역전, 전좌와 같은 구조적 변이체를 식별할 수 있습니다.
향상된 전사체 분석
긴 판독을 통해 직접적인 RNA 서열 분석이 가능하므로 조립 없이 전체 길이의 전사체 이소형 특성 분석이 가능합니다.
단일 분자 시퀀싱
단일 분자 시퀀싱이 가능하므로 PCR 증폭이 필요 없고 편향이 줄어듭니다.
게놈 변이의 위상 조정
더 긴 판독은 변이의 위상 조정에 도움을 주어 일배체형을 결정하고 유전적 유전 패턴을 명료하게 합니다.
단점
장점에도 불구하고 차세대 롱리드 시퀀싱에는 다음과 같은 몇 가지 제한 사항이 있습니다.
오류율
짧은 읽기 시퀀싱에 비해 특히 베이스 콜링 및 합의 정확도에서 더 높은 오류율을 나타내는 경우가 많습니다.
비용 및 처리량
롱리드 시퀀싱은 베이스당 더 비쌀 수 있으며 일반적으로 짧은 읽기 기술에 비해 처리량이 낮습니다.
샘플 준비 복잡성
시퀀싱을 위한 라이브러리 준비는 더 복잡하고 시간이 많이 소요될 수 있으며 특수 프로토콜이 필요합니다.
생물정보학 과제
데이터를 분석하려면 긴 읽기의 고유한 특성으로 인해 전문적인 생물정보학 도구와 계산 리소스가 필요합니다.
특징
차세대 롱리드 시퀀싱 기술의 주요 기능은 다음과 같습니다.
읽기 길이
수천에서 수만 개의 염기에 걸친 읽기를 생성할 수 있어 복잡한 게놈 영역 전반에 걸쳐 조립이 용이합니다.
실시간 시퀀싱
일부 플랫폼은 실시간 시퀀싱 기능을 제공하여 유전자 데이터에 대한 신속한 통찰력을 제공합니다.
휴대용 장치
나노기공 시퀀싱의 발전으로 휴대용 현장 배포 가능 시퀀서가 탄생하여 기존 실험실 환경 밖에서도 주문형 게놈 분석이 가능해졌습니다.
긴 단편 분석
긴 판독은 텔로미어, 동원체, 반복 요소 등 이전에 서열 분석이 어려웠던 게놈 영역을 연구하는 데 유리합니다.
요약하자면
차세대 긴 염기서열 분석 기술은 게놈 조립, 구조 변형 검출 및 전사체 분석에서 고유한 이점을 제공하는 게놈학의 혁신적인 도약을 나타냅니다. 이러한 기술에는 어려움이 있지만 지속적인 혁신을 통해 정확성, 처리량 및 접근성이 지속적으로 향상되어 연구, 진단 및 맞춤형 의학을 비롯한 다양한 분야에서 채택이 촉진되고 있습니다. 유전체학 분야가 계속 진화함에 따라 차세대 장문 시퀀싱은 분자 수준에서 생명의 복잡성을 이해하는 데 있어 새로운 지평을 열어줄 것을 약속합니다.