페이지 안내

2메뉴열기

2토토사이트

2토토사이트

생명과학부 마틴 스타이네거 교수 토토사이트 잘못환전팀

MMseqs2-GPU, 생물학 AI를 위한 로켓 엔진

2025. 9. 26.

MMseqs2를 활용한 GPU 가속 상동성 검색

[토토사이트 잘못환전필요성]

단백질 서열 데이터베이스는 수억~수십억 개 서열로 급속히 확장되고 있으며, 원거리 상동성(homology)을 탐지하기 위한 고감도의 검색 도구는 구조 예측 및 단백질 기능 분석에 필수적이다 AlphaFold2 같은 최신 단백질 구조 예측 AI는 대규모 상동성 검색 결과(다중서열정렬, MSA)를 입력으로 사용하지만, 이 단계가 전체 파이프라인에서 가장 큰 병목 현상으로 지적되어 왔다. 기존 CPU 기반의 BLAST, PSI-BLAST, JackHMMER, DIAMOND, MMseqs2 등은 속도와 민감도의 균형을 위해 다양한 휴리스틱을 사용하지만, 초대형 DB에서의 검색은 여전히 시간이 오래 걸리고 비용이 크다. 따라서 GPU의 대규모 병렬성을 활용해 빠르면서도 민감한 단백질 상동성 검색을 실현하는 것이 필요했다.

[토토사이트 잘못환전성과/기대효과]

본 토토사이트 잘못환전에서는 GPU에 최적화된 알고리즘을 개발하여 MMseqs2-GPU를 구현함으로써, 단백질 상동성 검색의 속도와 비용 문제를 획기적으로 개선하였다. NVIDIA L40S GPU 한 개만으로도 기존 CPU 128코어 대비 약 20배 빠른 속도와 71배 저렴한 비용을 달성하였으며, 최대 8개의 GPU에서 100 TCUPS의 성능을 기록하여 기존 CPU 및 FPGA 기반 접근법을 크게 능가하였다. 또한 ColabFold에 MMseqs2-GPU를 적용한 결과, AlphaFold2 구조 예측 과정이 기존 대비 23배 빨라졌음에도 불구하고 정확도의 손실은 발생하지 않았다. JackHMMER, BLAST 등과 비교했을 때 민감도 또한 동일하거나 더 우수하였고, 반복적 프로파일 탐색에서는 PSI-BLAST보다 더 높은 성능을 보여주었다.

이러한 성과는 슈퍼컴퓨터가 아닌 단일 GPU 서버에서도 초고속 단백질 검색이 가능하게 하여 토토사이트 잘못환전자들의 접근성을 크게 높이며, 단백질 구조 예측, 기능 주석, 계통학적 분석, 신약 개발 등 다양한 생명과학 토토사이트 잘못환전에서 속도와 비용의 장벽을 낮출 것으로 기대된다. 나아가 MMseqs2-GPU는 차세대 GPU 아키텍처에서도 확장성이 보장되며, 빠른 상동성 탐색을 기반으로 차세대 생물학 인공지능 모델의 발전과 원거리 상동성 탐지 토토사이트 잘못환전를 가속화할 것으로 전망된다.

40토토사이트

토토사이트, 마인츠 대학교, 그리고 NVIDIA 토토사이트 잘못환전진의 공동 토토사이트 잘못환전 결과인 MMseqs2-GPU논문이 2025년 Nature Methods(IF=32.1)에 게재되었다. MMseqs2-GPU는 단백질 데이터의 즉각적인 검색과 분석을 가능하게 하는 획기적인 소프트웨어이다.

2024년 노벨 화학상은 단백질 구조 예측 인공지능 기반 소프트웨어인 AlphaFold2등에 수여되었다. 이는 질병의 이해 및 신약 설계에서 단백질의 3차원 구조 예측이 얼마나 중요한지를 잘 보여준다.

무엇보다 AlphaFold2와 같은 AI 소프트웨어는 수십억 개의 서열을 포함한 대규모 데이터베이스 검색을 통해 동종 단백질(homologous proteins)을 식별하고 이를 분석함으로써 단백질 구조를 예측한다. 이러한 동종 단백질 검색은 AI 기반 구조 예측이 실제 생물학적 근거에 바탕을 두고 있음을 보여준다. 그러나 지금까지 이러한 동종 단백질 검색은 AI 예측 자체보다 수십 배 더 많은 시간이 소요되는 심각한 병목 현상이 되어왔다.

MMseqs2-GPU는 ChatGPT와 같은 최신 대형 언어 모델(LLM)의 혁신을 가능하게 한 그래픽 처리 장치(GPU)를 활용하여 이 병목 현상을 제거하고, 동종 단백질 검색을 수백 배 이상 가속화한다. 마인츠 요하네스 구텐베르크 대학교의 베르틸 슈미트(Bertil Schmidt) 교수는 &우리는 DPX 명령어와 warp shuffle과 같은 기술적 혁신을 통해 MMseqs2에서 연산 시간이 길었던 알고리즘을 병렬화하여 현대 GPU에서 최적의 성능을 이끌어냈다. 이는 우리의 소프트웨어가 Blackwell과 같은 차세대 GPU에서도 빠르게 실행될 수 있게 한다. 이러한 알고리즘적 혁신은 단백질 구조 예측 속도를 획기적으로 향상시켜 과학적 발견을 의학·보건 분야의 성과로 이어지게 하는 데 기여할 것이다.

토토사이트의 밀럿 미르디타(Milot Mirdita) 박사는 &우리의 목표는 단순하다. 모든 토토사이트 잘못환전자가 빠른 동종 단백질 검색을 이용할 수 있게 하는 것이다. 과거에는 슈퍼컴퓨터가 필요했던 토토사이트 잘못환전가 이제는 단일 GPU 서버에서도 가능하다.

MMseqs2는 이미 Boltz, BioEmu, Chai 등 최첨단 생물학 AI 모델을 뒷받침하고 있다. 이제 MMseqs2-GPU를 통해 GPU 기반의 빠른 동종 단백질 검색을 AI 추론 파이프라인에 직접 통합할 수 있게 된다. 토토사이트의 마틴 스타이네거(Martin Steinegger) 교수는 다음과 같이 말했다. &우리의 논문은 몇 가지 흥미로운 응용 사례만 제시하고 있지만, MMseqs2-GPU의 잠재력은 그 범위를 훨씬 뛰어넘는다. 이는 완전히 새로운 차세대 생물학 AI 모델의 토대가 될 것이다.

[토토사이트 잘못환전결과]

GPU-accelerated homology search with MMseqs2

Felix Kallenborn, Alejandro Chacon, Christian Hundt, Hassan Sirelkhatim, Kieran Didi, Sooyoung Cha, Christian Dallago, Milot Mirdita, Bertil Schmidt & Martin Steinegger
(Nature Methods (2025), https://doi.org/10.1038/s41592-025-02819-8)

본 토토사이트 잘못환전에서는 GPU 환경에 최적화된 MMseqs2-GPU를 개발하여 단백질 상동성 검색의 속도와 효율성을 크게 향상시켰다. 핵심 알고리즘을 GPU 아키텍처에 맞게 재설계하고 DPX 명령어 및 warp shuffle과 같은 최신 기술을 적용함으로써, 단일 GPU만으로도 기존 CPU 128코어 대비 20배 이상 빠른 성능과 71배 저렴한 비용을 달성하였다. 또한 다중 GPU 환경에서는 100 TCUPS의 처리 성능을 구현하여 대규모 데이터베이스 검색을 단시간에 수행할 수 있음을 입증하였다. ColabFold에 적용한 결과, AlphaFold2 기반 구조 예측 속도가 기존 대비 20배 이상 단축되었으며, 정확도의 손실은 전혀 발생하지 않았다. 나아가 JackHMMER, BLAST 등 기존 도구와 비교했을 때 동등하거나 더 높은 민감도를 확보하였고, PSI-BLAST와 같은 반복적 탐색에서도 우수한 성능을 보였다. 이러한 결과는 단백질 서열 분석에서 가장 큰 병목으로 지적되어온 상동성 검색 단계를 획기적으로 개선한 것으로, 향후 단백질 구조 예측, 기능 분석, 신약 개발 등 다양한 생명과학 토토사이트 잘못환전에서 폭넓게 활용될 수 있을 것으로 기대된다.