오픈AI, 생명과학 특화 모델 'GPT-Rosalind' 공개… 신약 개발 가속화

오픈AI가 공개한 'GPT-Rosalind' 연구 전용 인터페이스(Codex 앱) 예시./사진=오픈AI 홈페이지

오픈AI가 생물학, 신약 개발 및 중개 의학 연구에 최적화된 차세대 추론 모델 'GPT-로잘린드(GPT-Rosalind)'를 16일(현지 시각) 공개했다.

이번 모델은 화학, 단백질 공학, 유전체학 등 전문 분야에 대한 심층 이해와 과학 도구 활용 능력을 결합해 복잡한 연구 워크플로를 혁신적으로 단축하는 데 중점을 뒀다. 모델명은 DNA 구조 발견에 결정적 기여를 한 영국 생물학자 로잘린드 프랭클린 이름을 따 명명됐다.

미국 내 신약 개발은 타깃 발굴부터 규제 승인까지 평균 10~15년이 소요되며, 초기 단계 타깃 선정 오류는 막대한 비용과 시간 손실을 초래한다. GPT-로잘린드는 방대한 과학 문헌, 전문 데이터베이스, 실험 데이터를 통합 분석해 연구자가 더욱 정확한 생물학적 가설을 수립하고 고품질 실험을 계획하도록 돕는다.

샘 알트먼 오픈AI 최고경영자(CEO)는 "AI는 단순히 기존 업무 효율을 높이는 수준을 넘어 과학자가 간과할 수 있는 연결 고리를 발견하고 더 나은 가설에 조기에 도달하게 함으로써 신약 개발 성공률을 획기적으로 높일 것"이라고 밝혔다.

GPT-로잘린드는 다양한 생명과학 벤치마크 평가에서 기존 모델을 압도하는 성능을 보였다. 생물정보학 및 데이터 분석 지표인 '빅스벤치(BixBench)'에서 제미나이 3.1 Pro와 GPT-5.4를 제치고 최고 점수인 0.751점을 기록하며 선두에 섰다. 연구 워크플로 수행 능력을 평가하는 '랩벤치2(LABBench2)'에서는 문헌 검색 및 프로토콜 설계 등 11개 과제 중 6개에서 GPT-5.4를 능가했다. 특히 분자 클로닝 설계 부문에서 유의미한 향상을 나타냈다.

실제 산업계와 협업 성과도 구체화됐다. 유전자 치료제 설계 기업 다이노 테라퓨틱스와 진행한 RNA 서열 기능 예측 테스트에서 인간 전문가 상위 5% 수준의 성능을 입증했다. 해당 모델은 연구 전용 인터페이스 코덱스(Codex)를 통해 미국 국립생물정보센터 등 50개 이상의 전문 과학 도구와 멀티오믹스 데이터베이스를 직접 운용하며 단백질 서열 분석이나 질병 타깃 검증 등 복잡한 과제를 자연어 명령으로 수행한다.

오픈AI는 모델 개발 단계부터 글로벌 산업계와 강력한 파트너십을 구축했다. 암젠, 노보 노디스크, 모더나를 비롯해 엔비디아, 오라클 헬스, 써모 피셔 사이언티픽 등이 GPT-로잘린드를 실제 연구 현장에 적용 중이다.

생물학적 데이터의 민감성을 고려해 보안 거버넌스도 강화했다. 오픈AI는 '신뢰 기반 접근' 정책을 도입해 자격을 갖춘 엔터프라이즈 고객을 대상으로 거버넌스 체계를 엄격히 심사한 뒤 접근 권한을 부여한다. 향후 로스앨러모스 국립연구소 등과 협력해 단백질 및 촉매 설계 등 고난도 연구 과제로 모델 능력을 확장할 계획이다. 유료 구독 모델의 구체적인 가격 정책은 프로그램 확대 시점에 공개된다.

구교윤 기자

입력 2026/04/17 11:14

관련기사