제약 혁신이라는 방대한 분야에 있어, 희귀질환 만큼 설득력있는 도전과 기회를 제공하는 치료영역은 거의 전무합니다. 소규모 환자 집단에 영향을 미치고 다양한 임상 증상을 특징으로 하는 희귀질환 분야는 연구 및 상업화를 추진하기 위해 혁신적인 접근법과 최첨단 기술을 필요로 합니다.
Real world data(RWD)와 정밀의학 시대를 맞고 있는 현재, 희귀질환의 미스터리를 풀고 개별환자에게 맞춤형 치료법을 제공하려는 탐험은 그 어느때 보다 희망적으로 느껴집니다. 급증하고 있는 희귀질환 관련 데이터 출처는 연구 및 개발, 임상연구, 치료결과, 의약품 안전 및 마켓액세스와 같은 제약기업의 의사결정이 힘을 실어줄 수 있습니다.
최근 클래리베이트 생명과학부서의 Mike Ward 글로벌 사고리더십책임자가 개최한 웨비나는 희귀질환 분야에서 데이터가 하는 역할과 기업이 이 복잡하고 진화하는 분야에 대응하기 위해 어떤 조치를 취해야 하는지에 대한 동적인 부분을 살펴봤습니다. 웨비나에서 논의된 주제 중 하나는 기업이 희귀질환과 관련된 데이터의 품질, 정확성 및 완전성을 어떻게 보장할 수 있느냐 에 대한 것이었습니다.
다양한 출처에서 생성된 풍부한 데이터를 활용해 사용 가능한 전체 데이터베이스를 기반으로 의미있는 인사이트를 추출하고 이를 실행가능한 전략으로 변환해야 하는 과제가 도출됩니다. 정형화되지 않은 데이터의 양이 압도적일 경우, 머신러닝을 활용해보십시오. 머신러닝을 제대로 활용하게 되면 이 상황을 돌파할 수도 있습니다.
이때 나오는 질문은 다음과 같습니다: 희귀질환 데이터를 추출하고 해석하기 위해 어떤 계산 및 분석 도구가 사용 가능한가요? 어떻게 기업들이 데이터 생성과 실행가능한 인사이트 사이의 간극을 메울 수 있을까요?
이 주제는 곧 발표될 백서를 통해 보실 수 있을 것입니다. 클래리베이트 생명과학부서의 Hemanth Nair, Real World Data 증거 참여 및 혁신 부서 이사는 RWD에 머신러닝을 적용해 임상시험 과정, 임상 현장 모집 및 환자 식별과정에 대한 기본적인 결정을 내리는 방법에 대해 설명하는 동시에 희귀 질환 고객과의 프로젝트를 통해 얻은 실제 사례를 제시할 예정입니다.
데이터 대홍수 속에서 실행가능한 인사이트를 얻기까지
컴퓨팅 도구, 데이터베이스 및 플랫폼은 데이터 마이닝, 데이터 통합, 데이터 표준화 및 품질 보장, 데이터 시각화 및 해석 등… 희귀질환 치료법의 향상을 위해 점점 더 많이 활용되고 있습니다. 이런 상황을 고려할 때, 어떤 도구들을 사용할 수 있을까요? 그리고 왜 희귀질환 의약품 개발의 일부분으로 이런 도구를 간주해야할까요?
- 데이터 마이닝
지도학습 및 비지도 학습 방법을 포함한 머신러닝 알고리즘은 복잡한 데이터 세트내에서 패턴, 상관관계 및 연관성을 찾을 수 있습니다. 딥러닝, 자연어 처리(NLP)및 신경망과 같은 인공지능 기반의 접근방식은 질병 메커니즘, 환자 치료결과 및 치료반응에 대한 인사이트를 제공하는 고급 데이터 분석 및 예측 모델링을 가능케 합니다.
바이오인포매틱스 도구는 DNA 염기 서열분석, 유전자 발현 프로파일링, 변이 주석을 포함한 게놈데이터 분석을 용이하게 해줍니다.
NCBI의 GenBank, 일본의 DNA DataBank 및 European Nucleotide Archive와 같은 유전체학 데이터 베이스 및 리소스는 희귀질환 연구를 위한 주석이 달린 게놈, 유전적 변이체 및 기능적 주석에 대한 액세스를 제공합니다.
- 데이터 통합
데이터 통합 플랫폼을 사용하면 전자 건강 기록(EHR), 환자 등록부, 오믹스 데이터 등 서로 다른 소스의 이종 데이터 세트를 집계해 조화롭게 사용할 수 있습니다.
이런 플랫폼은 포괄적인 데이터 분석을 촉진하고 연구자가 임상, 유전 및 분자 정보의 상관관계를 분석할 수 있도록 지원해 질병 생물학 및 환자 표현형에 대한 전체적인 관점을 제공합니다.
시장에는 제약 산업의 데이터 통합 요구 사항을 충족하는 다양한 플랫폼과 솔루션이 있으며, 각 플랫폼과 솔루션은 고유한 기능을 갖추고 있습니다. 특정 조직의 요구 사항에 가장 적합한 것을 결정하려면 특정 요구 사항 및 사용 사례를 기반으로 이 플랫폼들을 평가하는 것이 중요합니다.
- 데이터 표준화 및 품질 보증
데이터 수집, 큐레이션 및 검증을 위한 표준화된 프로토콜을 구축하면 서로 다른 플랫폼과 기관 간에 데이터 무결성과 상호 운용성이 보장됩니다. 예를 들어, CDISC(Clinical Data Interchange Standards Consortium)는 의료 연구 및 의료 관련 영역을 개선하기 위해 정보 시스템 상호 운용성을 가능하게 하는 플랫폼과 독립적인 글로벌 데이터 표준을 개발하고 촉진합니다.
CDISC 표준은 연구 설계, 데이터 수집, 데이터 표현, 데이터 교환 등 다양한 임상 연구 데이터를 포함합니다. 임상 시험 데이터를 구성하고 표준화하기 위한 SDTM(Study Data Tabulation Model), 분석 데이터셋을 위한 ADaM(Analysis Data Model), 사례 보고서 양식(CRF) 및 데이터 수집을 위한 CDASH(Clinical Data Acquisition Standards Harmonization) 등의 표준을 가지고 있습니다.
견고한 품질 보증 프로세스를 구현하면 오류 및 불일치의 위험이 완화되며, 데이터에 대한 전반적인 신뢰성을 향상시킬 뿐 아니라 데이터 기반 인사이트의 신뢰성도 향상됩니다. 규제 산업을 위해 특별히 설계된 도구를 사용할 수 있으며, 표준화되고 자동화된 품질 프로세스를 통해 기업이 제품 품질을 유지하고 규제 요구 사항을 준수하며 전반적인 운영 효율성을 향상할 수 있도록 지원합니다.
- 데이터 시각화 및 해석 도구
대화형 대시보드 및 히트맵과 같은 데이터 시각화 도구는 복잡한 데이터 세트의 탐색 및 해석을 용이하게 해 이해관계자가 추세, 이상치 및 실행 가능한 인사이트를 식별할 수 있도록 지원합니다.고급 분석 플랫폼은 사용자 정의 가능한 분석 파이프라인과 시각화 옵션을 제공하여 사용자가 원본데이터에서 의미 있는 인사이트를 추출하고 결과를 효과적으로 전달할 수 있도록 지원합니다.
다양한 출처의 데이터를 시각화, 분석 및 해석하는 RapidMiner, SAS Visual Analytics, Tableau 및 TIBCO Spotfire와 같은 도구는 바이오제약 및 의료 기기 업계에서 널리 사용되고 있습니다.
클래리베이트가 인공지능 및 머신러닝을 활용해 기업이 혁신적인 의약품, 기기 및 진단을 개발하고 지식을 생성하며 지식재산을 보호할 수 있도록 지원하는 방법에 대해 자세히 알아보려면 이곳을 방문해 알아보시기 바랍니다.