한국경제가 어려움에 직면해 있다. 미중 무역 갈등, 일본의 화이트리스트 배제 등과 같은 정치적 요인과 더불어 계속되는 제조업 불황과 반도체 수요 감소 등의 시장요인이 복합적으로 작용하고 있는 듯하다. 10대 기업의 올해 상반기 영업이익이 50%이상 급감했다.
제약산업에서도 좋지 않은 뉴스가 들려온다. 코오롱제약에서 개발한 세계 최초의 유전자 세포 치료제 인보사가 잘못된 세포를 사용한 것이 발견되어서 허가가 취소되었다. 신라젠이 개발한 항암제가 미국에서 3상 임상실험이 실패하였고 한미약품에서 다국적 제약회사 얀센과 계약한 기술이전이 취소되었다. 제약산업이 위기이다.
우리나라의 신약개발의 역사는 길지 않다. 1999년 SK케미칼에서 개발한 위암 항암제 선플라를 시작으로 2018년 8월까지 30개의 신약이 국내에서 승인 되었으며, GC녹십자나 비이로메드 등의 제약회사들이 현재 다양한 신약들에 대한 미국에서의 임상시험을 진행 중이다. 지난 20년간 신약개발시장이 급격히 커졌으며, 최근의 악재들은 제약산업의 도약을 위한 성장통일 것이다.
데이터 과학은 제약산업의 성장통 극복을 위한 필수요소이다. 신약개발은 크게 후보물질 발굴과 임상시험 단계로 구분된다. 실험실에서 신약으로 적절한 후부물질을 개발한다. 인공적으로 합성을 하거나 동식물에서 추출한다. 임상시험은 찾아진 후보물질의 안정성 및 유효성을 인간을 대상으로 검증하는 단계이다. 하나의 신약개발에 10년 이상의 시간과 3조원 정도의 비용이 필요하며, 이중 60%이상이 임상시험 단계에 사용된다.
임상단계에 많은 시간과 비용이 소모되는 이유는 인간을 대상으로 실험을 하기 때문이다. 인간을 대상으로 기존에 알려지지 않은 약을 사용하는 것이기 때문에 매우 조심스럽게 진행된다. 임상시험을 3단계로 나누어서 진행하는 이유이다. 또한, 의사결정에 제약회사 등의 이익집단의 영향을 최소화하기 위한 다양한 장치가 필요하다. 신약과 기존의 약을 랜덤하게 환자에게 처방해야 하며, 어떤 약이 처방되었는지는 환자뿐 아니라 약을 처방하는 의사나 약사도 몰라야 한다. 모든 데이터가 코드화되어서 모여지며 최종분석에 이르러서야 코드의 정체가 알려진다. 매우 복잡한 데이터과학이 임상시험의 핵심에 자라잡고 있다. 이러한 모든 과정은 관련 부처(미국은 FDA, 한국은 식약처)에서 엄격하게 심사되고 승인된다. 평균적으로 10%미만의 후보물질만이 임상시험 단계를 거쳐서 시판이 허락된다.
신약에 대해서 데이터 과학에 기반한 엄격한 임상시험을 요구하는 이유는 1950년대 유럽에서 발생한 탈레노마이드 사건 때문이다. 1956년 독일의 한 제약회사는 새로운 진정제를 개발하였고 간단한 동물실험을 통해서 안정성을 입증한 후 그 이듬해에 바로 시판을 시작하였다. 특히 입덧에 효과가 좋다고 알려져서 많은 임산부들이 이 약을 복용하였다. 하지만 결과는 처참했다. 5년간 이 약의 부작용으로 무려 2만 여명의 기형아가 출산됐기 때문이다. 이 사건 이후로 신약개발에 매우 엄격한 임상시험을 요구하기 사작하였다.
미국의 FDA의 약물심사위원이었던 프랜시스 켈시는 임상시험 데이터의 미비 등의 이유를 들어서 외부의 다양한 압력에 굴복하지 않고 약의 승인을 허가하지 않았다. 이 덕분에 미국에서는 관련 기형아가 17건밖에 보고되지 않았으며, 프랜시스는 이 공로로 케네디 대통령의 표창을 받았다. 나아가, FDA는 그녀의 이름을 따서 켈시상을 수여하고 있다.
코오롱 제약의 인보사 사태는 우리나라 데이터과학의 현주소를 잘 보여준다. 국내에서는 승인된 약의 문제점이 미국에서 임상시험 중에 발견되었다. ‘세계 최초’라는 수식어에 반해서 제출된 자료를 꼼꼼하게 챙기지 못한 것인지 아니면 제출된 자료들을 공정하게 평가하지 못한 것인지 알 수는 없지만, 신약개발에서 임상시험, 즉 과학적 평가의 중요성에 대한 인식이 높지 않은 것은 사실인 것 같다. 새로운 약을 만들어서 엄청난 부를 가져오는 것에 취해있었던 것은 아닐까 생각해본다. ‘데이터 기술’이 아니고 ‘데이터 과학’이라고 불리는 이유를 곱씹어 볼 필요가 있다.