[알기쉬운 과학속으로]단백질을 계산한다, 단백질 정보학


작년 한 해 동안 우리는 식탁 위에 오르는 음식들에 대해 다시 한 번 살펴보는 습관을 들이게 되었다. 가게에서 사는 야채 하나도 원산지를 확인하고, 과자 한 봉지 살 때에도 작은 글씨로 봉지 위에 희미하게 적혀 있는 원재료와 성분 분석표를 애써 읽어보지만, 손에 든 제품이 과연 안전한 먹거리인지 확신이 가지 않는다. 계속 이어지는 식품 안정성의 문제제기가 우리에게 새로운 습관을 가져다준 것이다.

온 나라를 들썩이게 한 광우병 파동에 이어 지난 가을에는 중국산 멜라민 분유가 우리의 식탁을 위협했다. 광우병은 프리온이라는 '단백질'의 변형체가 일으키는 질병이고, 멜라민 분유는 분유의 '단백질' 함량을 속이기 위해 멜라민이라는 화합물을 섞은 사건이다.

단백질이 정치와 경제의 주요 이슈가 되었던 한 해였고, 단백질 문제로 우리 식생활의 안전 문제가 불거진 한 해였다. 유전자를 기초로 생성되는 단백질은 생명현상을 주도하여, 우유의 단백질처럼 우리 몸을 튼튼하게도 하지만, 변형 프리온과 같이 한 단백질의 비정상적 변화가 몸에 치명적인 영향을 주기도 한다. 몸이 허약해지면 단백질을 보강하기 위하여 아미노산을 섭취하고, 질병 치료를 위해 특정 단백질을 약물로 복용하여 보충하기도 한다.

우리의 건강과 직결되어있는 단백질이 우리 몸에 어떻게 분포되어 있는가를 아는 것은 우리의 건강상태를 파악하는 데에 큰 도움이 될 것이다. 그러나, 아직 과학기술은 우리 몸의 전체 단백질을 완전하게 분석할 만큼 발전하지는 못하였다.

인간은 2만~3만 개 정도의 유전자를 가지고 있다고 하는데, 유전자로부터 만들어지는 단백질은 수십 만 종류에 달하며, 각각의 단백질이 생성과 변형, 소멸을 반복하는 역동적인 반응이 우리 몸 구석구석에서 일어나고 있으므로, 우리 몸 안의 단백질을 이해한다는 것은 매우 복잡하고 어려운 일이다.

단백질을 분석하는 방법은 분석 목적에 따라 여러 가지가 있다. 분유의 단백질 함량 검사와 같이 모든 단백질의 총량을 분석하기도 하고, 혈액 내에 알부민과 같은 특정 단백질의 농도를 조사하여 건강을 체크하기도 한다. 한국기초과학지원연구원에서 운영하는 첨단 질량분석기를 이용하는 프로테오믹스 (proteomics) 분야의 연구에서는 시료 내에 어떤 단백질이 얼마만큼 존재하는지 단백질 전체에 대한 총체적인 분석을 실시한다.

각각의 단백질의 정량분석은 어떤 단백질이 질병을 일으키는가를 찾아내고, 그 단백질이 어떤 경로를 거쳐서 질병을 일으키는지 발생 경로를 분석하며, 질병치료를 위해 개발한 신약이 우리 몸에서 제대로 작동하는지를 확인하는 등 질병의 진단과 치료에 사용한다. 한편 특정 동물이나 식물의 원산지에 따라 단백질의 분포가 다른 패턴을 보임을 이용하여 원산지 추적에도 활용하는 등 프로테오믹스의 응용 분야는 매우 다양하다. 이러한 단백질 연구에서는 대량의 실험 데이터로부터 여러 종류의 단백질 정보를 끄집어내는 계산 작업이 수반되어, 대량의 데이터를 처리하고 해석하는 정보기술이 필수적으로 요구된다. 십여 년 전에 프로테오믹스 분야가 각광을 받기 시작하면서, 단백질의 분석에 정보기술을 적용하는 단백질 정보학 분야의 연구도 전 세계에서 활발하게 이루어지고 있지만, 국내에서는 아직 전문가가 많지 않아서 생소한 분야이다. 단백질 정보학은 크게 세 가지 분야로 나눌 수 있다. 첫째는 실험 데이터로부터 가능한 한 많은 단백질 정보를 얻어내는 방법에 대한 연구이다. 첨단 장비로 얻은 실험 데이터는 우리가 아직 완벽하게 설명할 수 없지만 많은 정보들이 포함되어있다. 단백질 정보학은 생물학, 화학, 물리학, 수학, 전산학 등에서 얻은 지식을 활용하여 지금까지 드러나지 않았던 새로운 정보들을 실험 데이터에서 발굴한다.

둘째로 실험에서 얻은 단백질 정보가 믿을만한 것인가를 판별하는 연구를 수행한다. 생명과학 분야의 대규모 투자와 함께 첨단 장비를 사용한 대량의 데이터들이 쏟아지면서 우리는 데이터의 홍수를 만나게 되었다. 이제는 이 많은 데이터에서 옥석을 가려내는 평가 방법을 고민해야할 시기이다.

보다 신뢰도 높은 데이터를 정제하여 생물학 연구에 유용하게 사용할 수 있어야 한다. 이를 위해서는 통계학, 전산학 등에서 기존에 연구되어 온 데이터 유의성 및 신뢰도 평가 방법을 적용한다.

셋째로 단백질 정보학은 이렇게 얻은 단백질 정보들을 다른 생물정보와 연결하여 생체 내에서의 단백질의 기능을 밝히는 방법을 연구한다. 생물학 특히 분자생물학, 생화학 분야에서 과학자들이 오랜 기간 축적한 연구결과물들을 데이터베이스화하고 이들을 서로 연결하여 시스템적인 분석으로 생명 현상을 설명하는 데에 단백질 정보학은 일익을 담당하고 있다.

단백질 정보학은 이처럼 여러 분야의 과학이 융합된 연구 분야이다. 한 가지를 제대로 하기도 어려운데 여러 분야의 융합이라니 쉽지 않은 일이다.

그러나 인터넷과 데이터베이스의 발전으로 수많은 정보들이 우리 손 안에 쥐어져 있으며, 이들을 적절하게 다루는 기술을 구사하면 예상치 못했던 새로운 사실들이 우리 앞에 모습을 드러내게 된다. 안전한 먹거리와 국민의 건강을 위한 기초적인 융합 연구인 단백질 정보학에 유능한 젊은이들이 관심을 갖고 도전하기를 기대한다.

/ 권경훈 박사 한국기초과학지원연구원 질량분석연구부








포토뉴스