단백질의 리본 다이어그램은 누가 만들었나?

요즘은 단백질을 표시할 때 다음과 같은 리본 다이어그램 (Ribbon Diagram) 을 많이 이용한다.

즉 알파 나선(Alpha-Helix)을 리본 형태로, 베타 쉬트(Beta-Sheet) 를 화살표로, 그리고 루프를 연결선으로 그리는 이러한 스타일은 단백질의 2차 구조와 전체적인 형태를 간단하게 보여줄 수 있다는 점에서 많은 사람들이 좋아하고 있으며 수많은 문헌에서 사용되고 있다. 그러나 이러한 리본 스타일의 단백질 그림은 언제부터 나타났을까?

사실 최초의 단백질 입체 구조 규명인 1957년 존 켄드류의 마이오글로빈 구조 논문에서는 이러한 그림을 사용하지 않았다. 그는 마이오글로빈 결정에서 나타난 전자 밀도 데이터를 기반으로 다음과 같이 마이오글로빈의 구조를 묘사하였는데..

소….소세지?????

나중에 좀 더 고해상도의 데이터를 가지고 마이오글로빈의 원자 수준의 모델을 만들기 위하여 존 켄드류는 수수깡을 이용하여 다음과 같이 모델을 만들었고 화가 어빙 게이스 (Irving Geis)는 사이언티픽 아메리컨 잡지에 실을 목적으로 원자 수준의 다음과 같은 그림을 그렸다. (당시에는 컴퓨터 그래픽 따위가 없었으므로 ‘손’ 과 ‘붓’ 으로 그렸다)

이렇게 단백질을 구성하는 원자를 막대기로 그리는 방식의 표현은 단백질을 구성하는 모든 원자를 자세히 보여준다는 장점이 있었다. 그러나 이러한 방식의 ‘막대기’ 형식의 단백질 표현은 몇 가지의 문제가 있었는데

(1) 간단한 단백질이면 모르지만, 단백질이 복잡해질 수록 점점 전체적인 구조를 알기 힘들어진다. 가령 헤모글로빈만 하더라도 마이오글로빈과는 달리 4덩이의 단백질로 구성되어 있다.
(2) 단백질의 2차 구조, 즉 알파 나선과 베타 쉬트가 어떻게 구성되어 있는지를 알기 어렵다.

사실 어빙 게이스는 최초로 단백질을 묘사하면서 알파 나선을 리본 형태로 묘사하는 것을 시도하였다. 가령 마이오글로빈의 구조를 묘사할 때 주로 알파 나선으로 구성된 단백질을 리본 형태로, 헴을 막대기로 묘사한 것을 처음 시도한 것은 어빙 게이스이다.

그러나 그는 단백질의 베타 쉬트를 화살표로 표시하지는 않았다. 그렇다면 알파 나선을 리본 형식으로, 베타 쉬트는 진행 방향을 화살표로 표시하는 현재의 ‘리본 다이어그램’ 을 완성한 사람은 누구인가?

Jane S Richardson (1941-)

지금 현재 듀크대학 생화학과에 약 50년 넘개 재직하고 있는 리처드슨 교수는 남편인 데이비드 리처드슨과 함께 1970년대부터 단백질 결정학을 연구하였다. 그가 1975년 최초로 규명한 과산화물 제거효소 (Superoxide Dismutase)는 다음과 같이 베타 쉬트가 많이 있는 단백질이었다.

그는 나중에 이외에도 많은 단백질이 비슷한 형식으로 베타 쉬트로 구성된 구조로 되어 있다는 것을 발견하였다. 베타 쉬트의 방향을 표시하고 이의 구조를 비교하기 위하여 그는 베타 쉬트를 화살표로 표시하기로 하였다.

리처드슨은 나중에 이러한 다이어그램을 손으로 그렸고, 이 그림은 단백질을 2차 구조로 간단히 표시할 수 있으며, 비슷한 구조를 가진 복수의 단백질의 전체적인 구조를 일목요연하게 볼 수 있게 됨으로써 매우 유용한 표시 수단이었다.

그러나 1970년대 말까지만 하더라도 이러한 리본 다이어그램은 손으로 그려야 하였으므로 그림에 재주가 있는 사람이 아니면 엄두를 낼 수 없을 상황이었다. 그렇다면 똥손도 이러한 그림을 그릴 수 있게 만들어준 컴퓨터 프로그램은 처음 어떻게 등장하였을까?

1982년 아서 레스크 (Arthur M Lesk)와 IBM의 칼 하드맨 (Karl D Hardman) 이라는 연구자는 단백질의 원자 좌표가 들어있는 PDB 파일을 입력 파일로 주면 이러한 다이어그램을 그려주는 프로그램을 개발하였다. 이것이 지금 현재 볼 수 있는 모든 단백질 입체 구조 시각화의 원조가 되는 프로그램인 셈이다.

지금의 기존으로는 상당히 조악한 그림이지만, 당시에 이러한 그림 그리기 위해서 화가에게 애걸복걸해서 겨우 몇 달 걸려서 한장 그리던 과학자들에게는 이렇게 데이터만 넣어주면 단백질 구조를 그려주는 컴퓨터 프로그램의 등장은 정말 획기적인 일이었을 것이다. 그 중요성에 걸맞게 이 논문은 1982년 S모 잡지에 출판되었다.

그 이후 수많은 단백질 시각화 소프트웨어들이 명멸하였다. Rasmol, Molscripts, MolMol, PyMol, Chimera, ChimeraX…지금은 웬만한 ㄸ컴에서도 리얼타임으로 돌아가는 단백질 시각화 소프트웨어지만 1990년대 중반만 하더라도 아무나 돌릴 수 없었고 그 당시에도 대당 수천만원이던 실리콘 그래픽스에서 나온 존나 비싼 워크스테이션에서나 그릴 수 있었다.

그러나 이러한 것이 지금과 같이 ㄸ컴에서도 다 돌아갈 수 있게 된 것은 과학자들의 불철주야에 걸친 노력….은 1도 관계 없고 1990년대 말부터 본격화된 3D 게임의 붐과 GPU등장으로 아무 컴퓨터에서나 3D 그래픽스와 리얼타임 그래픽을 즐길 수 있게 된 덕이다. 따라서 이를 가능케 한 영웅(?) 들에게도 인사를 드리는 것이 좋을 것이다.


아미노산 1자 코드는 누가 만들었나?

생화학을 공부한 사람이라면 20종류(+2종) 의 단백질을 의미하는 3자 혹은 1자 코드에 대해서 알고 있을 것이다.

사실 3자 코드는 아미노산의 영어 이름의 첫 3글자로 거의 되어 있기 때문에 이것이 어디서 나왔는지 모르는 사람이 없다. 그러나 1자 코드는? 물론 세린 (Serine), 알라닌(Alanine), 류신 (Leucine), 메티오닌 (Methione) 등은 앞 글자로 되어 있기 때문에 외우기 어렵지 않지만 문제는 앞 글자와 다른 것들이다. 아르기닌 (Argnine) 이 R, 타이로신 (Tyrosine)이 Y 인 것은 이미 A와 T가 다른 아미노산이 사용하고 있기 때문에 두번째 글자를 사용했다고 하면 그래도 외워질 수 있으나 페닐알라닌은 왜 F이며 트립토판은 왜 W인가? 글루탐산은 왜 E 이며 아스파르트산은 왜 D 인가?

누가 어떤 의미를 가지고 어떤 목적으로 1글자 코드를 만들었을까?

를 궁금해 해 본 사람은 없는가?

일단 아미노산의 One-Letter Code를 제안한 사람은 오늘날에도 일부 학계에서 그 이름이 잘 알려진 분이다. 이 분은 바로..

Margaret Oakley Dayhoff (1925-1983)

이 분은 생물정보학에 조금이라도 관련이 있는 사람이라면 몰라서는 안되는 분인데, 그 이유는 거의 생물정보학의 창시자라고 불러도 될 분이기 때문이다. 아직도 ? 이라고 생각하는 사람이라면 치환행렬 (Substitution Matrix) 라는 개념을 생물정보학에서 처음 제창하였고 이 분이 만든 PAM (Point Accepted Mutation) 이라는 개념은 아직도 사용된다는 것 정도는 기억할 것이다. 이러한 개념을 처음 제안한 사람이 바로 이 분이다.

그렇다면 이 분은 어떤 배경을 가졌길래 생물정보학의 창시자라고 불릴 만한가? 자세한 문헌은 여기를 참고하도록 하고..

이분은 원래 양자화학 (Quantum Chemistry) 으로 1948년에 학위를 했는데, 연구 주제는 화합물의 공명에너지를 당시에 희귀했던 컴퓨터를 이용하여 계산을 하는 것이었다. 당시에 컴퓨터라는 것이 발명된지도 얼마 되지 않은 상황에서 컴퓨터를 잘 다룬다는 것이 그당시로는 얼마나 대단한 스킬이겠는가? 어쨌든 그는 박사학위를 마치고, 컴퓨터를 이용하여 화학 관련 계산을 하는 당시에는 흔치 않은 전문가가 되었고, 1960년 메릴렌드의 National Biomedical Research Foundation 이라는 곳에 자리를 잡았다. 여기서 컴퓨터 기술을 이용하여 여러가지 생물학적인 문제를 해결하는 다양한 연구를 하게 되었다.

그러던 중 그의 관심을 끌게 된 것은 ‘서열 정보’ 였다. 오늘날은 주로 DNA 서열을 먼저 결정하고 유전 암호에 의해서 번역된 서열로 단백질 서열을 유추하지만, 실용적인 DNA 서열 결정방법이 개발된 것은 1970년대 후반이고, 1960년대에 있던 단백질의 서열은 1952년 프레데릭 생어 (Frederic Sanger)가 개발한 단백질의 서열 결정 방법에 의해서 결정된 것이다.

물론 이 양반은 1977년에 DNA 서열을 결정하는 방법도 개발하긴 했지만, 여튼 1970년대 후반까지 인류가 알고 있던 단백질의 서열은 모두 정제된 단백질을 분해하여 어떤 폴리펩타이드로 구성되었는지를 알아내서 알아낸 것이었다. 1960년대 중반쯤 인간이 알고 있던 단백질 서열은 약 70종류였고, 이들은 대부분 사이토크롬 c 나 헤모글로빈과 같이 대량으로 많이 얻기 쉬운 단백질이었고, 여러 가지 다른 생물 유래의 것들이 많았다.

이들은 이렇게 얻어진 단백질 서열을 정리하면서 서로를 비교할 필요성을 느꼈다. 그렇다면 이것을 어떻게 비교해야 하는가? 기존에는 단백질의 아미노산 서열을 3자로 기록했었다. 그러나 당시의 후진 컴퓨터는 진짜로 보잘것 없는 기억용량을 가지고 있었으며, 기억용량을 줄이기 위해서는 아미노산의 글자를 1자로 하는 것이 절대적으로 유리했다. 그리고 여러가지 다른 생물의 서열을 비교할때 프린터로 출력하여 서열을 비교하는데도 3자 대신 1자로 비교하는 것이 보기 편했기 때문에 데이호프는 각각의 아미노산에 대응하는 코드를 만들기로 했다. 일반적으로 많이 사용되는 단백질의 아미노산은 20종이고, 알파벳은 26종이므로 적어도 아미노산에 대응하는 글자가 모자랄 염려는 없다.

일단 시스테인 (C), 히스티딘 (H), 이소류신 (I), 메티오닌 (M), 세린 (S), 발린 (V), 알라닌 (A), 글리신 (G), 류신 (L), 프롤린 (P), 쓰레오닌 (T)은 그대로 첫 글자를 사용하였다. 글자가 겹치는 아미노산들이 있는데 왜 이들을 선택했을까? 그 기준은 그때까지 알려진 단백질 서열에서 더 자주 사용되며, 구조가 간단한 아미노산에게 우선권을 주었다고 한다.

그러나 이제부터 첫글자가 겹치는 것이 등장하는데..

아르기닌 Arginine

타이로신 Tyrosine

이들은 두번째 글자인 R과 Y를 이용하여 지정하였다. 그러나 페닐알라닌 Phenylalanine과 트립토판 Tryptophan은? 두번째 글자인 R 역시 이미 사용되는 코드이므로 겹치지 않아야 한다. 페닐알라닌의 경우에는 비슷한 발음인 Fenyl…을 따서 F로, 트립토판은 화학구조에서 두 개의 링 (Double Ring)이 있다는 것에 착안하여 W(Double U, 더블유) 로 지었다.

그리고 다음은

아스파르트산 Aspartic Acid

아스파라긴 Asparagine

글루탐산 Glutamic Acid

글루타민 Glutamine

아미노산의 화학 구조를 아는 사람이라면 아스파르트산과 글루탐산에 암모니아가 하나 더 붙으면 아스파라긴과 글루타민이 된다는 것을 알고 있다. 따라서 아스파르트산과 아스파라긴, 글루탐산과 글루타민은 뭔가 연관이 있는 것이 좋다. 그리고 아스파르트산은 글루탐산보다 작고, 아스파라긴은 글루타민보다 작다는 것을 떠올렸다.

따라서 남은 글자 중에서 아스파르트산을 D, 글루탐산을 그 다음 글자인 E로 정하였다. 그리고 분자량이 더 큰 (아미노기가 붙어서) 아스파라긴과 글루타민을 같은 순서로 남는 글자인 N과 Q로 정하였다고 한다. 왜 N 다음의 글자가 아닌 O가 아닌 Q를 글루타민으로 정했을까? 정확한 이유는 알 수 없지만 Q의 발음이 Glu와 그나마 유사해서 그런 것일지도 모른다. (O는 한참 나중에 22번째 아미노산인 파이로라이신의 약자로 사용된다)

마지막으로 남은 것은 라이신 Lysine 으로써 크기가 비슷한 류신 (Leucine,L) 에서 그리 멀지 않은 곳에 위치한 K를 선택하였다.

U를 사용하지 않은 이유는 손으로 쓴 글자를 해독할때 V와 혼동되지 않도록, O는 프린터 인쇄가 잘못되는 경우 G,Q,C,D와 혼동될 수가 있어서였다고 한다 (지금은 상상하기 힘들지만 그때는 빈번히 아미노산 서열을 손으로 쓰거나 도트 프린터로 인쇄하던 시대라는 것을 생각해야 한다. 결국 이 두 가지 코드는 그런 문제가 없어졌을때 셀레노시스테인과 파이로라이신의 코드로 채용된다)

Dayhoff는  Richard V. Eck 라는 학자와 함께 이렇게 편찬한 ‘현재까지 알려진 단백질 서열’ 을 모두 담고 있는 약 100페이지(!) 짜리 책을 출판하였는데, 이 책의 이름은 ‘Atlas of Protein Sequence and Structure‘ 였고, 이 책이 현재의 Uniprot, NCBI Genbank 등등 모든 서열을 모아놓은 정보의 시초가 되는 셈이다. 이렇게 처음 등장한 아미노산 1자 코드는 1968년 국제생화학회의 작명 위원회의 인증을 받아서 공식 표기법이 되었다.

그런데 사실 아미노산을 1자로 표기할 생각을 한 것이 아니었다. 적어도 수 명의 학자가 자기만의 1자 코드를 주장했었는데, 1963년의 키모트립신의 구조를 다룬 논문에서는 우리가 지금 사용하고 있는 1자 코드와 다른 코드를 사용하고 있다는 것을 볼 수 있다.

페닐알라닌에 F를 사용한 것은 같지만 류신에 U, 이소류신에 W, 아스파르트산에 A, 글루탐산에 G…등 오늘날 알려진 코드와 공통적인 것이 별로 없다. 그러나 아스파라진과 글루타민에 N과 Q를 사용했고 아르기닌에 R을 사용했다는 것은 오늘날의 코드와 동일하다. Dayhoff와 Eck이 자신의 코드를 만들 때 여기에 얼마나 영향을 받았는지는 모르겠지만, 몇 가지 아이디어를 빌려왔을 가능성은 있다.

어쨌든 오늘날의 1자로 된 아미노산 코드는

  1. Margaret Dayhoff와 Richard V Eck 이 출간된 1965년의 ‘Atlas of Protein Sequence and Structure‘ 에 처음 등장하였으며,
  2. 1자 코드가 등장한 이유는 당시의 부족한 컴퓨터 기억용량을 낭비하지 않고 서열 비교 계산을 하기 위해
  3. 그리고 서열 비교를 할때 출력물에서 한눈에 알아보기 쉽게 하기 위해서

만들어졌다고 생각하면 된다.

이렇게 1자 코드를 이용하여 서열 분석을 시작한 이후, 서로 다른 종의 생물 유래의 단백질이 변한다는 것을 깨닫게 되고, 이것이 분자 수준의 진화 연구와 생물정보학의 첫걸음이 시작이 된 것에 대해서는 여백이 없으므로 나중에 (….)

기타 참고할 만한 링크

http://www.biology.arizona.edu/biochemistry/problem_sets/aa/dayhoff.html

SARS-Covid-2를 ‘인공적으로 만드는 것’ 은 가능한가?

일단 현재까지 자연계에서 알려진 코로나바이러스 중에서 SARS-CoV-2 와 가장 비슷한 것은 이녀석입니다. 박쥐에서 발견된 넘입니다. https://www.ncbi.nlm.nih.gov/nuccore/MN996532 그리고 우한에서 제일 먼저 발견된 SARS-CoV-2 의 서열은 이것입니다.

https://www.ncbi.nlm.nih.gov/nuccore/NC_045512.2?report=fasta

이 두 개를 비교해보도록 하죠. 직접 비교할까 했습니다만 이미 다른 사람들이 다 해놨습니다.

https://www.cell.com/current-biology/pdf/S0960-9822(20)30662-X.pdf

이 논문의 Table 1을 보도록 하죠.

현재까지 SARS-CoV-2와 가장 가까운 바이러스인 RaTG13 은 전체 지놈 기준으로 핵산 서열의 일치도가 96.1% 입니다. 그 이야기는 3.9% 의 핵산 서열이 다르다는 것이고, SARS-CoV-2 의 지놈이 길이가 30,000 염기이므로 약 1,000염기 이상이 다르다는 것입니다. 이 중 가장 상동성이 떨어지는 것은 바이러스의 스파이크 단백질 유전자인 ‘S’ 유전자이고, 그 중에서도 직접 세포의 수용체인 ACE2 와 결합하는 영역인 RBD 부분입니다. 이 부분이 왜 가장 빈번하게 바뀌는가? 는 쉽게 유추할 수 있습니다. 많은 종류의 숙주에서 증식하려면 일단 세포에 침투해야 하고, 이 부분과 숙주 세포의 수용체와의 상호작용이 필수적입니다. 그런데 숙주의 수용체는 다 다르고..이를 위해서는 여기에 돌연변이가 많이 일어나서 각각의 환경에서 최적의 환경을 보이는 넘들이 선발된 것입니다.

https://www.researchsquare.com/article/rs-21377/v1

요 논문에 보면 SPike 단백질, 특히 RBD 영역의 서열을 비교해 둔 게 있네요.

당연한 것입니다만, 많은 핵산 변이가 다 아미노산 변화를 유발하지는 않습니다. 돌연변이가 유발되어도 아미노산의 변화를 유발하지 않는 synonymous mutation (코돈의 세번째에 주로 생기는) 가 아미노산을 바꾸는 변이보다도 더 많습니다. 그 이유는 어쩌면 당연합니다. 돌연변이가 생기면 바이러스의 생존 자체에 문제가 있는 부분과, 바뀌어도 좋은 부분이 있습니다.그나마 많은 돌연변이가 생기는 RBD 부분에서도 아미노산에 돌연변이가 생기는 것은 한정적입니다.

RBD 도메인에서 일어나는 변화는 단순히 아미노산 바이러스 변화뿐만 아니라 삽입된 서열 (혹은 삭제된 서열) 이 있습니다. 박쥐에서 발견된 일부 바이러스에는 SARS-CoV-2 나 RaTG13 에는 존재하는 삽입된 서열이 존재하지 않습니다.

이러한 서열의 삽입과 추가는 바이러스마다 다 ‘그때 그때 달라요’ 입니다. 가령 RMYN02 라는 바이러스는 RBD 도메인의 삽입 서열이 없다는 것에서 SARS-CoV-2 와는 다르지만, 스파이크 단백질의 다른 부분에서 SARS-CoV-2 에만 공통적으로 있다고 생각하던 삽입 서열이 있습니다.

위에 보면 SARS-CoV-2 에는 PRRA 서열이 있고, 일부는 이것이 혹시 인위적으로 조작된 증거가 아닌가 하는 궁예를 하기도 했습니다만, 뭐 자연계에 있는 다른 바이러스에도 이 부분에 삽입되는 경우가 있네요.

어쨌든 SARS-CoV-2 와 가장 가까운 자연계에서 발견된 바이러스와 SARS-CoV-2 에는 약 4% 의 서열 차이가 있고, 이는 1,000 염기 정도의 차이입니다. 염기의 차이 중 거의 대부분은 아미노산을 바꾸지 않는 돌연변이이고, 일부만 아미노산을 바꿉니다. 이들 아미노산 변이 중에서 어떤 것이 해당 바이러스들이 가지는 차이 (가 있다면) 에 기인하는지는 잘 모릅니다.

이제 이런 상황을 생각해 보도록 합시다. 어떤 매드사이언티스트 (…)가 자연계에 있는 코로나바이러스를 분리하여 이것을 뜯어고쳐서 닝겐에게 더 잘 퍼지는 바이러스를 만들어서 생물학 테러 같은 것을 일으키고 싶다고 해 봅시다. (왜? 매드사이언티스에게 이유를 묻지 마십시오. 매드사이언티스트는 특별히 자신에게 이익이 없어도 그런 헛짓거리를 하는 닝겐들입니다. 그래서 ‘매드’ 죠) 일단 바이러스 유전체를 인공적으로 조작할 수 있는 기술 자체는 있습니다.

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4727449/?fbclid=IwAR3yQNSiKQFwFLe7Guo2sBC5q84rF4vsYe2raVhl-koCwEPCHtfQiscZntU

즉 바이러스를 DNA 형태로 만들어서 플라스미드 벡터에 넣고, 시험관에서 Transcription을 하여 RNA를 만들고 감염시키는 것입니다. 이러한 것은 바이러스를 연구하는 분들이 많이 사용합니다.

자, 이렇게 자연계의 바이러스에 돌연변이를 주고 조작을 할 준비를 했다고 합시다. 어디를 뜯어고치겠습니까? 감염력을 증대시킨다면 스파이크 단백질, 특히 RBD 도메인 등에 인위적인 조작을 주고, 조작된 바이러스를 만들어서 감염력을 테스트해서 제일 잘 감염되거나 병리학적으로 독성이 제일 강한 넘을 선발할 수는 있겠지요. 그렇다고 한다면 스파이크 단백질이나 RBD 도메인에 돌연변이 라든지 인위적인 조작의 흔적이 남겠지요. 특별히 돌연변이를 준다고 해도 결국은 아미노산을 바꾸는 돌연변이여야 의미가 있을 것이므로 아미노산이 바뀌지도 않는 돌연변이를 만들지는 않을 것입니다. 바이러스의 다른 부분을 뜯어고친다? 아이고….스파이크 단백질 뜯어고치기도 힘든데 다른 부분은 또 왜…뭐 일단 스파이크 단백질을 뜯어고치고 다른 부분을 더 ‘개량’ 한다고 하더라도 그때 역시 아미노산이 바뀌지도 않은 돌연변이를 넣지는 않을 것이고 극히 한정적으로 아미노산이 바뀌어서 바이러스의 성질이 바뀌는 그런 것을 찾을 것입니다. 엔지니어링을 할 때 굳이 ‘잘 돌아가는 다른 부분’ 을 고칠 필요는 없으니까요. 어차피 이런 부분들은 여러 코로나바이러스에서도 스파이크 단백질에 비해서 많이 바뀌지도 않았습니다.

그렇게 만들어진 바이러스는 아마 스파이크 단백질의 일부분, 혹은 지놈의 다른 부분에서 극히 일부분만 한정적인 돌연변이가 있는 그런 바이러스가 될 것입니다. SARS-CoV-2 와 RaTG13 의 차이처럼 약 천개 넘는 돌연변이가 있고, 대부분은 기능에 영향을 미치지도 않는 아미노산을 변화시키지도 않는 돌연변이가 있는..

물론 바이러스를 ‘조작’ 하는 방법은 현대 유전공학적인 방법만 있는 것은 아닙니다. 사실 닝겐은 현대 유전공학이 대두되기 전부터 바이러스를 ‘조작’ 해 왔습니다. 무슨 말이냐구요? 약독화 백신입니다. 즉, 상당수의 백신은 살아있는 바이러스입니다. 이를 만드는 방법은 바이러스를 자신이 병을 일으키는 숙주와는 조금 다른 환경에서 존나 오래 키우는 것입니다. 바이러스를 오래 키우다 보면 돌연변이가 누적되고 그 성질이 변합니다. 즉 병을 일으키는 숙주와다른 환경에 살다 보면 자연스럽게 여기에 적응하는데 유리한 돌연변이가 축적되고, 이러한 돌연변이는 원래의 병원성을 약화시킬수도 있습니다. 이런 식으로 만들어진 백신 중의 대표적인 것이 황열병 백신으로써, 황열병 백신은 원래의 숙주인 원숭이 혹은 닝겐이 아닌 수정란에서 오랫동안 계대배양을 하여 병원성을 잃어버리도록 한 바이러스입니다. 또 다른 것은 소아마비 백신 중 경구 투여를 할 수 있는 생백신으로써 이것은 사빈이라는 사람이 만들었습니다. 이 역시 발견된 소아마비 바이러스를 존나 오랫동안 배양해서 얻어졌습니다.

그렇다면 병을 일으키는 바이러스와 인공적으로 존나 오래 배양되어서 얻어진 생백신은 얼마나 차이가 있을까요?

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC137059/?fbclid=IwAR1ICTyCv0ulXWALsJehOuYnj3-PeCyPltLZ6JNAKhJ1PDmmNfEkJWqgj3I

2002년의 이 논문에서는 존나 쎈 소아마비를 일으키는 바이러스인 마호니 스트레인 (Mahoney Strain)을 오랫동안 계대배양해서 만들어진 약독화 바이러스 (생백신) 의 염기서열 차이를 분석했습니다. 마호니 스트레인과 약독화 바이러스는 핵산 기준으로는 54개가 다르고 20개의 아미노산이 바뀌었는데, 약독화에 관여하는 아미노산 변화는 딱 2개였습니다. 사빈은 이 바이러스를 얻기 위하여 많은 사람들의 쿠사리 (너님은 언제 백신 만들래? 소크라는 사람은 벌써 다른 방법으로 만들었구만) 를 먹으며 몇년동안 존버하면서 바이러스를 배양 또 배양해서 이걸 만들었습니다. 소아마비 바이러스의 경우 지놈 사이즈가 7000 염기 정도입니다.

만약 이런 식으로 존나 바이러스를 배양해서 더 짱센 넘을 선발하는 식으로 자연적으로 일어나는 돌연변이에 의존해서 바이러스를 찾으면 얼마 정도 걸릴까요? 소아마비 바이러스와 코로나바이러스는 아마 돌연변이율이 다를 것이기 때문에 직접적인 비교를 하기는 어렵습니다. 그렇지만 뭐 이 글이 진지빨면서 하는 것은 아니므로 (…) 소아마비 바이러스와 코로나바이러스가 비슷한 속도로 돌연변이를 일으킨다고치고, RaTG13 에서 SARS-CoV-2 의 변이만큼을 나올 시간은…아마 사빈이 저걸 얻을 시간의 20배 (단순히 돌연변이 갯수의 비율. 다를수도 있음) 정도는 걸릴지도 모르겠군요.

그런데 우리는 이미 많은 양의 SARS-CoV-2 의 지놈을 시퀀싱하였고, 이를 통하여 사람을 통해서 퍼질 때 이 바이러스가 어느 정도의 속도로 변화하는지 짐작가능합니다. 지금 코로나바이러스가 수천만명의 사람을 통해서 퍼지고 있고, 이러한 상황에서 코로나바이러스는 대충 1년에 20염기 정도로 변한다고 합니다. 그렇다면 이런 속도로 ‘사람 중에서’ 퍼질 때 약 천개 정도의 돌연변이가 생기려면…50년?

https://www.cell.com/current-biology/pdf/S0960-9822(20)30847-2.pdf

그런데 이 상황은 수천만명의 실험대상(?)을 통해서 바이러스가 퍼졌을때 얻을 수 있는 상황입니다. 만약 매드사이언티스트가 연구실에서 한정적인 실험동물, 혹은 배양세포를 통해서 행한다면 어떻게 될까요. 물론 바이러스가 배양세포에서의 증식은 닝겐에서 자라는 것보다는 더 빠를 것이므로 증식이 빠르면 돌연변이 속도도 빨라질 수는 있습니다. 그러나 일단 존나 큰 스케일로 실험을 해야하겠지요. 지놈의 4% 를 바꾸는 것은 쉽지 않습니다.

좀 더 빠른 속도로 돌연변이를 얻기 위하여 돌연변이 유도를 하는 화합물이나 X선 같은 것을 써 볼까요. 물론 그렇게 하여 돌연변이 속도를 높일 수는 있을 것입니다. 그러나 그것이 더 빠른 표현형의 변화를 얻는 좋은 방법은 아닐수도 있습니다. 일단은 그렇게 얻어진 돌연변이 바이러스가 실제 표적이 되는 곳에서 어떻게 활동할지는 ‘실험’ 을 해봐야 압니다. 그걸 어떻게? 얻어진 돌연변이 바이러스를 막 주변에 퍼트려서 전파력을 검사한다? 현실적인 방법은 아닙니다. 세포 시스템에서 바이러스의 감염력을 조사하는 것도 대안입니다만, 암튼 수년 동안 정량적으로 조사해야겠지요.

어쨌든 유전공학적인 방법을 사용하든, 존나 오래 배양하면서 돌연변이를 기대하든 이 정도의 유전적인 변화를 닝겐이 일으키는 것은 쉽지 않습니다. 닝겐이 동물이나 식물을 육종할 때는 서로 교배하면서 유전체를 쉐킷쉐킷- 해주는 그런 꼼수가 있었고, 실제로 이렇게 교배를 통하여 유전 정보를 교환하는 것은 유전정보의 다변화에 좋은 방법입니다. 그러나 바이러스라는 쉑히들은 찐따라서 유전자 교환의 주요 방법인 쒝스도 못합니다….쒝스도 못하는 찐따새끼들….혹시 다른 유전정보를 가진 바이러스들이 동시에 감염되면 복제되는 와중에 유전정보 교환이 일어나지 않을까요? 실제로 바이러스의 지놈들을 찾아보면 서로 다른 종간의 바이러스 간의 재조합의 흔적이 보이기는 합니다. 그러나 그리 일반적으로 일어나는 일은 아닐 것입니다. 모르죠…세포주를 조작하여 바이러스 간 유전정보 교환,즉 쒝스를 위해서 또 다른 시스템을 설계….아 너무 복잡합니다.

이러다 보면 아무리 대단한 매드사이언티스트라도 현타가 몰려올 것입니다. "여기는 누구인가 나는 누군가 나는 뭘 하는가" 사빈 아재야 백신을 만들기 위한 목적이라도 있었지만 RaTG13 에서 SARS-CoV-2 으로 바이러스를 바꾸는 것은 도대체 어떤 목적인지도 모릅니다.

그나마 바이러스 유출의 시나리오로 가장 그럴싸한 것은 SARS-CoV-2 가 이전에 동물 등에서 분리된 (박쥐 등이 코로나바이러스의 소스였으므로 박쥐 등에서 바이러스를 수집하는 연구는 많이 진행중입니다) 기 분리된 바이러스였는데 연구소에서의 어떤 문제 (실수? 등등) 로 바이러스가 유출되는 정도일 것입니다. 물론 이것을 입증할 자료는당연히 없습니다. 그러나 어쨌든 인위적인 바이러스 개조보다는 훨씬 더 쉬워보입니다.

어쨌든 요약을 하면 이렇습니다.

  1. 현재까지 알려진 바이러스로부터 SARS-CoV-2 를 인공적으로 만드는 것은 존나 어렵고 사실 그럴 목적도 모르겠다.
  2. 존나 오래 인공적으로 배양하면 변화된 바이러스를 얻을수 있을지는 모르겠지만 그렇게 하려도 최소 수십년은 걸릴 것이다.
  3. 차라리 이전에 자연계에서 분리된 바이러스가 유출되었을 가능성이 1,2보다는 높다. 물론 3을 입증하는 증거는 아직까지는 없다.
  4. 바이러스를 개조해서 우리가 원하는 능력을 만들게 하는 것은 어렵다. 생명공학을 과대평가하시는 것은 업계인으로 감사합니다만 우리는 아직 그정도의 능력이 없는 찐따들입니다 ㅠㅠㅠ

의도된 애매함

이제 몇 권의 과학 관련 책을 낸 이후에 공통적으로 듣는 이야기가 있다.

“해당 분야 전문가가 보기에는 내용이 빈약한데, 일반인이 읽기에는 어렵지 않은가?”
“책의 독자를 어느정도로 상정하고 책을 쓰는지 모르겠다”

굳이 말하자면 내가 쓰는 책은 이 블로그 ,혹은 페이스북 페이지를 즐겨 찾는 독자 정도를 대상으로 쓰고 있다. 그렇다면 이 블로그 (페이지) 를 찾는 독자층은 어떨까? 실제로 이런 것을 조사해 본 적은 없다 (…) 그러나 대략적으로 덧글을 다는 분들은 현업 연구자, 대학원생, 이공계 대학생 등이 많이 계신 듯 하며 혹은 과학 공학 관련 업계 종사자들도 꽤 계신다. 과학에 관심있는 일반인들도 꽤 있을 것으로 생각하나 그 비율은 잘 모르겠다.

대략적으로 그 정도의 독자가 읽겠거니 하고 생각하고 글을 쓰는 셈이다. 한마디로 전혀 과학을 모르는 사람을 대상으로 쓰는 글과 책은 아니라는 이야기이다.

기본적으로는 대학 1학년 정도의 일반생물학 (혹은 고등학교 생명과학 2?) 정도의 지식을 가지고 있다고 전제하고 글을 쓴다고 생각하면 될 것 같다. 어떻게 보면 이 정도의 과학 지식을 갖추고 있지 않은 많은 사람들에게는 어렵다고 느껴져도 할 말이 없다. 그리고 대학 1학년, 고등학생 이하의 지식을 갖춘 사람들을 위해 쉽게 과학 지식을 설명하는 책 혹은 블로그도 필요할 것이고 중요할 것이다.

그러나 중요한 것은 그런 일은 내가 주로 할 일은 아니라는 것이다. 이미 그런 레벨에서 책을 쓰시는 분은 많지 않은가?

가령 가장 최근에 나온 ‘세포’ 는 모 대학교에서 개설된 ‘현대생물학사’ 라는 강의 준비를 하면서 썼고, 그 강의의 내용이 상당수 나온다. 해당 과목은 내가 처음 개설한 과목이 아니므로 어떤 의도로 개설되었는지는 잘 모르겠고, 명백히 과학사학자가 아닌 내가 이런 이름을 가진 과목을 강의하는게 과연 최선인가 하는 생각은 들지만, 여튼 이 과목에서는 나는 일반생물학 수준의 생명과학 교과서에 나온 결과들이 어떤 과정을 통하여 발견되었냐 하는 약간의 연대기적 맥락을 소개한다. 그런 것을 굳이 소개하는 이유는, 과학 전공에 입문하는 학생들이 단순한 사실의 암기를 넘어서, 교과서에 기술된 발견들이 어떤 과정을 통하여 발견되었는지를 약간이라도 이해한다면, 배우는 과목을 단순한 지식의 암기와는 조금 다르게 생각할 수 있지 않을 까 하는 기대 때문이다. 그리고 과학에 흥미를 느끼고 머학원에 샥..아님 

참고로 이 강의의 수강생은 1학년 학생이 주이긴 하지만 2,3,4학년 학생도 있고, 주로 ‘생명과학부’ 에 다니는 학생들이다. 즉 기본적으로 일반생물학 정도는 수강한 학생들이다. 이 학생들을 기준으로 한 강의이고 여기에 기반한 내용이기 때문에 당연히 이러한 지식이 부족한 독자라면 어렵게 느껴질 수도 있고, 반대로 책에서 다루는 분야를 직접 연구하는 연구자라면 내용이 부족하게 느껴질 수도 있다 (애초에 이러한 연구자라면 자신의 연구분야를 개관하는 내용을 대중서에서 기대하는 것 자체가 조금 무리 아닐까. 리뷰를 보세요;;) 그러나 그 ‘애매함’ 은 어쩌면 의도된 애매함일 것이다.

즉 내가 쓰는 책은 여태까지도 그렇고 앞으로도 그 ‘의도한 애매한 범위’, 즉 일반인은 조금 어렵게 느껴질수도 있지만 해당 분야의 전공자라면 당연하게 느껴질 그런 범위에 머물고자 한다. (어차피 어려운 대중서를 아무리 읽어도 일반인이 전공자가 될 수는 없을 것이다. 그렇다고 완전한 전공자를 위한 책은 현실적으로 국내에서 출판을 하기가 쉽지는 않을 것이고)

 

세포 : 생명의 마이크로 코스모스 탐사기

새 책이 나왔습니다.

스크린샷 2020-08-24 오후 5.21.24
세포 : 생명의 마이크로 코스모스 탐사기
남궁석 저
에디토리얼

구입 링크

다음은 책의 저자의 글입니다.
——————————————-

생명체의 기본 단위가 ‘세포’라는 사실은 대부분의 사람들이 알고 있다. 대학에서 일반 생물학을 수강하거나 생명과학 관련 전공을 이수한 사람이라면 다양한생명현상이 세포라는 작은 공간에서 일어난다는 것을 이해한다. 그러나 다른 과학 교과서의 지식들과 마찬가지로, 세포에 관한 많은 지식이 어떤 과정을 거쳐서 현재 우리가 아는 ‘지식’이 되었는지에 대해서는 의외로 잘 모르는 경우가 많다. 심지어 직업적인 생물학 연구자로서 세포 연구에 종사하는 사람들도 교과서에 실려 있는 공인된 지식이 밝혀진 과정에 대해서는 그다지 관심을 기울이지 않는다.

이 책은 오늘날 현 시점까지 밝혀진 세포에 관한 지식이 어떻게 발견되고 확정되었는지를 다루는 ‘세포 연구의 연대기’에 가까운 책이다. 현재 당연한 상식으로 널리 유통되고 있는 과학적 지식은 해당 연구에 참여한 수많은 연구자들의 치열한 논쟁과 이견 속에서 서서히 정립되었다. 이 책에서는 이러한 논쟁과 이견을 가능한 제시함으로써 과학적 지식이 어떻게 확립되는지에 대한 과정을 보여주려고 하였다. 또한 가능한 해당 연구를 수행한 연구자들을 거명함으로써교과서에 건조하게 서술되어 있는 한 문장마다 수많은 연구자들의 땀과 노력이 어려 있음을 보여주고자 했다. 물론 지면의 한계 때문에 미처 언급되지 못한연구자가 더 많을 것이다. 독자들이 이 책을 통하여 현재 우리가 알고 있는 과학 지식은 소수 천재들의 성취라기보다는 수많은 연구자들에 의한 집단지성의산물이라는 것을 조금이나마 느낄 수 있는 기회가 되길 바란다.

이 책은 크게 세 부류의 독자를 염두로 두고 쓰였다. 첫 번째는 현대 세포생물학과 분자생물학에 조예가 깊지 않으나 생물학에 관심이 큰 과학책독자이다. 이 책을 통해서 현대 생물학의 주류 연구 사조라고 할 수 있는 분 자/세포생물학이 어떻게 등장하고 발전해 왔는지, 그리고 근현대의 과학자 들이세포라는 창을 통해 생명의 신비 뒤에 감춰진 근본 원리를 집요하게 파 악해 나간 과정을 알 수 있을 것이다.

두 번째 부류는 고등학교 혹은 대학 수준의 생물학을 공부하는 학생이다. 이 책에 담긴 내용은 대략적으로 대학교 1학년이 배우는 일반생물학 교과서가 다루는 수준이다. 대부분의 교과서는 특성상 과학 지식이 발견되는 맥락과 그것이 확립되는 과정에서 벌어지곤 하는 많은 논쟁을 생략하기 마 련이다. 이런 까닭에 때론 교과서 속 지식의 지위는 더 이상 논쟁을 허락하 지 않는 절대적인 것처럼 보이기도 한다. 그러나 이 책에서 생물학 지식이 만들어지는 과정을살펴보면서 과학 연구의 실제 모습을 발견하고 생각해 볼 기회를 가질 수 있을 것이다.

세 번째는 전문적인 생물학 연구자이다. 사실 이 부류의 독자라면 이 책이 다루는 모든 연구에 대해 익히 들어봤을 것이다. 그러나 바로 앞에서 설명한바와 같이 지금 당연시되는 지식이 한때는 미지의 영역에 파묻혀 있 었고, 이것을 ‘채굴’하기 위해서 선배 연구자들이 지금 자신과 마찬가지로 고민하고 실마리를 찾고 돌파구를 여는 모습은 망망대해에서 비치는 등대의 불빛처럼 위안과 반가움을 줄 것이다.

물론 맛있는 요리의 재료와 조리법을 상세히 알지 못하더라도 요리를 즐기는 데에는 큰 문제가 없듯이, 단순히 지식을 습득하고자 하는 사람이라 면 ‘과학 지식이 확립되는 과정’ 자체를 꼭 알아야 할 필요는 없다. 그러나 그저 식도락에 만족하는 사람이라도 눈앞에 놓인 요리의 재료, 레시피, 셰프에 대해 관심이 생겨 정보를 얻고 난 뒤 그 요리를 먹으면 늘상 먹으면서도 경험하지 못했던 맛을 문득 발견하게 되기도 한다. 책의 독자에게도 이런 일은 일어난다. 뿐만 아니라 지식의 단순 습득이 목적인 독자를 위해서는 사실에 오류가 없으면서도 최신의 연구 성과를 체계적으로 제공하는 서적이 더욱 필요하다. 이 책은 수백 년 전의세포 연구의 시작부터 지금 세포 연구의 최 전선인 ‘세포 아틀라스 프로젝트’와 ‘합성생물학’까지 두루 다루고 있으므로 세포와 생명과학 연구의 최신 동향을 파악하는 데도 유용할 것이라고 생각한다

황열병 모기에 직접 물린 사람들

황열병(Yellow Fever)는 모기를 숙주로 옮겨지는 바이러스성 질병으로써 2013년에는 약 12만 7천건이 발생하여 45,000명의 사망자를 내고 있는 질병이다.주로 아프리카 등 열대 지방을 중심으로 발생하는 질병인 관계로 한국에서는 큰 관심이 없는 편이나 한국도 이제는 열대지방 아닌가 의심스럽지만 이전 세기까지만 하더라도 아프리카 뿐만 아니라 중남미, 미국에서도 많이 일어나서 많은 사망자를 낸 질병으로  질병의 원인에 대해서 많은 연구가 되어 온 질병이다. 가장 처음 바이러스에 의해서 일어난다고 확인된 질병이 바로 황열병이다.

그리고 황열병은 많은 유명한 과학자들이 관련되어 있으며, 특히 이를 연구하던 많은 과학자들이 그 연구 대상의 희생자가 된 것으로도 유명하다. 바이오스펙테이터에서 바이러스 관련 연재를 하던 도중, 특히 황열병에 대해서 몇 가지 에피소드를 접하게 되어서 이를 한번 정리해 보도록 한다.

황열병이라는 질병은 원래 아프리카에서 유래된 것으로 알려져 있다. 그러나 이러한 사례가 보고되기 시작한 것은 17세기 이후 신대륙에서였다. 즉 노예 무역에 의한 아프리카 노예의 신대륙 이동에 의해서 황열병 모기와 바이러스 역시 따라 이동한 것으로 생각되고 있고, 최초의 신대륙에서의 창궐은 1647년 바베이도스로 알려져 있다. 그리하여 중남미와 브라질을 중심으로 좀 더운 동네에서는 황열병이 창궐하였고, Yellow Fever 라는 이름 역시 그때부터 보고되고 있다.

미 대륙 본토에서도 황열병은 종종 보고되고 있었으며, 1793년은 필라델피아에서, 1833년과 1853년에는 뉴 올리언즈에서 일어났고, 총 10만명에서 15만명의 사망자를 냈다고 한다. 특히 1793년 당시 미국의 수도이던 필라델피아에서의 황열병 창궐은 당시 주민 9% 의 사망을 가져왔으며, 당시 대통령 조지 워싱턴을 포함한 미국 정부가 황열병을 피해 도주 (…) 하기도 했다고 한다. 그리고 1878년에는 미시시피강 근처에서 창궐한 황열병의 유행은 약 2만 명의 사망자를 기록하였다. 이렇게 황열병의 창궐은 미국에서 1905년까지 계속되었다.

미-스페인 전쟁과 황열병  

질병의 역사를 살펴보면 전쟁이 질병 퇴치의 기원이 되는 경우가 많이 있다. 보건 위생 개념이 미흡하던 시대에 대량의 닝겐이 왔다갔다 하다가 병원체를 옮겨오는 경우가 많이 있었고, 그 덕에 전장에서의 손실보다도 높은 병으로의 손실을 보는 것이 20세기 초반까지만 해도 허다했기 때문이다. 1898년의 미 – 스페인 전쟁도 마찬가지이다.

1898년 미국은 스페인과 전쟁을 시작하여 당시 스페인의 식민지였던 쿠바와 필리핀에서 동시에 전투를 시작한다. 아직 천조국 (…) 은 아니었지만 19세기에도 남다른 전투종족 (…)으로 이름을 떨치고 있던 신생국 유나이티드 스테이츠 오브 어뭬리카는 스페인을 3개월만에 전투에서 압살하고 gg 선언을 받았는데…한가지 문제가 있었다.

쿠바에 침공한 미군은 약 3,000명의 희생자를 냈는데 그 중에서 실제 전투에서 사망한 사람은 고작 400명 밖에 되지 않았다. 나머지 2,600명은 병사하였고, 그 중 2,000명은 황열병 (Yellow Fever)로 사망하였다.

어마어마한 황열병 사망자에 움찔한 미군은 군의관 월터 리드 (Walter Reed) 소령을 단장으로 하는 조사단을 보냈다. 이들의 목적은 황열병의 원인을 찾는 것이었다.

스크린샷 2020-04-02 오후 3.29.26.png
Walter Reed (1852-1902)

사실 그 전까지 황열병의 발생 원인에 대해서는 여러가지 썰이 있었다. 세균에 의해서 발병한다, 혹은 황열병 환자에서 나오는 무생물인 독성물질에 의해서 발생한다 등 여러가지 잡설이 있었다. 그런데 이미 1881년 쿠바의 의사 카를로스 핀레이 (Carlos Finlay)는 모기가 황열병의 유래라고 제대로 주장했다. 그러나 당시 의학계의 주류가 아닌 쿠바의 의사가 주장한 이 학설은 개무시당했다. 사실 그럴만도 한 게 실험으로 입증한 것도 아니기 때문이다. 

월터 리드는 황열병이 모기에서 발생한다는 핀레이의 썰이 일리가 있다고 생각했다. 그 이유 중의 하나는 이전에 월터 리드는 미국에서 발생한 황열병 관련 연구를 했었고, 그전에 많이 제시되던 병사들이 오염된 강물을 먹어서 걸렸다라는 썰이 근거없다는 것을 증명했기 때문이다.  그리고 황열병에 걸린 병사들은 늪지에 자주 돌아다녔다는 것을 알게 되었다. 게다가 1898년 모기에 의해서 말라리아가 전파된다는 것이 입증된 이후, 황열병도 모기에 의해서 전파될 것이라는 심증은 짙어졌다.

그런데 그것을 어떻게 입증할 것인가? 그리고 리드와 함께 파견된 조사단의 일원 중에서도 의견이 갈렸다. 리드의 부하인 제시 라자 (Jesse W Lazear)는 모기가 원인이라고 생각했지만 제임스 캐롤 (James Carroll)은 모기가 황열병의 원인이 아니라고 생각했습니다. 그들은 리드가 본국에 출장으로 돌아간 사이에 그것을 입증하려고 했다. 방법? 핀레이로부터 얻은 ‘황열병 모기’에 직접 물려보는 것이다 (…) 특히 제임스 캐롤은 모기가 원인이 아니라고 생각했으므로 모기에 물려도 괜찮을 것이라고 생각했다. 캐롤과 라자는 황열병 모기에 직접 물렸다 (…) 그러나 이들은 바로 황열병에 걸려 버렸다. 캐롤은 거의 죽다 살아났지만 라자는 황열병에 걸려 한달 후에 사망했다.
스크린샷 2020-04-02 오후 3.31.29

제임스 캐롤

스크린샷 2020-04-02 오후 3.31.40

제시 라자 아니 님은 모기 황열병 설을 믿었는데 왜 스스로 물려 ㅠㅠ

미국에 있던 월터 리드는 부하들이 지시 없이 자신을 위험에 처하게 하면서 실험하다가 죽었다는 소식을 듣고 빡쳐서 쿠바에 돌아왔다. 부하들이 자신의 의견을 무시하고 자신의 의견을 반박하려고 스스로 모기에 물렸다가 죽은 것도 빡치는 일이고, 대조군 실험도 없이 엉성한 실험을 한 것도 빡치는 일인 셈이다. 

그는 제대로 실험을 하기로 했다. 이들은 모두 황열병에 이전에 걸린 적이 없어서 면역력이 없는 사람들이었고, 일어날 수 있는 위험성에 대해서 잘 설명했다. 그리고 이런 위험을 감수하는데에 대해서 충분히 금전적인 보상을 해 주기로 하였다.  그냥 까라고 해서 깐거 아니냐 ㅠㅠ

그는 5명의 지원자들에게 모기를 물리게 했다. 모기를 물린5 명의 지원자들은 모두 황열병에 걸렸다. 그는 이 참에  황열병의 원인이라고 생각되던 황열병 환자에서 나온 무생물 독소가 원인인지 아닌지를 입증하기로 했다. 두 개의 오두막을 지었다. 하나는 환기가 잘 안되는 오두막으로 외부에서 모기가 들어오지는 못했다. 그러나 여기에는 황열병 환자가 사용하던 침구나 옷 등이 널려져 있었다. 하나는 환기가 잘 되는 오두막으로 철저히 소독을 했다. 그러나 여기에는 황열병 모기를 15마리 넣어 두었다. 전자에서 20일 동안 생활한 자원자는 황열병에 걸리지 않았지만, 잘 소독되었지만 황열병 모기가 있는 오두막에서 생활한 자원자는 바로 황열병에 걸렸다. 

 

image

월터 리드가 지은 두 채의 오두막

마지막으로, 그는 황열병에 걸린 사람에게서 바로 채취한 혈액 2cc를 정상인에게 주입하면 바로 황열병에 걸린다는 것을 입증하여, 모기가 어떤 병원체를 옮긴다는 것을 입증했다. 

그는 그의 황열병 연구 결과를 1901년에 논문으로 발표했다. .

https://jamanetwork.com/journa…/jama/article-abstract/469979

월터 리드는 황열병의 원인을 밝혀서 일약 유명해졌고 그러나 그는 1902년 만성 충수염이 악화되어 사망하였다. 황열병의 원인을 밝혔는데 맹장염으로 죽었다는 것이다 (…) 그러나 그의 이름은 워싱턴 근교의 육군 병원에 붙어 있으며 이 병원은 2011년 해군병원과 통합되어 현재까지 미군 군 병원에 남아 있다. 

그러나 황열병에 대한 이야기는 여기서 끝난 것이 아니었다 (….)

  • 계속-

혁신은 어떻게 실제로 일어나는가 : 암 정복 연대기


01

바이오스펙테이터에 연재하고 있는 ‘신약연구사’ 중에서 3종의 항암제를 다룬 부분이 책으로 나왔습니다. 단독으로는 두 번째의 과학 관련 단행본입니다. 

 
책의 제목은
암 정복 연대기 : 암과 싸운 과학자들입니다.
 
책의 구입 링크는
 
책에서 다룬 내용은 책의 구입 링크에도 있습니다만, 왜 이런 책을 썼는지에 대해서 잠깐 소개하도록 하겠습니다.
 
이 책은 글리벡 (표적항암제), 허셉틴 (항체의약품), 옵디보/키트루다 (면역체크포인트억제제) 와 같이 항암치료제 개발의 역사에서 하나의 분기점을 이루었다고 생각하는 약물이 개발되기 위하여 어떤 연구의 배경이 필요했는가, 그리고 실제 그 개발과정은 어떤 과정을 통하여 이루어졌는가를 이야기합니다.
 
여기서 말하는 ‘연구의 배경’ 이라는 것은 흔히 생각하는 약의 개발의 배경보다는 조금 넓은 배경일지도 모릅니다. 가령 글리벡의 경우 ‘필라델피아 염색체’ 와 같은 염색체의 이상이 암을 일으키는 원인으로 밝혀지기까지의 과정, 허셉틴의 경우 항체와 단일 항원 항체가 어떤 과정으로 발견되었는지, 그리고 면역체크포인트 억제제에서는 암과 면역과의 관계가 어떻게 이해되기 시작되었는지 실제 약이 탄생하는 것보다 적어도 수십년 이전부터 거슬러 올라가서 다루게 됩니다.
 
사실 이 책을 쓰기 시작할때는 항암제 연구와는 큰 관련이 없었습니다만 (지금은 꼭 그렇다고 할 수는 없지만 ㅋ) 굳이 항암제라는 토픽을 선택한 이유는 대충 이러합니다.
 
암은 수많은 사람들이 이전부터 그 해결책을 찾기 위하여 노력을 한 분야이고 – 어쩌면 인간이 여태까지 인간의 질병에 관련된 문제에서 가장 많은 고민을 한 문제일지도 – 그 해결책을 찾아내기가 엄청나게 어렵다고 알려진 문제입니다. 그렇게 하여 나온 몇 가지 솔루션도 완벽한 해답을 주지는 못하고 앞으로도 더 많은 노력이 필요한 분야 중의 하나입니다. 그러한 어려운 난제가 극복되는 과정의 하나의 예로써 항암제의 개발 과정을 살펴보는 것은 인류가 직면한 수많은 어려움에 대한 해결책을 찾는 좋은 ‘케이스 스터디’가 될 수 있을 것이라고 생각합니다.
 
한마디로 답이 안 보이는 문제를 이해하고, 여기에 대한 (부분적인) 해답을 인류가 어떻게 찾아왔나를 잘 보여주는 과정 중의 하나가 바로 이 책에서 다루고 있는 항암치료제의 개발의 역사가 아닐까 합니다.
 
그리고 특히 한국의 독자에게 이 책이 주는 의미는 ‘어떻게 기존에 없는 혁신적인 제품이 과학의 연구를 배경지식으로 하여 등장하느냐’ 의 과정을 보여주는데도 있다고 생각합니다. 한국은 매우 빠른 추격성장을 통하여 급속한 산업화를 이룩해 왔습니다만, 여태까지 한국이 능했던 것은 이미 개념이 등장한 ‘물건’ 을 어떻게 값싸고 효율적으로 만드는지에 대한 ‘최적화’ 의 과정이었고, 세상에 개념이 존재하지 않던 새로운 산물을 만들어서 상업화한 경험은 생각만큼 많지 않습니다. 이러한 경험의 부재는 어떻게 기초과학의 성과가 실제로 경제적 파급효과를 낳는 산물로 이어지는가에 대한 경험 부재와도 연결됩니다.
 
이 책에서 다룬 몇 가지의 항암제는 기초과학을 통하여 발굴된 지식이 어떻게 경제적으로 파급효과를 낳는 ‘혁신적인 산물’ 로 변모하는지의 과정을 보여주는 좋은 예라고 생각합니다. 과연 어떻게 기초과학의 지식이 경제적 가치를 낳는 세상에 없던 산물로 변모할까요? 그 과정의 한 예를 이 책을 통해서 볼 수 있습니다.

인플루엔자는 일으키지 않는 ‘그 세균’

이제는 일상적인 일이 된 생물의 지놈 시퀀싱이지만 한때는 하나의 생물의 지놈을 완전히 시퀀싱한다는 것이 상상할 수 없을 만한 거대한 일인 것처럼 생각되던 적도 있었다. 혹시 이 포스팅을 읽고 있는 독자라면 최초로 지놈 시퀀싱이 된 생물이 무엇인지 아는가? (바이러스 말고)

대장균, 바실러스, 효소, 예쁜꼬마선충, 애기장대?….
네, 정답은 Haemophilus influenzae 라는 1.8Mb 의 지놈을 가진 세균입니다.

스크린샷 2019-05-09 오후 5.00.47

대장균과 같은 전통적인 모델 생물에 비해서 이 세균이 왜 제일 먼저 시퀀싱이 되었을까? 사실 대장균의 지놈 프로젝트는 위스콘신 대학의 프레데릭 블래트너 (Frederic Blattner)랩에서 훨씬 먼저 시작되었다. 그러나 지놈 시퀀싱을 전통적인 동위원소 (…) 로 하다가 중간에 전략을 바꾸는 등의 혼란을 겪은 후에 대장균 지놈 프로젝트는 훨씬 늦은 1997년에야 완료되었고 이는 진핵생물인 효모 지놈 프로젝트보다도 느린 것이었다.
이 생물이 가장 빠르게 시퀀싱된 것은 그 당시 다른 지놈 프로젝트는 맵 기반 시퀀싱으로 일단 지놈을 큰 조작으로 나눈 다음 이것을 잘게 잘라서 시퀀싱하려고 한 반면, Haemophilus influenzae지놈 프로젝트에서는 샷건 시퀀싱 (Shotgun Sequencing) 이라는 전략으로 일단 DNA 를 잘게 자른 다음 왕창 시퀀싱한 후, 이것을 지놈 어셈블러로 어셈블리하는, 당시로서는 혁신적인 전략 – 지금은 표준적인 전략- 을 사용했기 때문이다.

그건 그렇다 치고, 이 세균은 무슨 세균인가? 이름처럼 인플루엔자와 관련이 있나? 그런데 인플루엔자는 아는 사람은 다 알다시피 인플루엔자 바이러스에 의해서 전파된다. 이 세균은 호흡기에서 많이 발견되기는 하지만 대체적으로 무해하지만 상황이 안좋아지면 척수염, 폐염 등에 영향을 미칠 수 있는 소위 ‘ 기회주의적 병원균 Opportunistic pathogens’으로 분류되는 넘들이다. 한마디로 별로 대단치 않은 넘들이라는 것이다. 그런데 왜 이런 이름이 붙었나?

여기에는 슬픈 전설이 있다 (…)

이 세균은 1892년 독일의 미생물학자 리차드 프리드리히 요하네스 파이퍼 (Richard Pfeiffer)에 의해서 발견되었다. 그는 만병 병원균설의 대부인 로베르토 코흐의 제자로써 많은 업적을 냈다. 그의 업적 중의 대표적인 것은 장티푸스 백신을 개발한 것이다. 그 다음의 타겟으로는 당시에도 심각한 질환으로 여겨졌던 인플루엔자였다. 그는 인플루엔자를 유발하는 박테리아 를 찾으려고 했다 (바이러스에 의해서 질병이 일어난다는 것이 밝혀진 것은 1902년 황열병, 1908년 소아마비로써 훨씬 뒤의 일이다) 그는 인플루엔자 환자의 인후에서 공통적으로 발견되는 세균을 분리하였고, 처음에는 ‘파이퍼의 바실러스’ 라고 불리던 이 박테리아는 나중에 Haemophilus influenzae 라고 이름붙여졌다.

스크린샷 2019-05-09 오후 5.52.08.png

사실 그 당시만 하더라도 세균학의 전성시대로써 수많은 질병, 가령 콜레라, 장티푸스 등이 세균에 의해서 일어난다는 것이 알려지고 있었으며 파이퍼의 발견 역시 의심받지 않고 넘어갔다.

그러나 문제는 1918년, ‘스페인 독감’ 으로 알려진 전세계적인 인플루엔자 대유행에서 일어났다. 약 5천만에서 1억명의 사망자를 낸 것으로 추산되는 인플루엔자의 유행에서 의학자들이 그냥 손 놓고 있었던 것은 아니었다. 이들은 이전에 발견된 Haemophilus influenzae 의 변종을 찾아서 이를 이용하여 약독화 백신을 만들면 인플루엔자를 예방할 수 있을 것이라고 생각했다. 그러나 이상한 일이 일어났다. 인플루엔자 환자 중에서 Haemophilus influenzae가 발견되는 경우도 있었지만 그렇지 않은 경우도 있었다. 그러나 여전히 이 세균이 인플루엔자의 병원균이라는 것은 의심받지 않고 있었다. 그 이유는 이 세균은 배양이 매우 까다로운 세균이라서 발견을 못 한 것은 세균 배양 기술이 미숙했기 때문이라고 퉁치면 됐기 때문이다 (….)

그러나 1921년 미국 록펠러 연구소의 연구자들이 인플루엔자 환자에서 회수되어 감염됨 실험동물의 폐 추출액에서 박테리아를 걸러낼 수 있는 필터를 통과한 물질이 인플루엔자를 일으킨다는 것을 확인한 이후 이 박테리아가 진짜로 인플루엔자를 일으키는 것인지데 대한 의구심이 커져갔다. 그러나 아직도 Haemophilus influenzae 가 인플루엔자를 일으킨다고 믿는 사람들은 줄지 않았다 (…)

인플루엔자를 일으키는 바이러스가 발견된 것은 또 10년이 지난 이후였다. 리처드 슬로프 (Richard Slope)라는 연구자가 돼지에서 필터를 통과하는 감염물질을 찾아냈고, 같은 돼지에서 발견된 Haemophilus influenza는 인플루엔자 감염을 일으키지 않음을 확인했다. 
그리고 1933년 잉간에서 같은 바이러스가 발견됨으로써 드디어 Haemophilus influenzae는 인플루엔자를 일으키는 병원균이라는 누명(?)을 벗을 수 있었다. 

그러나 이름에 붙은 ‘인플루엔자’ 는 지워지지 않았다.

그 이유와 관련이 있는지 모르겠지만 Haemophilus influenzae라는 세균은 인플루엔자는 일으키지 못하지만 대신 최초로 지놈 서열이 밝혀진 독립 생존 생물로써 역사에 길이 남게 되었다. 이정도면 억울한 게 풀릴까?

온갖 음해에 시달렸습니다 여러분! 제가 인플루엔자라는 거 거짓말인것 다 아시죠?

 

 

결정에서 구조까지 83년 걸린 단백질

지금은 효소(Enzyme)가 단백질로 구성되어 있다는 것은 학부 1학년생도 아는 상식이다. 그러나 그 상식은 언제부터 상식이었는가? 적어도 20세기 초반에는 이것이 상식이 아니었다.

사실 세포를 깨서 나온 물질이나 혹은 생물에서 분비된 물질이 시험관 내에서 화학 반응을 촉매한다는 것은 19세기 중반부터 알려져 있었다. 가령 위액에 존재하는 물질인 ‘펩신’ (Pepsin)이 단백질을 분해한다거나, 효소 추출물에서 존재하는 인버타아제 (Invertase)가 설탕 (Sucrose)를 글루코스 (Glucose)와 과당 (fructose)로 분해한다는 것은 20세기 이전에 알려져 있었다. 그리고 이러한 화학 반응 자체가 단백질이라는 물질과 관련이 있다는 증거도 축적되어갔다.

그러나 과연 이러한 촉매 반응 자체가 단백질에 의해서 일어나는 것일까?

지금의 생화학을 공부하는 사람들이라면 놀랄만한 일이지만, 20세기 초반에만 하더라도 이러한 효소의 촉매 반응이 단백질에 의해서 일어나는지, 아니면 단백질은 실제로 촉매 작용을 수행하는 화학 물질에 붙어 있는 ‘군더더기’ 같은 것인지에 대해서 많은 논란이 있었다.  특히 20세기 초까지 가장 활발히 연구되던 단백질인 헤모글로빈⁠1이 산소를 결합하는데는 별도의 화학물질인 헴 (Heme)이 필요하다는 사실이 알려진 이후, 효소의 화학 반응에는 단백질은 필수불가결한 것이 아니며, 단백질은 단지 이러한 촉매 반응을 수행하는 촉매단 (Prosthetic Group) 역할을 하는 화학물질의 운반체에 불과하다는 견해가 20세기 독일을 중심으로 한 학계에서는 주류 학설이 되었다.

이를 반증하기 위해서는 이러한 촉매 반응을 수행할 수 있는 소분자 화학물질이 들어있지 않은 단백질을 순수 정제하여 순수한 단백질만으로 화학 촉매 반응이 일어나는지를 밝혀야만 했다. 그리고 당시에 단백질이 순수 정제되었다는 것을 확인하는 유일한 방법은 단백질의 결정화였다. 알다시피 결정은 단일한 물질이 격자를 형성하여 생기는 것이므로, 어떤 물질이 결정을 이룬다는 것은 해당 물질이 순수 정제되었다는 궁극적인 증명이 되는 셈이다.

최초로 효소를 정제하여 이를 결정화하고, 순수한 단백질로만 된 효소가 촉매 활성을 보인다는 것을 보여준 사람은 미국의 생화학자인 제임스 섬너 (James B Sumner, 1887-1955)이다. 코넬 대학의 교수였던 섬너는 작두콩 (Jack Bean)에서 요소를 분해하는 요소분해효소 (Urease)를 정제하고 이를 결정화하였다.⁠2 섬너가 요소분해효소를 정제할 때 사용한 방법은 지금 보기에는 어이없을 정도로 간단한데, 그는 작두콩을 아세톤과 물을 섞은 액체에 갈아서 추출물을 얻고, 이를 밤새도록 방치해 두어 생기는 결정을 거름종이에 여과하여 분리하였고, 이 결정이 바로 요소분해효소라는 것을 확인하였다. 

 

스크린샷 2019-04-15 오후 2.20.03.png

James B Sumner, 1887-1955

스크린샷 2019-04-15 오후 2.21.31.png

섬너가 얻은 요소분해효소의 결정..결정 얻는게 어렵다구요? 난 콩 갈아서 걍 물하고 아세톤 하고 섞어서 슥슥 놔두니 결정이 막 깔리던데 

그러나 섬너의 결과는 당시 주류 학계인 독일 학계에서는 잘 받아들여져지지 않았다. 섬너는 후속 논문으로 그가 얻은 결정을 녹인 액체에 펩신이나 파파인과 같은 단백질 분해 효소를 처리하니 요소분해효소의 활성이 없어진다는 논문을 발표하여 그의 요소분해효소 활성이 단백질에 의존한다는 것을 보여주었다.⁠3 그러나 이러한 결과에도 불구하고 그가 주장한 효소 = 단백질이라는 이론은 잘 받아들여지지 않았다. 효소가 단백질로 이루어졌다는 것은 이후 록펠러 연구소의 존 노스롭 (John H Northrop, 1891-1987) 이 단백질 분해효소 펩신을 결정화한 이후에⁠4 비로소 인정되기 시작하였다. 섬너와 노스롭은 1946년 효소를 최초로 결정화하여, 효소가 단백질로 구성되어 있다는 것을 최초로 증명한 공로로 노벨 화학상을 수상하였고, 효소=단백질이라는 것은 그제서야 모든 사람이 받아들이는 상식이 되었다.

그런데 재미있게도 섬너가 1926년 결정화한 최초의 효소 유래의 결정인 콩 유래의 요소분해효소의 구조는 2010년(!)까지도 규명되지 않았다! 2010년 발표된 JMB의 이 논문에서 ‘결정이 만들어진 이후 83년 만에’ 규명된 Jack Bean 유래의 요소분해효소에 대한 기술을 하고 있다. 물론 다른 생물 유래, 특히 미생물 요소분해효소의 구조는 이전에 풀렸고, 콩 유래의 요소분해요소 역시 다른 구조와 그닥 틀리지 않는다는 것이 밝혀졌다.

흔히 단백질 결정학에서 가장 병목이 결정을 얻는 것이라고 생각할지 모르지만, 상당수의 단백질들이 아주 멋있게 결정을 이루지만, 제대로 회절을 하지 않는다거나 하는 이유로 구조를 규명하는 데 어려움을 겪는데 이 예가 아마 가장 적절한 예가 될지도 모른다. 결정 만든 후에 구조를 푸는데까지 83년 걸린 경우도 있으니 결정 만들고 회절을 안 한다고 울지 마세염..내가 결정 만든 후에 구조 푸는데까지 3년 걸려봐서 아는데 

1 헤모글로빈이 가장 활발히 연구된 이유는 혈액에서 충분한 양을 얻을 수 있으며, 아주 손쉽게 결정화하여 결정 형태의 순수 정제된 단백질을 얻을 수 있었기 때문이다

2 Sumner, J. B. (1926). The isolation and crystallization of the enzyme urease preliminary paper. Journal of Biological Chemistry69(2), 435-4

3 Sumner, J. B., Kirk, J. S., & Howell, S. F. (1932). The digestion and inactivation of crystalline urease by pepsin and by papain. J. Biol. Chem, 98, 543-552.

4 Northrop, J. H. (1930). Crystalline pepsin: I. Isolation and tests of purity. The Journal of general physiology, 13(6), 739-766.