당신의 연구실에 ‘악마의 변호인’ (Devil’s advocate)이 필요한 이유

STAP 세포는 없어! 아니, 원래 없었어! 

하지만, 내 등에, 이 이마에, 하나가 되서 계속 살아가!! 주작의 여왕이라는 타이틀과 같이.

오늘자 N모잡지에 그동안 벌어진 STAP 세포 소동에 종지부를 찍는 보고가 2편 나왔다.

Screenshot 2015-09-24 13.57.09

Failure to replicate the STAP Cell phenomenon, Nature 2015

Screenshot 2015-09-24 13.58.59

STAP Cells are derived from ES Cells, Nature 2015

하나는 미국의 약 7개 랩 연구자, 다른 하나는 일본의 연구자들에 의해서 오보카타의 그 유명한 STAP 세포 연구가 재현가능한지, 그리고 약산성 용액에 스윽 담가두면 저절로 만능세포가 된다는 STAP 셀로부터 유래된 줄기세포의 정체는 무엇인지를 확인한 논문이다.

이미 결론은 대개 다 알고 있었지만, 공식적으로 요약하면

  1. 약산성 용액에 스윽 담가두면 세포가 전능성을 회복하게 된다라는 이야기..그런거없다. 적어도 다른 연구자들의 수백번의 시도에서 한번도 재현되지 않았다. 
  2. 오보카타가 만들었다고 주장하는 STAP Stem Cell의 정체는 그냥 생쥐 수정란에서 유래된 배아줄기세포이며 이것은 이전에 오보카타가 일했던 실험실에 존재하던 배아줄기세포와 일치한다 
  3. 수립했다고 주장하는 복수의 STAP Stem Cell이 모두 기존의 배아줄기세포와 일치하므로 실수로 라벨을 잘못한 실수일 가능성은 희박하며, 냉동고에 있는 세포가 제발로 걸어나와서 오보카타의 세포배양접시에 들어갈 일은 없으므로 누군가(?)가 고의로 세포를 섞은 것이 확실하다. 누군가(..)가 누군가(!) 라는 증거는 없으나 정황상 그 실험을 한 사람은 한 사람 밖에 없다. 

즉, 결국 오보카타의 모든 결과는 배아줄기세포를 섞어치기해서 만들어진 전혀 의미없는 가짜라는 결론이 되겠고 작년에 스캔들이 터진 이후에도 “STAP 세포는 있습니다”「STAP細胞はありまぁす」라고 단언했지만, 아마 누군가의 마음 깊은 한구석에만 있었던 것 같다. (…)

와세다대학출신, 오보카타 하루코. 평범한 연구자에는 흥미 없습니다. 이중에 포토샵 장인, 셀섞어심기 고수, 언론플레이 마스터가 있다면 저에게로 오십시오. 이상!”

그러나 이것은 이미 여기에 관심을 둔 사람이면 다 알고 있었던 이야기이므로 새로운 이야기는 아니다. 오늘은 이 해프닝을 계기로 해서 당신의 실험실에 ‘악마의 변호인’ (Devil’s advocate)이 필요하다는 이야기를 하려는 것이다.

백지에서부터 구라를 설계하는 사람은 별로 없다

사회에서 사기를 치는 경우는 모르겠지만, 적어도 심각한 연구부정으로 적발되는 사건의 경우에도 처음부터 모든 내용이 구라로 점철된 경우는 별로 없다. 이번 논문의 데이터는 거의 처음부터 모든 내용이 구라로 점철되어 있던 것 같지만 -.-;;; 설령 그렇다 하더라도 애초부터 나는 낚시왕이 될거야 하면서 처음부터 구라를 설계하는 사람은 별로 없다. 적어도 처음에는 뭔가 새로운 것을 발견하려고 실험을 했었겠지. 그런데 예상대로 잘 되지 않고….

오보카타의 경우에도 그랬을 것이다.

오보카타는 와세다 대 박사과정 시절에 하버드대 마취과의 찰스 바칸티라는 사람 랩 밑에서 일을 하면서 STAP Cell에 대한 실험을 시작하였다. 찰스 바칸티라는 사람은 이전부터 상당히 Controversal 한 주장을 많이 하는 사람으로써 주류 줄기세포학계 등에서는 그닥 진지하게 받아들여지지 않고 있었는데, 그 중의 하나라면 생물내에는 스트레스를 받았을때 줄기세포로 변화하여 조직을 재생시킬 수 있는 세포가 있으며, 2001년에 그는 이러한 기능을 한다고 주장하는 세포를 발견(?)하고 Spore-like cell이라고 불렀다. 그러나 많은 사람들은 이 논문을 그닥 진지하게 받아들이지 않았다. 제시된 증거가 충분하지 않고 신빙성이 없다고 판단되서일것이다.

오보카타의 연구 자체는 그동안 바칸티가 해온 일의 연장선상인데, 오보카타는 기존의 바칸티가 한 것보다는 약간 체계적으로 연구를 했는데, 만약 세포가 자극에 의해서 만능성을 회복한다면 여기에 관여하는 전사인자인 Oct4 등이 활성화 될 것이다. 그래서 이전에 구축된 마우스 중에서 Oct4 프로모터에 GFP가 달려있어서 Oct4 발현에 따라서 GFP가 발현되는 것을 모니터링 할 수 있는 마우스 (출처) 를 가지고 여기서 얻은 세포에 여러가지 자극을 준 이후 GFP가 발현되는지를 보았다.

Screenshot 2015-09-24 14.43.37

그렇게 해서 원 논문에서는 세포를 pH5.7로 25분 처리한 후 며칠 키우니 대개의 세포는 다 죽어나갔지만 저런 세포덩이가 생기고, 여기에 형광이 똭! 하고 떴다로 시작된다..그러나..

바로 여기서부터 문제가 생겼다.

사실 세포 내에는 굳이 형광단백질 등을 발현하지 않더라도 어느정도 자연적인 형광을 내는 물질들이 존재하기 때문에 (flavin, NADPH 등) 약한 형광은 발생하며 이를 autofluorescence라고 부른다. 만약 콘포컬 현미경의 출력을 높이면 상당히 형광이 많이 발생하는 것처럼 보일 수 있어서 GFP가 발현되는 것처럼 보일수도 있다.

Screenshot 2015-09-24 14.52.05

즉 실제로 GFP가 발현되는 ES세포에 비해서는 훨씬 낮은 형광수준이지만 뭔가 시그널이 나오는 것처럼 보일 수 있으며,

Screenshot 2015-09-24 14.54.22

현미경의 출력을 높이면 마치 형광이 빵빵하게 발현되서 GFP 뜨네 (진짜 GFP가 뜨는 세포에서는 화면이 온통 밝아질 정도로 높이는 경우) 라고 착각을 할 수 있게 된다는 것이다.

아마 오보카타는 이렇게 세팅된 현미경에서 어느날 형광이 좀 뜨는 저런 시그널을 발견했겠지..그래서 좋다고 보스인 바칸티한테 보고하고…그런데 재현이 잘 안되었을 것이다. 그래서 아 왜 되던게 안되지 하고 계속 반복을 했을 것이다. 그러나 사실은…

Screenshot 2015-09-24 14.56.59

Autofluorescence의 특징은 단일한 fluorophore에 의해서 형광이 나는 것이 아니기 때문에 받아들이는 파장의 빛도, 내보내는 파장의 빛도 영역이 매우 넓다는 것이다. 반면 GFP나 RFP 등 하나의 Fluorophore로부터 나오는 형광은 일정한 영역에서만 detection 될 것이다.

여기서 보는것처럼 어떤 이유에서인지 모르겠지만 스트레스를 가한 세포는 Oct4-GFP 유전자가 있건 없건 상관없이 어느정도의 형광이 초록색 채널에 잡힌다. 그러나 그 형광은 역시 적색 채널에도 잡힌다는 것. 반면 Oct4-GFP가 발현되는 ES세포에서는 그 형광은 초록색 채널에만 잡힌다는 것.

즉, 여기서 그녀가 본 ‘형광’ 은 스트레스를 가해서 Oct4의 발현이 유도되고, 발현된 GFP에서 나온 것이 아니라 그저 세포가 스트레를 받아서 나온 매우 약한 autofluorescence이고, 이것을 가지고 Oct4-GFP 에서 나온 것이라고 착각한 셈이다.

이러한 착각에서 모든 문제가 시작되었다.

보려고 마음먹으면 헛것이 보인다

아마 그 이후의 실험은 이렇게 Oct4-GFP 가 발현된다고 ‘믿어버린’ 것에서부터 나온 착각과 실수에 영향을 받았을 것이다. 가령 처리이후에 Oct4등의 mRNA 수준이 증가한다고 한 데이터가 있었다.

Screenshot 2015-09-24 15.09.29

원 논문에도 이런 데이터가 있었는데…

Screenshot 2015-09-24 15.11.24

재현실험을 하는데서도 아주 쬐끔(?) pH 5.7 로 처리하니 증가하는 것이 보였다. 그러나 문제는 정상적인 ES 셀에서는 증가 비율이 몇천배라는게…그런데 원 데이터에서는 왜 ES셀이랑 별 차이가 없는 것으로 나올까? 모른다. 뭐 예상대로(?) 증가안했으면 실험 망쳤다고 버리고, 다시하기를 반복해서 원하는(?) 데이터가 나올때까지 반복했는지….

그 이후의 수많은 실험들도 결국 아티팩트에서 나온 불확실한 실험을 긍정적으로 해석, 혹은 정상적으로 제대로 된 결과는 다 버리고 자신이 원하는 결과가 나올때까지 반복 -.-;;;; 하는 식으로 나온 것이 아닐까 싶다.

섞어넣기의 시점은?

그러나 아무리 세포 실험을 해도 결국 이 세포가 전능성을 가진 세포라는 것을 보여주어야 하는데, 그러기 위해서는 GFP가 발현되는 세포를 만능세포로 만들고, 그것을 생쥐의 배반포에 찔러넣어서 나오는 생쥐가 GFP가 발현되는 세포가 섞여있는 키메라 생쥐가 나온다는 것을 보여야 믿어줄 것이다. 그래서 뭐 수없이 많이 해봤겠지. 그러나 아마 잘 되지 않았을 것이다. 오보카타의 박사학위 논문까지만 해도 형광이 뜨는 생쥐가 나오지 않았다.

아마 이 시점쯤에서 오보카타는 GFP가 발현되는 ES 셀을 ‘STAP’ 셀에 섞어넣기 시작한 게 아닐까 싶다. 뭐 정확한 시점과 동기야 알 바 아니고…그런 디테일은 중요한 것이 아니고, 결국 지금 남아있는 STAP Stem Cell 이라는 것의 실체는 결국 기존에 랩에 있던 수정란 유래 ES세포와 동일한 것이라는 것이 지놈 시퀀싱으로 확인되었다.

Screenshot 2015-09-24 15.20.33

왜 그런 일을 벌였을지 (오보카타가 섞었다라는 직접적인 증거는 없지만 뭐 액체질소통에 있는 세포가 절로 걸어들어가 오보카타의 셀 디시에 들어갔을리도 없고 -.-;;; 다른 사람이 오보카타 잘되는 꼴을 보기싫어서 밤에 ES셀을 섞어주었기를 기대하는 것도 좀 우습고..본인 이외에 할 사람이 있나) 정황은 알 수 없지만….뭐 그동안 그 소란을 벌여서 되돌아갈 수 없다라는 강박관념 때문에 저지른 일이 아닐까….뭐 아님 말고.  여튼 이렇게 세포섞어찌개를 끓이기 시작한 이후 상황은 안드로메다로 가버렸다.

Devil’s advocate

제 3자의 관점에서 이 사태를 재구성해보면서 느낀 점이라면 오보카타가 처음에 이 프로젝트에 착수할 때 누군가가 데이터를 크리티컬하게 검토해 줄 사람은 정말 없었구나 하는 생각이 든다. 하긴 이 프로젝트 자체는 원래 마취과 의사인 찰스 바칸티 랩에서 오보카타가 진행하였고, 모두 다 알다시피 찰스 바칸티는 전문가가 아니다.

가령 Oct4-GFP 에 약산성을 처리하고 며칠 지나니 형광이 뜬다는 데이터를 가져왔을때, 그 사진을 좀 더 형광현미경으로 연구를 많이 해본 전문가가 보았다면? 아니면 ‘세포를 자극에 처리하면 만능성을 가진다’ 라는 원래 가설에 좀 더 비판적인 사람이 랩에 있었더라면? 당연히 이것이 autofluorescence가 아닌지 체크해 보라는 이야기를 해주지 않았을까? 하다못해 GFP qPCR이라도 돌려서 진짜로 GFP mRNA가 많이 나왔는지라도 확인해 보라는 이야기라도 했을 것 같은데….

유감스럽게도 바칸티 랩에는 그런 사람이 있지 못했던 것 같다. 바칸티 자체가 원래 “남들이 안된다고 하는 것을 되게 하는 것이 나의 장기” 를 주창하는 사람이라서 그랬나….암튼 ‘턱없이 긍정적인 사고방식’ 과 ‘비판의식의 결여’ 가 아마 이 사건의 시발점이 아닐까 생각된다.

물론 오보카타가 하버드에서 수행하던 프로젝트를 리켄에 들고와서 진행할 때 사전에 문제점을 제대로 검증하지 못한 리켄의 경험많은 연구자들의 경우에도 책임은 상당하다. 그러나 가장 큰 책임은 상대적으로 경험이 적고, 못배운 (오보카타는 박사과정 중에서 따로 소속된 랩이 없이 여기저기 떠돌아 다니면서 배우느라 제대로 된 트레이닝이 부족했다고 자기가 그런다) 오보카타보다는 연구의 초기 단계 연구 책임자인 찰스 바칸티가 져야 하지 않을까 싶다. 그러나 바칸티가 어떤 책임을 지었거나 불이익을 당했다는 이야기는 전혀 없다는 것도 (심지어 비난의 촛점에서 비껴나 있다는 것도) 이 사태의 이해하기 힘든 부분이다.  심지어 이 자들은 문제가 불거질 때 ‘아 우리는 STAP 셀 만들어 봤거든? 하면서 직접 프로토콜까지 공개했다!’

만약 초기 단계에서 누군가가 Devil’s advocate역할을 충실히 수행해서 현미경 사진을 Red Channel에서 찍어보라는 제안을 했었고, 그대로 따라서 초기에 그 ‘형광’ 이 autofluorescence라는 것을 알았더라도..

  • 오보카타는 아마 성공한 연구자가 되지는 못했겠지만 그렇다고 전세계 과학계를 뒤흔든 악녀까지 되지는 않았다.
  • RIKEN의 CDB 연구자들의 절반이 연구소를 떠나는 일도 없었다.
  • 저명한 줄기세포 권위자인 사사이 요시키는 자살하는 일이 없이 아직도 활발한 연구를 하고 있었을 것이다.
  • 이 연구를 재현해보느라 수많은 사람들의 노력과 연구비가 쓰여지는 일도 없을 것이다.
  • N모잡지가 체면을 구길 일도 없었을 것이다.
  • 나님이 이 병진같은 사태때문에 글쓰느라 시간을 허비할 일도 없었다

즉 그 랩에 단 한명의 Devil’s advocate가 있었더라도 이런 사태는 애초에 일어날 일이 없었을 것이다.

우리 모두 악마의 변호인이 됩시다

사실 연구실에서 일을 하는데 누군가 (그게 자신의 보스일 수도 있지만 전혀 그 일과는 상관없는 동료일수도 있다) 내 결과를 신용하지 않고 그게 실수로 인한 것이 아니냐고 한다면 기분이 유쾌할 사람은 그닥 많지 않을것이다. 그러나 중요한 것은 건강한 과학에는 이러한 비판정신이 필요하며, 동료의 데이터를, 그리고 무엇보다 자신의 데이터를 항상 의심하는 것은 무엇보다도 중요하다. 특히 연구 경험이 적은 대학원생 등과 같은 경우 이러한 함정에 빠지는 것이 그리 심심치 않게 일어나는 일인데 지도교수, 아니면 동료 (주로 선배위치에 있는 사람이 되겠지만) 중 누구 하나라도 항상 악마의 변호인과 같은 입장에서 산출되는 데이터를 의심하고 다시 재확인해보는 것은 제대로 된 연구를 하는데 필수적인 요소일 것이다.

그러나 일부에서는 이러한 비판적인 검토를 개인에 대한 비판으로 받아들이는 경우가 있다. 과학적인 비판과 개인의 비판을 헷갈리는 것 자체가 결국 연구수준이 심하게 낮다는 이야기일수도 있다.

“왜 항상 매박사는 그리 삐딱하세요? 다 먹고살자고 하는 것이고 좋은게 좋은 거지…..”

아니다.

“좋아야 좋은거다”. 

과학을 우습게 보지 마라, 이 풋사과 쉑히들아..

만약 지도교수 혹은 랩의 경험이 많은 연구원이 Devil’s advocate 역할을 제대로 수행할 수 없다면? 지도교수가 랩 연구의 디테일을 파악할 능력이나 시간이 없다면 (많이 일어나는 일이다. 특히 지도교수가 영향력이 크면 클수록) 지금과 같은 사태가 일어날 가능성이 점점 커진다. 만약 동료의 데이터에 의문을 제기하거나 토론하는 분위기가 조성되어 있지 않은 랩이라면? 그 가능성에 다시 100을 곱한다.

결국 최후의 보루, 즉 논문에서의 최종적인 Devil’s advocate역할을 수행하는 것은 피어리뷰에서의 리뷰어가 된다. 그러나 알만한 사람은 다 알다시피 이 피어리뷰라는 것도 상황에 따라서 얼마든지 문턱이 변할 수 있는 것이 사실이다. 필드에 막강한 영향력을 행사하는 랩에서 나온 논문은 ‘이 랩에서 나온 논문이면 어느정도 믿을 수 있지’ 라는 선입견을 리뷰어에게 준다는 점을 기억하자. (논문 개제여부에 대한 영향력 행사는 접어두고라도) 아니면 피어리뷰가 제 역할을 하지 못하는 저널이라면 말할것도 없다. 아마 오보카타의 논문에 사사이나 와카야마의 이름이 들어가 있지 않았더라면 아마 지금 현 사태는 애초에 논문 리젝으로 결론이 나고 이슈화되지 않았을 가능성이 농후하다.

많은 연구부정 사례가 일어나면서 해당 연구부정을 저지른 연구자 개인의 도덕성에 촛점을 맞추는 경우를 많이 본다. 사실 한 개인을 용서받지 못할 사기꾼, 구라꾼으로 몰아붙이는 것이 가장 손쉬운 일이기 때문이다. 그러나 연구부정을 개개인의 도덕성으로 환원해 버리면, 아마 당신이 연구부정에 직간접적으로 연루될 가능성은 재수 차원의 일이 되버린다. 재수없게 당신의 연구실에 들어온 대학원생, 포닥이 양심불량이어서?  뭐 그런 부분도 있겠지. 그러나 보다 본질적인 대책을 세우기 위해서는 일단 연구부정의 단초가 되는 상황을 파악하는 것부터 시작해야 한다. 그리고 이들의 근원적인 원인을 찾는데서 시작해야 하지 않을까. 연구를 수행하는 개개인에게 아무리 도덕교육을 강화한들, 연구부정이 적발되기 힘든 환경, 혹은 연구부정으로 얻을 수 있는 부당이익이 위험을 감수할 만한 가치가 있을 상황이 되는 환경에서는 연구부정은 창궐할 수 밖에 없는 것이다.

일단 이러한 것을 예방하기 위한 하나의 방법으로써 꼭 필요한 것은 당신이 일하는 연구실에는 그게 누가 되었든 ‘악마의 변호인’ 이 있어야 한다는 것이다. 즉, 실험실에서 산출되는 모든 데이터를 꼼꼼히 따지고, 이게 실수, 혹은 인위적인 부정에 의한 결과가 아닐지를 생각하는 사람이 없다면 그 연구실은 그 연구실에 근무하는 연구자들의 도덕성과는 상관없이 연구부정, 과거연구 미재현과 같은 사태를 겪을 가능성이 많다.