다이나마이트를 조심해

Screenshot 2014-08-22 19.53.58

많은 논문에는 이런 식으로 평균(mean)을 내고,  표준편차 (Standard Deviation) 내지는 표준오차 (Standard Error) 를 표시한 다이너마이트처럼 생긴 그래프 가 으례 하나쯤은 등장한다. 그러나 통계학자들은 이런 그래프 쓰는것은 좋지 않다고 말한다. 왜?

이 문제에 대해서 자세한 설명이 여기, 죠기에 있다. 심지어는 저렇게 그룹간의 비교를 할때 저 ‘다이나마이트’ 쓰는 것은 안좋다는 게 N모잡지 자매지에도 소개되었다.

요약하면. (http://biostat.mc.vanderbilt.edu/wiki/pub/Main/TatsukiKoyama/Poster3.pdf)

– 차지하는 공간에 비해서 제공하는 정보란 꼴랑 평균 4개와 표준편차 (혹은 표준오차) 4개. 걍 글로 쓰지…

– 평균이 의미가 있나? 보통 평균이라는 것은 두 그룹간의 비교에 적합한 수단이 아님. (우리 이웃에 빌게이츠가 이사왔다. 그러니 우리 동네의 평균재산은 너희 동네를 발라버린다는 빌게이츠이웃부심 가지고 있는 분이라면 다른 의견을 가질 수도 있겠지만)  각각의 그룹내의 분포는 어떻게됨? 아웃라이어는? 각 그룹의 사이즈 (n #)는? 이런 중요한 정보는 전혀 없음.

– 데이터 자체는 어디 있는가? 저넘의 다이너마이트 뒤에는 데이터가 숨어 있지만 그건 안보여!

– 얻을 수 있는 결론이 뭐냐? 1. A와 B는 똑같아보이고  2. C와 D는 똑같아 보이고  3. A,B와 C,D는 달라 보이고 이정도?

그러나…

이 데이터를 다른 식으로 그리면 이렇게 된다.

Screenshot 2014-08-22 23.43.41

 

그리고 아까의 결론을 다시 한번 생각해 보자.

(1) A와 B는 똑같냐?

(2) C와 D는 똑같아?

(3) A&B 와 C&D는 진짜로 달라 보이는가?

즉 저런 ‘다이나마이트’ 그래프는 다음의 문제가 있으므로 웬만하면 논문 등에서 피해야 한다. 그럼 어떻게 하느냐.

  • 샘플 사이즈가 작을때 (n <15 정도) 저런 ‘다이나마이트’ 플롯을 쓰지 말고 두번째처럼 직접 모든 데이터를 점으로 보여주는 닷 플롯을 쓰자.
  • 샘플 사이즈가 클 때는 박스플롯을 쓰자.

이런 이야기를 하시는 분은 ‘나는 엑셀밖에 못 쓰는데 그럼 어떡하냐?’ 통상적으로 이런 플랏을 위해서는 R 또는 상용의 그래프 소프트웨어가 필요한 경우가 있다. 그러나 그런 분들을 위해서 박스플롯 및 닷 플롯을 쉽게 그릴 수 있게 하는 웹툴을 소개한다. 물론 꽁짜.

http://boxplot.tyerslab.com/

에 접속하면

Screenshot 2014-08-22 23.52.59

 

데이터를 붙여넣기, 혹은 엑셀 데이터를 csv, 탭 등으로 구분된 텍스트로 업로드하고 ‘Data Visualization’ 을 선택하면

Screenshot 2014-08-22 23.55.05

박스 플랏을 그릴 수 있고,

Screenshot 2014-08-22 23.56.17

 

덤으로 데이터 포인트를 올릴수도 있다.

Screenshot 2014-08-22 23.57.27

 

‘Bee Swarm’ 형식으로 데이터를 히스토그램 식으로 표시

Screenshot 2014-08-22 23.58.44

 

‘ Jitter’

Screenshot 2014-08-23 00.00.11

 

물론 R (특히 ggplot2 패키지) 을 사용할 수 있으면 더욱 다양한 그래프를 통계처리 등과 더불어 그릴 수 있겠지만, ‘나 R같이 복잡한거 무리’ 하는 생물학자라면 핑계대지 말고 위의 웹 사이트라도 이용해라. 다이나마이트 들고 설치지 말고 

노벨상을 13개 받을 수 있는 비법을 알려주마

물론 제목은 낚시

LMB의 Canteen

분자생물학의 산실이라 불리는 영국 MRC의 Laboratory of Molecular Biology(이하 LMB)에는 이전도 그렇고 지금도 그렇고 ‘Canteen’ 이라고 불리는 공간이 있다. ‘식당’ 이라고 번역할 수도 있겠지만 어떻게 보면 커피나 차 등을 마실 수 있는 ‘휴게실’ 로 생각하면 좋을듯 하다.

어떤 연구소에든 다 있을만한 이런 장소가 사실은 MRC-LMB에서 열세명의 N모상 수상자를 배출한 원동력이라면 믿겠음? 실제로 최근에 N모상을 타신 어떤 양반은 직접 노벨상 홈페이지에서 이 이야기를 했음. 얼마전에 이 블로그에도 이 이야기를 쓴 적이 있고….

최근에 여기에 대해서 자세히 소개한 글이 있음. 이 글 내용을 대충 소개하려고 함.

사실 이 ‘Canteen’ 이라는 것은 LMB의 초대 짱이었던 막스 퍼루츠 (Max Perutz) 라는 아저씨가 이전에 캠브리지 대학의 캐번디시 연구소에 있던 ‘티 룸’ 을 자신이 연구소짱이 되면서 빌려온 것이라고 하겠음. 이 양반은 해당 연구소에 소속된 모든 사람이 직위고하나 연구분야와는 상관없이 어울리는 공간을 만들고자 하였음.

Screenshot 2014-08-20 20.56.22

존 켄드류와 단백질 모델배틀을 뜨고 계시는 막스 퍼루츠옹 (왼쪽)

그러면 어떻게 해야 하나?

먹을것을 이용합니다 ㅋㅋ

고 퍼루츠옹의 아들 왈 “울 아부지는 연구소 사람들에게 ‘님들 거기 가서 좀 삐대보시지?’ 하고 설득을 했음.그리고 각자 방에 커피메이커 꼬불쳐 두고 방에서 히키코모리처럼 놀지 말고 좀 나와서 다른 사람들이랑 같이 커피 먹으면서 여유롭게 과학에 대해 이야기를 하라고 했씀”
“그래서 그냥 모범을 보이셨음. 즉 사람들이 편안하게 시간을 보낼 수 있는 장소에서 편하게 비공식적으로 자기가 하는 일, 남이 하는 일에 대해서 이야기할 장소를 만들고자 노력하셨죠. 커피와 음식은 밑밥일뿐 ㅋ

많은 사람들이 LMB가 그렇게 중요한 연구소가 된 까닭은 바로 ‘편하게 비공식적으로 자신이 하는 일에 대해서 이야기할 수 있는‘ 그런 자리가 있었다는 것이라고 말하고 있다.
그래서 여기서는 아침에는 커피 주고, 점심때는 점심 주고, 오후에는 차를 주는데, 여기서 이 연구소에 근무하는 학부생 나부랭이부터 교수까지 같이 어우러질 수 있는 환경을 만들 수 있다는 것임. 물론 불금엔 치맥 펍에서 한잔.

여기서 중요한 것은 서로 다른 분야에서 연구하는 사람들끼리 자기가 뭐하는지에 대한 이야기를 하다보다면 자기 연구에 대해서 기존에는 생각도 못했던 뭔가를 얻을 수 있다는 것임. 이것이 무슨 공식적인 세미나 및 토의가 아닌 ‘비공식적이고’ ‘편안한’ 이야기가 되어야 하는 까닭이라면 그런 환경에서 좀 더 자유로운 의견 교환이 나올 수 있기 때문임. 님들 공식적인 학과 세미나 시간에 ‘아 내가 이런 실험을 하고 있는데 요즘 존나 망치고 있음 ㅠㅠ’ 이런 이야기 하시나? 아니면 그냥 아직 시작도 안한 일인데 그냥 아이디어만 가지고 있는 일에 대해서 세미나시간에 이야기 하나? 아니지? 그러나 커피 혹은 치맥 한잔 하면서라면 다를 수 있겠지..그런 느낌?

한가지 예로 MRC에 근무하는 Dario Alessi 라는 사람은 과연 이런 ‘커피 한잔 먹으면서 푸는 노가리’ 가 연구에 어떻게 보탬이 되는지의 예를 들어주고 있음.

주로 암 관련 연구를 하고 있던 Dario 라는 아저씨는 LKB1 이라는 효소가 어떤 효소를 타겟으로 하고 있는지를 찾고 있었슴. 어느날 자기하고는 관련없는 연구인 당뇨를 연구하는 Graham Hardie라는 아저씨와 커피한잔 먹으면서 이빨을 까고 있었는데, 이 사람은 AMPK라는 효소가 어떤 효소에 의해서 활성화되는지를 찾고 있었음.

그런데 알고보니 이 서로가 찾고 있던 단백질이 상대방이 연구하는 것이었음. ㅋ 상대방 아저씨는 그걸 찾으려고 20년간 연구를 하고 있었는데 그걸 옆방에서 연구하고 있었다고 ㅋㅋ

그러다보니 Dario 라는 아저씨가 하는 암 연구에 Graham 아저씨의 효소인 AMPK 를 활성화하는 당뇨병약인 metformin을 적용할 수 있겠다는 아이디어가 나왔고 현재 60여건의 임상실험이 진행되고 있음. 이 모든 게 커피한잔 먹으면서 떠드는 것에서 나왔다는 것임.

그건 영국 이야기고.

그래서 LMB의 그런 문화가 중요하다~ 자 그건 LMB 이야기고, 그렇다면 우리 주변은 어떤가? 일단 이 블로그에서 이 글을 읽으실 분이라면 한국 혹은 외국에 있는 한국계 연구자일 가능성이 높은데, 이런 사람들의 주변에 LMB의 ‘Canteen’ 처럼 자유롭게 과학에 대한 이야기를 하면서 아이디어를 얻을 수 있는 공간이 존재하는가? 물론 국내의 학교, 연구소, 학회에서는 나름대로 구성원들끼리의 교류를 위해 여러가지 행사도 많이 진행된다. 해외의 유명 연구소 혹은 학교라면 으례 하나쯤은 ‘한국인 과학자 모임’ 등과 같은 조직이 존재해서 세미나도 하고 친목도 다지고..국내외를 떠돌아다니다 보면서 참 많이 접헀음.

그러나 저런 LMB의 이야기를 들으면 ‘아 부럽네…쓰바’ 라는 생각이 지워지지 않는 사람이라면 아무래도 지금 현재의 상황에 만족이 안되는 것이라고 생각한다. 그렇다면 자신의 주변에 이런 분위기를 만들려면 어떤 환경이 조성되어야 할까? LMB의 Canteen이 성공적일 수 있었던 요인들을 생각해서 과연 이런 좋은 문화를 우리여건에서 만들려면 어떤 요건들이 필요할지를 생각해 보자.
1. 지위고하를 막론하고 어우러질 수 있는 분위기
사실 한국인들이 모이는 자리의 경우는 아무래도 ‘어우러질 수 있는 사람들’ 끼리 모이는 성향이 강한 게 사실. 솔까말 학과 전체 세미나 & MT 를 하건 뭘 해도 교수급의 사람과 대학원생 급의 학생들이 같이 편하게 어우러지기는 힘든게 우리 실정 아닌감. 역시 해외에 있는 ‘한국인 연구자 모임’ 류에서도 비슷한 처지에 있는 사람들 (포닥 혹은 대학원생) 들끼리 모이는 성향이 큼.

사실 이런 모임에 베틀크루저부터 SCV 까지 다양한 수준의 사람 ‘유닛’ 들이 끼어있어야 하는 이유라면 비슷한 끼리의 사람들끼리 모이면 어차피 비슷한 생각을 가지게 되고 결국 도토리 키재기 식의 결론밖에 나오지 않기 때문. 그건 경험이 일천한 석사나부랭이만의 모임이건 실제로 연구현장과는 좀 거리가 멀어지신 고참교수님들끼리의 모임이든 마찬가지의 상황임.
그러나 여기서 중요한 것는 단순히 다양한 경험수준을 가진 사람들을 섞는 게 문제가 아니라 얼마나 ‘자유롭게’ 이야기를 할 수 있는 환경이 되겠음. 가령 한국의 문화에서 옆 방 교수님 (혹은 포닥 아님 연구교수) 과 실험실 1년차가 “저희교수님이여~ 뭐뭐뭐 해서 뭐뭐뭐 하는 실험을 시키셔서 6개월동안 열라 하는데 안나오거던여. 이 실험 제대로 되는거 맞는거 같으세여?” 와 같은 주제로 쉽게 이야기할 수 있을까?
그러면 한국적인 환경에서 이런 것을 개선하고자 한다면? 난 아직 답을 모르겠다. 존댓말을 폐지합니다 아무래도 한국상황에서 이렇게 비교적 자유롭게 디스커션할 수 있는 환경은 자기 조직 내부보다는 오히려 조직의 상하관계에 연연하지 않을 수 있는 모임에서 나올수 있을 것 같다는 생각.

2. 컨센서스의 형성
서로 다른 분야의 관심사를 가지고 있다고 하더라도 이야기를 하려면 어느 정도는 비슷한 컨센서스를 공유하고 있어야 이야기도 재미있는 법. 그런데 많은 한국의 그런 ‘모임’ 은 비슷한 컨센서스를 공유하기에는 너무 스코프가 다양한 사람들로  구성되어 있는 경우가 많음. 중요한 것은 비슷한 컨센서스를 공유하는 사람들끼리 같은 장소에서 모이기에는 한국의 대부분의 조직이 그러한 Critical Mass 를 넘지 못하는경우가 많음.

그리고 서로 다른 분야의 관심사를 가지고 있는 사람들이 공통적인 화제로 이야기를 하려면 어느정도의 ‘노력’ 이 필요함. 즉, 자기가 모르는 분야를 연구하고 있는 사람이라면 해당 분야가 대충 어떻게는 돌아가는지 리뷰정도는 하나 읽을 정도의 노력은 해야 하지 않겠음? 논읽남을 공격합니다 그러한 노력 없이 서로 다양한 분야의 사람들끼리 모아놔봐야 ‘자기이야기 하다가 끝나는’ 자기자랑쇼가 되기 쉽상이다.
여담으로 이전에 해외 모 대학의 한국인 연구자 모임 등에 나가다가 별로 재미를 못 느낀 게 가끔 자기가 전공하지도 않은 분야에 대한 온갖 종류의 세미나를 자신의 프레임으로만 해석하여 주제와 그닥 밀접하지도 않은 질문을 연신 하시는 분들이 많아서였음. 개인적인 경험으로는 이런 성향을 보이는 분들 중 ‘특정직업군’ 이 많았다라는 느낌이나 이것은 뭐 개인의 경험일 뿐이므로 일반화할 수 없겠죠 아니면 자기가 잘 모르는 연구는 ‘아 그런 희한한 연구는 도데체 왜 하죠? ㅋㅋㅋㅋ 연구비 존나 남아도는듯’ 와 같은 태도를 보이는 분. 그런데 그런 세미나 듣고 앉아있는 너는 뭔데

3. 재미가 없으면 그만하세여 돈도 잘 안벌리는 건데
이런 모임을 노잼으로 만드는 또다른 부류의 분들은 뭐 비공식적인 자리에서 모처럼 “업계이야기” 하려면 “야야 골치아픈데 집어쳐” 하면서 화제를 돌리는 양반들. 그 화제로는 “이번에 누가 잡 잡아서 들어갔는데” 부터 온갖 사돈에 팔촌 이야기 등등…
일단 이런 모임이 생산적이 되려면 ‘자기가 하는 일’ 에 대한 이야기를 재미있게 할 수 있는게 기본이라고 생각한다. 그런게 아니라면, 그런 모임은 나가지 않는 것이 좋다. 다른 친목모임 나가세염. 그것을 넘어서 현재의 과학자라는 직업이 자신에게 잘 맞는 것인지를 곰곰히 고민하시는 게 좋다고 본다. 물론 과학자라는 직업을 노잼으로 만드는 근본 여유는 개인만의 문제보다는 여러가지 쉽게 해결나기 힘든 정치사회적인 이유들이 복합적으로 존재하겠으나…여튼.

대안은 온라인?

그래서 현실적으로 나는 한국에서 LMB의 Canteen과 같은 자유로운 의견교환이 일어날 수 있는 편안한 자리를 ‘물리적으로’특정 기관 속에 만드는 것에는 어려움이 많다고 생각한다. 그러나 그 대안이라면 아마도 온라인이 되지 않을까 싶다. 즉 일단은 한국상황에서 ‘지위고하에 비교적 구애받지 않고’ 만날 수 있는 분위기 (군필자라면 옆 중대면 뭐 다 아저씨지 하는 심리를 생각해보자 ㅋㅋ) 를 조성하는 것은 온라인이 낫다고 생각하고, 밀접한 유대관계야 뭐 PC통신부터 내려오는 ‘번개’ 문화가 있으니 해결 가능. 그리고 대개 이러한 모임은 비슷한 관심사를 가진 사람들끼리 모이게 되므로 두번째 컨센서스의 형성이라는 데는 결정적으로 유리하고, 마지막으로 자기가 하는 일에 재미를 못 느끼는 사람은 이런데 온라인 모임에 나올 가능성이 희박하달까.