단백질 정제의 십계명 3. 과발현(Overexpression)을 경배하라

단백질 정제의 십계명

1. 단백질은 단백질마다 다 다르니 그들의 특성을 잘 파악할지어다.

2. 폴리펩타이드 결합은 언젠가 끊어질지니 단백질 분해효소에 유의할지어다

그리고 오늘은

3. 과발현(Overexpression)을 경배하라

기원 이전

멀고 먼 옛날 은하계 저편에서 단백질을 처음 정제하고 있을때…까지는 아니고 1960-70년대까지 새로운 단백질을 정제하여 그 특성을 파악하는 것을 연구주제로 삼던 사람들은 (일단 원하는 단백질을 포함하고 있는) 어마어마한 시작물질을 확보하는 것부터 시작했었다.  미생물이라면 수십 리터의 균을 배양하여 수백그램에서 1kg에 달하는 세포양을 확보하는 것은 기본이었고 (1kg 정도의 균체라면 500ml이 들어가는 센돌이 바틀로 두개 정도가 꽉 차있는 양이라고 생각하면 됨) 효모 같은 것이라면 아예 제빵효모를 파는 곳에서 덩어리로 구해오는 것이 보통. 동물 조직에서 정제한다면 역시 도축장 등에 찾아가서 어마어마한 양의 조직을 (보통 kg 단위로) 얻어와서 이것을 파쇄하여 기나긴 정제의 여정을 시작하는 것이 보통이었다.

Screenshot 2014-07-15 21.34.09

 

효모덩어리를 사거나

Screenshot 2014-07-15 22.16.26

대장균이라면 왕창 키워버려 출처

이렇게 해서 수백그램의 단백질로부터 원하는 단백질을 순수정제하기까지 거치는 노력은 지금의 연구자들이 생각하기 힘든 수준이었다 (너무 일이 많아서 실험실에서 키우는 멍멍이의 손을 빌려야 할정도로…뭐 개노가다라고도 하죠 ) . 특히 지놈 시퀀싱 이전에 특정한 유전자를 클로닝하기 위한 방법으로써 일단 단백질로부터 시작하여 단백질을 정제하고, 단백질의 일부 아미노산 서열로부터 프로브를 합성하여 지놈 DNA 라이브러리로부터 클론을 탐색해 나가고…1980년대, 아니 1990년대 초반 정도까지 특정한 단백질을 최초로 순수분리하여 특성을 파악하는 것만으로 웬만한 박사 논문은 충분한 수준이었고, 여기에 덧붙여서 유전자까지 클로닝하였다면 거의 슈퍼맨으로 인정받을 수 있던 시절도 있었다.

그러나 1970년대 이후에 유전자 조작기술이 나와서 대개의 단백질은 과발현 (Overexpression)을 할 수 있게 되었고, 특히 지놈 시퀀싱이 된 이후 원하는 유전자는 간단히 PCR을 이용하여 클로닝하여 발현 벡터에 넣고, 원하는 어피니티 택을 붙여서 발현시킬 수 있게 된 이후부터 단백질 정제는 이전처럼 무한 노동력이 필요한 일은 아니게 되었다. 즉 현 시점에서 대개의 경우 단백질 정제는 일단 원하는 단백질을 과발현시켜서 양을 늘린 다음에 시작하는 것이 기본이 되었다. 이번차에서는 이렇게 단백질 정제에 필수적인 요소가 된 과발현에 대해서 알아보고자 한다.

단백질 발현은 예술.

모든 단백질이 발현벡터에 유전자를 클로닝하고 대장균에 형질전환하면 달덩이 같은 SDS-PAGE 밴드로 떠주었으면 좋겠지만 세상 일이 어찌 그렇게 맘대로 되던가. 게다가 단백질 정제의 십계명의 1번인 “단백질은 그때그때 달라요” 는 단백질 과발현에서부터 적용되는바, 아무 생각없이 전체 ORF 서열을 발현벡터에 클로닝해넣어도 전체 단백질의 절반 이상으로 발현되는 경우도 있는가 하면, 단백질을 얻기 위해 온갖 고생을 다해야 하는 경우가 있다. 다시한번 암송합시다. “단백질은 단백질마다 그때그때 달라요”

따라서  요즘 단백질을 정제할때 ‘그때그때 다른’ 단백질마다 새롭게 정제조건을 확립하는 그 첫번째 단계는 ‘어떻게 하면 우리가 원하는 단백질을 과발현할 수 있는가’ 로 집약될 수 있다. 일단 원하는 단백질이 충분히 과발현될수록 정제의 단계는 좀 더 수월해지고 정제에 필요한 노력을 덜 수 있으며, 여기에 더불어 훨씬 더 순도가 높은 단백질을 얻을 수 있다는 것은 당연한 일.

여기서 생각해 볼 문제들은 다음과 같다.

단백질을 정제해서 무엇을 할 것인가? 항체를 만드는데 필요한 항원을 만들기 위해서 단백질을 정제하는 사람도 있는가 하면, 그 생물학적 활성이 필요한 사람도 있다. 그것도 아니라면 구조정보를 얻기 위해서 결정화할 수 있는 최소단편을 안정적으로 발현하는 것이 목적인 사람도 있다. 아니면 의약품과 같은 용도로 사용되어야 하기 때문에 극미세량의 불순물도 제거되어야 할 필요가 있는 경우도 있다. 일단 이 용도가 확실하게 된 연후에 다음의 고민을 하게 될 것이다.

단백질의 전체가 필요한가? 일부분이 필요한가? 많은 단백질, 특히 진핵생물의 도메인이 여러개 달린 단백질이라면 이것을 발현시키는데 어려움을 겪는 경우가 많이 있다. 이러한 것은 결국 ‘단백질을 어디서 발현할 것인가?” 와 “단백질의 전부 혹은 일부를 발현할 것인가?” 등과의 문제와도 결부되어 있다.

단백질을 네이티브한 형태로 과발현할 것인가? 아니면 퓨전 단백질로 발현할 것인가? 대장균에서 전체 수용성 단백질의 20-30% 정도로 왕창 발현되는 단백질이라면 굳이 퓨전단백질로 발현하지 않아도 그리 어렵지 않게 정제할 수 있을지도 모른다. 그러나 웬만한 경우라면 정제의 용이성을 위하여 GST, His-tag 등과 같은 어피니티 태그를 이용하여 발현할 필요가 있다. 이러한 어피티니 태그의 경우 단백질을 단순히 정제하는 것 뿐만아니라 단백질의 발현정도를 높인다든지, 단백질의 solubility를 높인다든지 등의 보조적인 역할도 한다는 것을 유념해야 한다.

단백질을 어떤 발현계에서 발현할 것인가? 물론 모든 단백질이 대장균과 같은 값싸고 간편한 발현시스템에서 발현되고 그것이 생물학적인 활성을 띄게 된다면 얼마나 좋겠는가만 현실은 그렇지 않다. 때로는 효모, 곤충세포, 동물세포등과 같은 시스템을 이용해야만 자신이 원하는 단백질을 얻을 수 있는 경우는 많다. 반면에 대장균과 같은 간단한 시스템에서도 충분히 발현해서 목적에 맞게 얻을 수 있는 상황에서 곤충세포나 동물세포와 같은 값비싼 발현계를 쓸 필요는 없을 것이다.

여기에 대해서는 각각 독립된 항목으로 다룰 것이므로 오늘은 그닥 오래 다루지는 않는다. 그러나 지금 단계에서 기억해야 할 것은 오늘날 단백질을 정제한다면 일단 이런 것을 유념해서 가능한 많은 양의 단백질의 발현을 어떻게 할것인지를 고민해야 한다는 것이다.

“단백질이 많이 나오는데 몽땅 다 펠렛으로 가요 엉엉엉”

대장균에서 단백질을 발현할때 많은 사람들이 고통을 겪는 것이 단백질 자체는 많이 만들어지는데 대개 불용성 분획으로 가 버리는 것, 소위 말하는 인클루전 바디 (Inclusion Body) 의 형성이다. 이런 것을 어떻게 할 수 있는 방법이 없을까?

일단 이런 방법을 제시하기 이전에 세균 유래의 단백질이 아닌 동물, 식물 유래의 단백질은 일단 대장균과는 다른 환경에서 번역되고 폴딩된다는 것을 알아야 한다. 결국 제대로 된 폴딩이 이루어지지 않는 것이 인클루전 바디의 형성의 원인일진데, 이런 것의 원인에는 여러가지가 있다.

단백질 복합체를 형성하는 경우 : 원래의 세포에서 단일한 단백질로 존재하는 것이 아니라 다른 단백질과 복합체를 형성하는 경우, 하나의 단백질만을, 그것도 대장균과 같은 서로 다른 환경에서 발현한다면 사실 제대로 수용성으로 나오는 것 자체가 힘들 것이다. 반대로 생각한다면 이렇게 다른 단백질과 복합체를 이루는 단백질의 경우 대장균 등의 이질적인 호스트에서 발현하기 위해서는 해당 파트너와 같이 발현하는 것이 필요할 경우가 많다. 여기에 대해서는 나중에 따로 쓸 것이다.

폴딩 환경의 차이 : 진핵생물의 단백질 중에서 생체막을 통과하는 영역이 있는 경우, 혹은 막단백질인 경우에는 거의 대장균에서 제대로 발현하는 것이 힘들 수가 있다. 이런 경우에는 아예 다른 호스트를 선택하거나, extracellular domain 정도만을 파악하는 것이 중요하다.

Disulfide bond가 많이 존재하는 경우 : 대장균과 진핵생물은 산화환원 환경이 틀리고, Disulfide bond가 많이 함유되어 있는 단백질일수록 대장균에서의 발현은 쉽지 않다. 이러한 것을 도와주는 대장균 Host가 몇 가지 나와 있으나, 뭐 역시 케바케.

Posttranslational Modification 이 단백질 폴딩에 필수적인 경우 : 가끔은 당쇄결합, 혹은 인산화 (대장균에는 진핵생물에 많이 존재하는 Serine/Threonine 혹은 Tyrosine Kinase는 거의 없는 반면, 대신 Histidine Kinase가 많이 존재한다) 등이 단백질의 폴딩에 필수적인 경우가 있다. 이런 것은 사실 대장균에서 발현한다면 거의 노답.

Disordered region 등이 많이 존재하는 경우 시퀀스를 아미노산 원레터 코드로 읽어볼때 “프프프프프크프프크크으으으으드드드듣” 하는 소리가 나오는 영역이 가끔 있을 것이다. 이런 부분의 경우 soluble하게 발현되기도 힘들뿐더러 발현된다고 하더라도 극심한 Degradation을 초래한다.

등등 온갖 잡스러운 원인으로 인해서 대장균에서 ‘단백질은 많이 나오는데 전부 불용성으로 가요 엉엉엉’ 하는 분들이 많다. 이런 분들은 다음과 같은 것들을 차근차근 해보기 바란다.

1. 발현 온도를 낮춰본다. 몇도씨까지 알아보고 오셨어요에서 발현을 해보셨음? 섭씨 37도라면 일단 30도, 25도, 18도까지 발현온도를 낮추어 본다. 요즘은 대장균에서 저온에서 최적으로 단백질을 발현하는 시스템도 나와있다. 물론 처음부터 배양을 할때 저온에서 키운다면 세포성장이 너무 느린 관계로 37도 등에서 세포를 어느정도 키운 다음 induction을 할때 온도를 낮추는 것 등을 권장한다. 그러나 본인은 귀찮아서 온도조건 따위는 최적화하지 않고 처음부터 18도에서 induction한다. 경험상 37도에서 불용성으로 가는데 18도에서는 제대로 발현되는 것은 많지만 그 반대는 별로 없거던요 ㅋㅋ

2. 벡터를 바꾸어 본다. 특히 목적단백질을 수용성으로 바꾸어주는데 효험이 있다고 알려진 어피니티 택인 MBP (Maltose Binding Protein)이나 SUMO, trx (thioredoxin A) 태그를 이용해 본다. (GST, His-tag 등은 그닥 solubility에는 큰 영향을 안 주는 경우가 많다)

3. 컨스트럭트의 위치를 바꾸어 본다. 즉 도메인 분석이나 disordered 된 영역의 분석을 통해 ‘잘라낼’ 부분의 위치를 파악하고 정확히 원하는 영역의 단백질만을 발현해 보도록 한다. 여기에 대해서도 나중에 다룰 것임.

4. Binding Partner가 있을 경우 동시발현을 할 수 있을지를 검토해 본다. (역시 나중에..)

5. 가끔은 Chaperon 등을 같이 과발현하면 효과가 있을수도 있다.

6. 시중에는 ‘이 호스트에 넣으면 발현이 안되던 것이 잘 발현되요’ 하고 선전하는 대장균 host 들을 많이 판매하고 있다. 그러나 우리가 단백질 정제의 십계명중 첫번째가 무엇인지를 잘 기억해 보자. “단백질은 그때그때 달라요” 였지? 모든 단백질을 항상 Soluble 하게 발현해 주는 마법의 호스트는 없는 편이다. 그래도 혹시 모르니 한번쯤은 속아보는 것도 나쁘지는 않다.

7. 이래도 안되면 대장균을 포기하고 다른 호스트로 옮겨간다. 효모, 곤충세포, 동물세포 등등..물론 막단백질이라든지 항체라든지 등등 대장균에서 잘 발현되지 않는다고 알려진 클래스의 단백질은 처음부터 다른 호스트부터 시작하는 게 상책이다.

나올 단백질은 어찌했거나 나온다. 안나오는 넘은 안나오지만

어느정도 단백질이 발현된다는 것이 확인된다면, 일단은 정제작업에 들어가는 것이 좋다. 물론 과발현이 된다면 보다 적은 스탭의 정제과정을 거쳐도 좀 더 높은 수율로 많은 양의 단백질을 얻을 수 있다는 장점이 있다. 그렇지만 상업적으로 지속적으로 단백질을 생산할 것이 아닌 연구목적이라면, 이리가든 저리가든 자신의 용도에 필요한 정도의 양과 순도의 단백질만 얻으면 그만. 만약 연구목적으로 일정량의 단백질만 얻으면 되는 상황이라면 충분히 발현이 안되지만 발현은 되긴 된다고 생각한다면, 지나친 최적화 노력을 하는 것보다는 일단 세포의 양을 늘려서 정제를 시도하는 것이 낫다고 생각한다. 상업적으로 단백질을 생산한다면? 뭐 뼈빠지게 최적화 해야죠..뭐 그게 일인데..

발현이 잘 되서 100ml 의 배양만으로 수십 mg 의 단백질을 얻을 수 있는 경우가 있는가하면, 수십 리터를 컬쳐해도 1mg 의 단백질도 얻지 못하는 경우가 있다. 그러나 어찌하겠는가? 다시한번 외쳐보자 ‘단백질은 그때그때 달라요’. 그때는 양을 늘리는 것 이외에는 답이 없다.

산업적인 목적으로 단백질 수율을 개선하려는 목적이 아닌 연구용으로 일정한 양의 단백질만 얻으면 되는 상황이라면 단백질 발현 최적화는 항상 ‘적당한’ 정도로만 하는 것이 좋다고 생각한다. 특히 IPTG의 농도를 변화시킨다든지, Induction 시간을 변화시킨다든지, 호스트 균주를 변화한다든지와 같은 것은 극히 제한적인 성공을 주는데, 여기에 시간을 많이 투자하지는 말길. 차라리 그럴 시간이 있다면 벡터를 바꾸거나, 컨스트럭트를 새롭게 제조하는데 시간을 투자해라.

즉, 일단 단백질이 어느정도 발현된다면 일단 정제를 시도해라. 충분하지 않다고? 양이 해결해줄거다. 저 위에 보여주는 500리터 배양까지는 안해도 되니 쫄지마라.

단백질이 왕창 안나오면 원스텝으로 정제가 안나온다구요? 그런 분들을 위해서 “어피니티 크로마토그래피가 다가 아니느니라” 라는 내용을 또 다룰 것이다.

과발현을 경배하되, 때로는 자연산에 의존해야 할 때도 있으니라

그래서 세상의 모든 단백질이 다 과발현이 될수 있으면 좋으련만, 그렇지 않은 경우가 있고, 아주 가끔은 자연내에도 무궁무진하게 존재하여 자연산만으로 수요를 충족할 수 있는 경우도 있다. 가령 본인이 꽤나 집적거리는 단백질 중에서는 Actin이라는 단백질이 있는데, 이것은 근육의 구성요소. 삼겹살은 액틴맛  근육조직에서 워낙 엄청나게 존재하고, 또한 어느정도 이상의 염농도 (100mM 이상) 에서는 중합되고, 저염 농도에서는 분리되는 특성이 있으므로 컬럼 크로마토그래피를 전혀 쓰지 않고 센돌이 몇 번 돌리는 것만으로도 95% 이상의 순도로 정제 가능하다.

Screenshot 2014-07-15 22.33.57

컬럼 없이 센돌이 만으로 이정도 ㅋ 출처

이런 축복받은(?) 단백질을 연구하지 않는 경우라도 가끔은 아직도 양으로 승부하여 복잡한 단백질 복합체를 정제해야 할 경우가 있는데, 가령 이렇게 6개의 단백질로 구성된 복합체로써 재조합에 의한 발현은 곤란해서 소의 흉선 혹은 대뇌 (약 5mg 의 순수정제된 단백질을 위해서는 소대가리 1개가 필요함 ㅋ) 에서 정제하는 단백질도 있긴 하다.

Screenshot 2014-07-15 22.36.54

Arp2/3 complex

물론 천연소스에서 단백질을 정제하기 위해서는 그야말로 “단백질은 단백질마다 틀려요” 의 그말의 원류대로 단백질의 성질에 따라서 고유한 정제조건, 대개는 어피니티 크로마토그래피와 같은 치트키 수준의 프로토콜에 의존하지 않고 이온교환, 젤여과 크로마토그래피등과 같은 정통적인 방법에 의존해야 할 필요가 있다. 애들은 가라 

어쨌든 전통적인 방식으로 단백질을 정제하기 위해서는 (혹시 그래야 할 필요가 있다면) 제일 먼저 유념해야 할 것은 “충분한 시작물량 확보” 일 것이다.

결국은 물량 확보

결국 이전의 자연산 단백질을 정제할때나 단백질을 과발현할때나 단백질 정제의 준비에 필요한 제 1단계는 언제나 동일하다. 즉 ‘목적하는 단백질의 물량 확보’. 즉 자연산처럼 원래 조직에 그닥 많이 없는 경우에는 대신 ‘단백질이 들어있는 원재료’ 의 물량을 증가시켜서 목적하는 단백질을 늘리고, 과발현은 ‘단백질이 들어있는 원재료’ 내에서 원하는 단백질의 양을 늘리는 정도의 차이랄까? 즉, 단백질을 정제하기 위해서는 “원하는 단백질”부터 많이 확보하고 봐야한다는 것은 예나 지금이나 단백질 정제의 첫 단계에서 유념해야 할 사항이다.

그러니까 빨리 셀이나 더 컬쳐하라고..싫으면 벡터나 하나 더 만들거나

5 thoughts on “단백질 정제의 십계명 3. 과발현(Overexpression)을 경배하라

  1. ㄷㄷㄷ 모든 이공계중에 생물학이 잴 빡신것 같네요.

    전 물리학 석사하고 먹고살길이 막막해서 코딩으로 밥먹고 사는 지나가는 엔지니어인데요, 물리, 컴공, 약간의 전자기학을 경험한 입장에서 보자면, 단백질 정제같은 실험은 정말 ㅎㄷㄷㄷ, 뭘해야할지 길을 잃은 듯한, 숨이 턱하고 막히는 느낌이 드네요 ㄷㄷㄷ

    아인슈타인에 낚여 물리학사를 하고, 내머리로 할수 있는게 아니구나라고 느껴, 고체물리 실험랩에서 석사를 했는데, 했던일은, 단백질 정제같은 개막노가다였거든요. 근데 단백질 정제는 차원이 다른것 같다는…

    고체물리 실험을 약간 썰을 풀어보면, 가령 어떤 굇수가 망간 서파이드 산화물이 초저온 초자기장하에서 퀀텀닷이 생기더라고 자연에 논문을 내면 조낸따라하는거죠. 중요한게 그런 흥미로운 물리현상이 생길것 같은 초순수한 결정을 만드는 건데, 가령 내가 빡통을 굴려보니깐 Mn2S4Ni3O5OH 의 결정이 흥미로울것 같아 라고 생각을 하면 그물질의 순수한 결정을 1mm^3 정도 만들어야 해요.
    만드는 방법이 조낸 노가다인데, 막자사발에 시료의 가루를 구성비로 초정밀하게 저울에 재면서(?) 넣은다음, 조낸 갑니다. 할머니가 메주를 가시던것 처럼.. 갈 때의 염원이 결정의 순도에 영향을 준다고요.. 보통 2시간을 가는데, 어떤 인간은 5시간도 갈고, 기계가 할수도 있어보이지만, 그렇게 커스텀된 기계는 없을 뿐더러(왜?) 비쌀게 분명하기 때문에, 널린 대학원생이 갈아댑니다. 그렇게 갈고 난 후, 프래스에 넣고 100기압 정도로 압축을 합니다. 어떻게? 자전거 타이어에 바람넣는것 처럼 열심히 손으로 펌프질을 하면 프래스가 그렇게 압축을 해요.
    이제 결정을 만들어야 하는데, 어떻게 하냐면, 1500도 정도 올라가는 furnace에 넣고 몇시간을 기다리는건데, 온도, 상온에서 해당온도로의 가속, 그 반대, 퍼니스안에 흘리는 가스의 구성비 (질소, 산소, 수소 등등)이 결정을 만드는데 큰영향을 주고, 그게 랩의 경쟁력입니다.😛 혹은 레이져로 결정을 만드는 방법도 있는데, 레이져가 시료를 녹이면 눈으로 보면서 시료를 기계의 버튼을 눌러 (인형뽑기처럼) 잘움직이면서 잘(?) 결정을 만듭니다.
    결정을 이제 칼로 젤 잘나왔을것 같은(?) 부분을 1mm^3정도로 잘 자른다음, 결정에 전선을 붙여야해요. 전선을 얼마나 이쁘게 붙이는냐가 굉장히 중요한데.. 저는 정말 막손이라 제가 전선을 붙이기만 하면 실험이 폭망하곤 했습니다. ㅎㅇㅅ랩의 30대 초반의 여성연구원이 난자에 구녕을 뚫듯이 정밀한 핀셋스킬이 필요합니다.
    그리고 결정을 초저온까지 떨어질수 있는 드럼통같이 생긴거에 넣고, 액체핼륨을 왕창붙고 (이거 비쌈), 펌프가 펌프질을 해대고, 자기장을 막 바꾸어 0.01~0.001캘빈까지 온도를 떨구고 자기장을 10T라 정도 가한다음 이런저런 실험을 하죠.
    실험에서 가장 중요한것은 인내, 축복받은 손, 운 >>>> 넘사벽 >>>> 물리의 이해 였던것 같다는… 일딴 뭔가 이전에 없었던 결과가 나오면, 계산을 하고 합리화를 해줄 사람들은 제 2, 3저자로 널렸다는..

    머리도 않좋고 손도 막손이라 이걸로 밥먹고 살기 힘들겠구나라고 느낀 후 어찌저찌하여 코딩으로 밥먹고 살고 있는데요, 컴공은 정말 편한것 같아요. 정밀한 손도 필요없고, 운이 개입할 소지도 거의 없고, 뭔가 육체적으로 막노동할 것도 없고, 잴 중요한것은 아무도 이해못하고 결과가 과연 나올까라는 그런 불활실한 것이 거의 없다는.. 근데 양질의 일자리가 널렸다는..

    근데 단백질 결정을 비롯한 생물학 실험의 대부분은 그 불확실함이 너무 커 보입니다. 어떤 천재가 나타나 뉴비도 발로 실험할 수 있게 뭔가 진공관에서 IC로 넘어간 전자기학 처럼 혁명이 한번 있어야, 생물학에 남은 많은 난제들이 해결가능해 보이네요. 에고 수고하세요. 저는 생물학에 비하면 껌인 코딩하러 갑니다.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s