단백질 정제의 십계명 4. 친화크로마토그래피(Affinity Chromatography)와 친하게 지내라

이전까지 다룬 것들은 다음과 같다.
단백질 정제의 십계명

1. 단백질은 단백질마다 다 다르니 그들의 특성을 잘 파악할지어다.
2. 폴리펩타이드 결합은 언젠가 끊어질지니 단백질 분해효소에 유의할지어다
3. 과발현을 경배하라

단백질 정제의 치트키

그동안 알아본 내용들이 결국단백질을 정제하는데 필요한 준비였다면 이제서야 본격적으로 단백질을 정제하는 이야기라고 하겠는데 여러가지 단백질 정제 테크닉중 현대의 단백질 정제에서 가장 중요한 기술을 딱 한 가지만 이야기하자면? 친화크로마토그래피 (Affinity Chromatography) 되겠습니다.

친화크로마토그래피의 원리는 어찌 보면 간단함.

그동안 단백질 정제에 대해서 알아보면서 귀에 못이 박히도록 떠든 이야기가 뭔가? “단백질은 그때그때 단백질마다 틀려요” 지? 결국 단백질 정제라는 것은 이런 제각각의 다른 성질을 가진 단백질 중에서 자신이 원하는 단백질만을 슥 골라내는 일이다.


온갖 다양한 성질을 가지는 단백질 중에서 자신이 목적하는 단백질에만 특이적으로 결합하는 레진을 이용하여 자신이 원하는 단백질만을 스윽~ 골라내는 친화크로마토그래피는 단백질 정제에 가장 이상적인 툴로 생각된다.

그러나 친화크로마토그래피가 어떤 단백질 정제에서건 필수적인 툴이 된지는 생각만큼 오래된 일은 아니다. 친화크로마토그래피가 단백질 정제의 기본 툴이 된 것은 아마도 재조합 DNA 기술에 의해 단백질을 마음대로 조작할 수 있게 된 1980년대 이후라고 봐야 된다.

물론 그 이전에도 단백질의 특이적인 성질을 이용하는 친화크로마토그래피는 여러가지 단백질의 정제에 사용되었다. 가령 DNA 에 결합하는 전사인자들은 DNA가 고정화된 컬럼을 통해서 정제했다든지 (‘셀책‘ 을 쓴 Bruce Albert 아저씨가 기회날때마다 자랑하는게 바로 이 이야기임) 아주 많은 효소의 기질로 사용되는 ATP 를 이용하여 ATP에 결합활성이 있는 단백질을 정제한다든지…그러나 단백질은 단백질마다 각각 틀리다는 특성을 감안한다면 친화크로마토그래피는 재조합 DNA 이전에는 극히 일부의 단백질의 정제에 개별적으로 사용된 마이너적인 테크닉에 불과했다고 볼 수 있다.

골백년 전에 개발하신 DNA 친화크로마토그래피를 기회만 나면 자랑하시는 브루스 알버트 아저씨. 아저씨는 그저 셀책셔틀일뿐이잖아요

그러나 재조합 DNA 기술에 의해서 어떠한 단백질도 융합단백질을 만들어 낼 수 있게 됨에 따라서, 친화크로마토그래피는 거의 모든 단백질의 정제에 공통적으로 이용할 수 있는 툴, 일종의 치트키가 되버렸다. 그렇다면 어떠한 단백질도 몇 가지의 방법으로 정제할 수 있는 “치트키” 의 실체인 어피니티 태그 (Affinity Tag)에 대해서 알아보자.

어피니티 태그

어피니티 태그를 간단하게 정의하면 ” 임의의 단백질과 융합되어 해당 융합단백질을 쉽게 정제할 수 있게 하는 특정한 물질에 친화력이 있는 단백질쪼가리” 라고 할 수 있겠다. 가령 생체내에서 산화환원을 조절하는 물질인 글루타치온 (GSH) 은 극히 일부의 단백질에만 친화력을 지니는데, 개중 하나가 글루타치온을 다른 물질에 붙여주는 단백질인 글루타치온 전이효소 (Glutathione S transferase,GST) 같은 것이다. 이 단백질은 글루타치온을 고정화한 레진에 매우 잘 붙음.

그렇다면 우리가 목적하는 다른 단백질을 (DNA 재조합 기술을 이용하여) GST라는 단백질과 융합시키면, 다른 목적단백질 (원래는 글루타치온과 친화력이 전혀 없는) 을 글루타치온을 고정화한 레진에 역시 잘 들러붙는다. 다른 단백질은 대개 글루타치온과 친화력이 없으니 슥슥 빠져 나가겠지? 그 다음에 버퍼에 과량의 글루타치온을 섞어서 넣어주면, 레진에 들러붙은 단백질만 회수 가능. 단백질 정제 완료 ㅋ

간단한가? 물론 이론상으로는 간단하지만, 여러가지 신경써야 할 것들이 있다.

각종 어피니티 태그의 특징

1. His-tag / Ni-NTA

Screenshot 2014-07-24 03.41.11

개요: 6개 (혹은 8개)의 히스티딘을 연속으로 달아놓으면 니켈 등의 금속이온과 배위결합을 생성하게 된다. 니켈이 위의 그림처럼 레진에 결합되어 있으면 히스티딘을 죽 달아두면 니켈 결합 레진에 단백질이 달라붙게 되는데 (니켈을 고정하기 위해서 흔히 Nitrilotriacetic acid (NTA)라는 물질을 사용한다) 이러한 성질을 이용하여 단백질을 정제하는 방법이다. 아마도 오늘날 재조합 단백질을 정제하는데 가장 많이 사용되는 방법이라고 봐도 된다.

일단 레진에 결합된 단백질은 과량의 이미다졸 (Imidazole) 혹은 pH의 변화에 따라서 회수 가능.

Screenshot 2014-07-24 03.42.42
겨울왕국의 엘사가 좋아할 파란색은 니켈 덕

장점

  •  태그가 매우 작다. 약 20 아미노산. 웬만하면 다른 단백질에 결합되어도 단백질의 기능에 큰 영향을 미치지 않을 가능성이 높다. 게다가 MBP, thioredoxin, SUMO 등과 같이 다른 어피니티 태그와 같이 사용가능하다.
  •  N 혹은 C 말단에 선택적으로 달아야 하는 대개의 태그와는 달리 N말단이든 C말단이든 가리지 않고 결합가능.
  • 1ml 당 결합하는 단백질의 양이 많기 때문에 (10mg 이상) 정제후에 매우 높은 농도로 단백질을 농축가능.
  •  다른 태그와는 달리 Denaturation 조건, 즉 6M Urea와 같은 조건에서도 작동함. 가령 Inclusion body 로 떨어진 단백질을 정제하고자 할때, 6M Urea 등으로 녹인 후에도 사용가능함.
  • 태그가 작은 편이므로 굳이 벡터에 클로닝하지 않고 PCR 등으로 히스티딘 6개 및 링커 시퀀스를 달아서 도입할수도 있음

단점

  •  비특이적 결합이 많음. 발현수준이 높을 경우에는 크게 상관없으나 낮을 경우에는 매우 많은 잡뺀드를 보게됨. 이를 줄이기 위해서는 꽤 stringent한 조건으로 (25mM Imidazole 함유 버퍼 등) 빡세게 워싱을 해야 함.
  •  불용성의 성질인 단백질을 수용성으로 유도하는 것은 그닥 기대하기 힘듬.
  • 버퍼에서 이리저리 가리는 게 꽤 많음. 보통 단백질 분해효소 저해제로 많이 넣는 EDTA 넣으면 ㅋ 안됨. (EDTA는 2가 양이온 킬레이터이기 때문에 니켈을 다 떼버림). DTT를 1mM 이상 버퍼에 넣을 경우 니켈이 산화되는 경우가 많음

2. GST / GSH

개요: 앞에서도 잠시 설명한 것처럼 Glutathion S-transferase (GST) 라는 단백질이 글루타치온 (GSH)에 친화력을 가지는 것을 이용함. 즉 글루타치온이 결합된 아가로스 레진을 어피니티 레진으로 이용하며, 목적단백질은 GST의 C말단에 융합되서 발현됨. 결합된 단백질은 워싱 후에 GSH가 함유된 버퍼를 이용하여 회수함.

장점

    • 선택성이 높은 관계로 단백질 발현수준이 낮아도 상대적으로 깨끗한 결과물을 가져다줄 가능성이 높음.
    •  따라서 단백질 정제 외에도 Pulldown 과 같이 미지의 단백질 결합파트너를 찾는 실험에도 널리 사용.
    •   보통 단백질 정제를 많이 안하는 사람은 GST 외에 다른거 잘 몰라서…장점 맞음? -.-;;

단점

    • 상대적으로 큰 tag (25kDa) 이다. 상당수의 경우 tag이 달림에 따라서 목적단백질의 활성이 저해될 가능성이 있으므로 많은 경우 tag을 잘라주어야 하는 경우가 있다.
    • GST는 자체적으로 dimer를 형성한다. 따라서 GST 에 퓨전되는것만으로 목적단백질 자체도 dimer가 되는 셈이고, 이에 따라 예기치 않은 특성이 나타날 경우가 있다.
    • 뒤에서 소개할 다른 태그 (MBP, SUMO, thioredoxin) 등과 같이 불용성의 성질인 단백질을 soluble 로 유도하는 성질은 거의 없는 편.

3. MBP / Maltose

개요: 대장균 유래의 말토스 결합단백질 (Maltose Binding Protein) 을 이용한 어피니티 태그. 융합단백질은 아밀로스 (amylose) 가 결합된 아가로스 레진에 결합하게 되며, 단백질은 말토스가 함유된 버퍼로 회수됨.

장점

  • 원래는 이 목적으로 개발된 태그은 아니었지만 현재까지 이 태그가 사용되는 것은 MBP에 단백질을 달아두면 상당수의 불용성 단백질이 수용성으로 나온다는 성질이 있기 때문.
  • 발현레벨이 상당히 높은 편이라서 발현이 잘 되지 않는 단백질을 여기에 융합시키면 발현양이 증가되는 경우가 많음.

단점

  • 태그가 매우 큰 (40kDa) 편. 웬만하면 잘라야 함.
  • 퓨전이 되지 않았을 경우에는 어피니티 레진인 아밀로스 레진에 잘 붙으나, 단백질이 퓨전되면 아밀로스 레진에의 결합력이 떨어지는 경우가 많이 있음. 이를 극복하기 위하여 N말단에 His-tag과 같은 별도의 태그를 추가로 달아두는 경우가 많음. 이 경우에는 MBP 태그는 정제보다는 단백질의 발현을 촉진하기 위해서 사용되는 편.
  • 사용되는 레진은 내구성이 상당히 낮은 관계로 그닥 많이 재활용을 할 수 없는 편.

4. Intein/Chitin-binding

개요 :
위에서 설명한 모든 융합단백질 태그의 경우는 이제 필요가 없어지면 특이적인 단백질 분해효소를 이용하여 태그와 목적단백질 사이를 끊어내야 한다. 그러나 만약 어피니티 태그가 자체가 필요가 없어지면 그냥 셀프 -.- 로 목적단백질과 끊어져 버린다면 얼마나 좋을까? 아 예 고갱님 주문하신 제품이 있습니다 단백질 중에서는 희한하게도 두개의 별도의 폴리펩타이드 체인으로 발현되어 단백질이 서로 융합되는 것들이 종종 있음. 마치 진핵생물의 mRNA가 스플라이싱을 통하여 엑손영역만 결합되듯이. 이러한 단백질 부분을 ‘인테인’ (Intein) 이라고 함.

Screenshot 2014-07-24 12.47.39

이런 희한한 현상을 단백질 정제에 이용하는 시스템이 존재함.

Screenshot 2014-07-24 12.49.37

현재 상용화된 Intein system의 경우, 매우 강한 환원조건 (25mM 이상의 DTT) 을 주었을 경우 자가분해가 됨. 이러한 활성을 이용하여 여기에 셀룰로스 결합도메인 (CBD)을 결합한 시스템이 ‘Impact  System’ 이라는 이름으로 상용화되어 있다. 과정은 일반적인 Affinity chromatography와 동일하게 단백질을 Intein tag 과 융합시켜 발현하고 Chitin bead에 흘려보내면, 융합단백질은 셀룰로스 결합도메인을 통해 Chitin bead 에 결합하게 된다.

여기서 한가지 다른 친화크로마토그래피와 틀린 점이 있다면, 다른 친화크로마토그래피는 목적단백질을 회수할때 해당 태그에 붙을 수 있는 리간드를 과량으로 넣어주어서 흘려내지만, 이 시스템에서는 목적단백질을 회수할때 Intein의 자가분해 활성을 이용한다는 것임. 즉 워싱이 끝난 후에 25mM DTT가 함유된 버퍼로 버퍼를 갈아준 후 16-24시간동안 내버려둠. 이 시간동안 Intein tag은 자가분해 활성에 의해 목적단백질과 서로 분리되고, 목적단백질은 bead에 더 이상 붙어있지 않으므로 레진에서 나오는 단백질국물을 받아내기만 하면 됨. 참

장점

– 별도의 protease를 이용하여 cleavage를 할 필요가 없음! 따라서 별도의 protease digestion, 안 잘린 것과 protease에서 잘린 넘을 정제하는 과정 등의 잡스러운 과정을 모두 피할 수 있음.

– 일단 chitin affinity를 이용하여 붙이고, self proteolysis를 통해서 끊어져 나온 것을 받아내는 과정에서 레진에 결합하는 대부분의 비특이적 결합은 배제할 수 있음. 따라서 다른 어피니티 태그에 비해서 산출물이 보다 깨끗한 편.

단점

– 상대적으로 tag가 큰 편 (40kDa)

– 목적단백질이 soluble하지 않은 경우 self proteolysis는 일어나지만, 그 상태로 레진에 엉겨서 일루션이 되지 않는 경우가 가끔 있음. 단백질이 저기 있는데 왜 먹지를 못하니


5. FLAG, HA, Myc..

특정한 짧은 아미노산에 특이적으로 반응하는 항체들이 많이 개발되어 있는데, 이들을 에피토프 태그 (Epitope tag)라고 부름. 가령 ” DYKDDDDK” 와 같은 서열에 특이적으로 인식하는 항체가 개발되어 있는데 이것은 FLAG tag 이라고 부름. 이렇게 특정한 짧은 아미노산 서열을 선택적으로 인식하는 항체는 두가지 용도로 쓰이는데,

1. 특정한 태그가 달린 단백질을 검출 : 즉 특정한 단백질에 특이적인 항체가 없는 상황에서도 단백질을 웨스턴 블랏, 혹은 이뮤노스테이닝 등으로 단백질을 검출할 수 있음.

2. 해당하는 항체가 고정화된 비드를 이용하여 해당 단백질을 분리할 수 있음.

여러종류의 에피토프 태그가 개발되어 있는데 많이 사용하는 것으로는 FLAG (DYKDDDK 를 특이적으로 인식), Myc (EQKLISEED), V5 (GKPIPNPLLGLDST), HA (YPYDVPDYA) 가 있음. 만약 단백질 정제에 응용하는 경우 해당하는 tag를 인식하는 항체가 고정화된 비드를 어피니티 비드로 사용하게 된다.

이러한 태그는 매우 특이성이 높은 관계로 동물세포 등과 같이 단백질 발현수준이 낮은 발현시스템에서 단백질을 정제할 때 많이 사용됨. 또한 단백질 정제뿐만 아니라 생체 내에서 해당 단백질과 결합되어 있는 다른 단백질이 어떤 것이 있는지를 보기 위한 Immoprecipitation 등과 같은 실험에도 널리 이용함.

단점이라면? 아무래도 다른 어피니티 레진에 비해서 항체를 이용하는 레진의 경우 가격대가 비싸고, 따라서 다량의 단백질을 정제할때 사용하기는 여러가지 난점이 있다는 것일듯.
물론 이외에 설명하지 않은 어피니티 태그가 있을 수 있겠지만 과감히 무시하고 (답답하면 메이저 어피니티 태그가 되던지)

붙일 때는 붙이지만 자를 때는 잘라내야 하느니라

어피니티 태그를 이용하여 단백질을 거의 원스탭으로 정제를 할때까지는 좋음. 그러나 이제 정제가 된 이상 단백질에 붙어있는 어피니티 태그는 그저 잉여일 뿐. 토사구팽이 웬말이요 물론 태그가 붙어있는 상태에서도 단백질을 사용할 수 있는 상황이라면 상관없지만, 구조를 결정하기 위한 목적으로 단백질을 정제했다든지, 아니면 단백질의 활성이 태그때문에 방해가 된다든지 하는 경우에는 가차없이 태그를 원하는 단백질에서 잘라내야만 한다.

어떻게?

대개 이런 경우를 위해서 목적하는 단백질과 태그 사이에는 특이적인 단백질 분해효소 인식부위를 달아놓기 마련이다. 그렇게 해서 가장 많이 사용되는 단백질 분해효소에는 Thrombin, Factor Xa 등등 여러가지가 있었지만 요즘 대세는 역시 Tobacco etch virus protease, 약칭 TEV Protease이다. 엣지있는 바이러스

Tobacco etch virus는 식물 유래의 바이러스로써 이 지놈에는 바이러스 유래 단백질을 잘라낼 수 있는 분해효소가 들어있는데, 이 단백질 분해효소는 매우 특이적인 인식부위를 가지고, 여기에서 벗어나는 인식부위는 거의 자르지 않는다는 특징을 가지고 있다. 기존에 많이 사용되던 thrombin이나 Factor Xa 등은 어느정도의 서열특이성은 가지고 있지만 이것이 완벽하지 않아서 자칫 자신의 목적단백질 안까지 잘라버리는 일이 많았었다. 그러나 TEV Protease의 경우에는 이런 염려없이 사용가능하다.

친화크로마토그래피를 위해서는 뭔가를 달아야 한다는 편견을 버려!

지금까지는 재조합 단백질을 정제하기 위해서 유전자에 뭔가를 결합시켜 융합단백질을 만드는 것 위주로 설명했다. 그러나 상당수의 단백질들은 생체 내에서 ‘뭔가’ 와 결합하고 있고, 따라서 이러한 단백질마다 고유한 친화도를 가진 물질을 이용하여 친화크로마토그래피를 하는 것 역시 가능하다. 그러나 문제는 “그때그때 다른 단백질” 에 따라서 각기 다른 친화크로마토그래피를 개발하는 것이겠지

가령 IgG 등의 항체의 경우에는 박테리아 유래의 단백질인 Protein G 혹은 Protein A 와 매우 특이적으로 결합하는 성질을 가지고 있는데 이를 이용하여 Protein G 혹은 Protein A가 고정된 비드를 이용하여 혈청 내에서 IgG 등의 항체를 정제하는 것은 매우 일반적인 방법이다.
IgG Heavy Chain에 결합한 Protein AProteinA

Screenshot 2014-07-24 19.15.29
Protein A가 고정된 레진으로 이뮤노글로블린을 혈청에서 원스탭으로 정제

또한 특정한 단백질에 특이적인 항체를 가지고 있을 경우는 이는 이상적인 친화크로마토그래피라고도 할 수 있는데, 이 경우는 항체를 레진에 고정하여 항체가 인식하는 단백질만을 정제할 수 있다. 흔히 많이 사용되는 ‘Immunoprecipitation’ 은 특정한 단백질을 인식하는 항체와 항체와 특이적으로 결합하는 Protein A 등이 고정된 비드를 사용한다. 물론 특정한 단백질에 특이적인 항체를 분리하기 위해서 반대로 특정한 단백질을 고정화하여 항체를 분리할 수도 있고.

단백질 정제는 이것으로 끝?

지금까지 설명한 것처럼 친화크로마토그래피는 오늘날 단백질 정제에 사용되는 테크닉 중 첫손가락에 꼽히는 테크닉이라고 말할 수 있다. 이전에 단백질을 정제하기 위해서 수십 kg 의 조직을 파쇄하여 단백질 국물을 만들고 여기서부터 컬럼에 컬럼에 컬럼을 연속하여 밥도 안먹고 잠도 안자고 단백질을 정제하던 조상님들이 현대의 생물학자들이 간단하게 어피니티 태그를 달아서 원스탭으로 단백질을 정제하는 것을 보면 참 한숨이 나올지도 모른다.

Screenshot 2014-07-24 19.23.14

쪼랩들이 원스탭으로 단백질을 슥슥 정제하는 것을 본 왕년의 생화학자들. 자기네들은 단백질 정제해서 실험 몇가지만 하면 졸업했었음에도 불구하고 요즘 애들이 편하게 일하는 것은 좀 보기 그렇지 응?

사실 요즘 단백질 정제하는 분들의 상당수는 이렇게 친화크로마토그래피 1단계만 가지고도 자신의 용도에 충분히 쓸만한 순도의 단백질을 정제하곤 한다. 그러나 기억해두어야 할 것은 ‘단백질 순도는 용도에 따라서 각각 달라요’ 라는 말이다. 만약 친화크로마토그래피 정도로 충분히 정제된 단백질을 얻지 못한다면? 그때는 이전부터 내려오던 여러가지 단백질 정제 테크닉이 필수적으로 등장해야 한다. 여기에 대해서는 다음 계명에서..

단백질 정제의 십계명 3. 과발현(Overexpression)을 경배하라

단백질 정제의 십계명

1. 단백질은 단백질마다 다 다르니 그들의 특성을 잘 파악할지어다.

2. 폴리펩타이드 결합은 언젠가 끊어질지니 단백질 분해효소에 유의할지어다

그리고 오늘은

3. 과발현(Overexpression)을 경배하라

기원 이전

멀고 먼 옛날 은하계 저편에서 단백질을 처음 정제하고 있을때…까지는 아니고 1960-70년대까지 새로운 단백질을 정제하여 그 특성을 파악하는 것을 연구주제로 삼던 사람들은 (일단 원하는 단백질을 포함하고 있는) 어마어마한 시작물질을 확보하는 것부터 시작했었다.  미생물이라면 수십 리터의 균을 배양하여 수백그램에서 1kg에 달하는 세포양을 확보하는 것은 기본이었고 (1kg 정도의 균체라면 500ml이 들어가는 센돌이 바틀로 두개 정도가 꽉 차있는 양이라고 생각하면 됨) 효모 같은 것이라면 아예 제빵효모를 파는 곳에서 덩어리로 구해오는 것이 보통. 동물 조직에서 정제한다면 역시 도축장 등에 찾아가서 어마어마한 양의 조직을 (보통 kg 단위로) 얻어와서 이것을 파쇄하여 기나긴 정제의 여정을 시작하는 것이 보통이었다.

Screenshot 2014-07-15 21.34.09

 

효모덩어리를 사거나

Screenshot 2014-07-15 22.16.26

대장균이라면 왕창 키워버려 출처

이렇게 해서 수백그램의 단백질로부터 원하는 단백질을 순수정제하기까지 거치는 노력은 지금의 연구자들이 생각하기 힘든 수준이었다 (너무 일이 많아서 실험실에서 키우는 멍멍이의 손을 빌려야 할정도로…뭐 개노가다라고도 하죠 ) . 특히 지놈 시퀀싱 이전에 특정한 유전자를 클로닝하기 위한 방법으로써 일단 단백질로부터 시작하여 단백질을 정제하고, 단백질의 일부 아미노산 서열로부터 프로브를 합성하여 지놈 DNA 라이브러리로부터 클론을 탐색해 나가고…1980년대, 아니 1990년대 초반 정도까지 특정한 단백질을 최초로 순수분리하여 특성을 파악하는 것만으로 웬만한 박사 논문은 충분한 수준이었고, 여기에 덧붙여서 유전자까지 클로닝하였다면 거의 슈퍼맨으로 인정받을 수 있던 시절도 있었다.

그러나 1970년대 이후에 유전자 조작기술이 나와서 대개의 단백질은 과발현 (Overexpression)을 할 수 있게 되었고, 특히 지놈 시퀀싱이 된 이후 원하는 유전자는 간단히 PCR을 이용하여 클로닝하여 발현 벡터에 넣고, 원하는 어피니티 택을 붙여서 발현시킬 수 있게 된 이후부터 단백질 정제는 이전처럼 무한 노동력이 필요한 일은 아니게 되었다. 즉 현 시점에서 대개의 경우 단백질 정제는 일단 원하는 단백질을 과발현시켜서 양을 늘린 다음에 시작하는 것이 기본이 되었다. 이번차에서는 이렇게 단백질 정제에 필수적인 요소가 된 과발현에 대해서 알아보고자 한다.

단백질 발현은 예술.

모든 단백질이 발현벡터에 유전자를 클로닝하고 대장균에 형질전환하면 달덩이 같은 SDS-PAGE 밴드로 떠주었으면 좋겠지만 세상 일이 어찌 그렇게 맘대로 되던가. 게다가 단백질 정제의 십계명의 1번인 “단백질은 그때그때 달라요” 는 단백질 과발현에서부터 적용되는바, 아무 생각없이 전체 ORF 서열을 발현벡터에 클로닝해넣어도 전체 단백질의 절반 이상으로 발현되는 경우도 있는가 하면, 단백질을 얻기 위해 온갖 고생을 다해야 하는 경우가 있다. 다시한번 암송합시다. “단백질은 단백질마다 그때그때 달라요”

따라서  요즘 단백질을 정제할때 ‘그때그때 다른’ 단백질마다 새롭게 정제조건을 확립하는 그 첫번째 단계는 ‘어떻게 하면 우리가 원하는 단백질을 과발현할 수 있는가’ 로 집약될 수 있다. 일단 원하는 단백질이 충분히 과발현될수록 정제의 단계는 좀 더 수월해지고 정제에 필요한 노력을 덜 수 있으며, 여기에 더불어 훨씬 더 순도가 높은 단백질을 얻을 수 있다는 것은 당연한 일.

여기서 생각해 볼 문제들은 다음과 같다.

단백질을 정제해서 무엇을 할 것인가? 항체를 만드는데 필요한 항원을 만들기 위해서 단백질을 정제하는 사람도 있는가 하면, 그 생물학적 활성이 필요한 사람도 있다. 그것도 아니라면 구조정보를 얻기 위해서 결정화할 수 있는 최소단편을 안정적으로 발현하는 것이 목적인 사람도 있다. 아니면 의약품과 같은 용도로 사용되어야 하기 때문에 극미세량의 불순물도 제거되어야 할 필요가 있는 경우도 있다. 일단 이 용도가 확실하게 된 연후에 다음의 고민을 하게 될 것이다.

단백질의 전체가 필요한가? 일부분이 필요한가? 많은 단백질, 특히 진핵생물의 도메인이 여러개 달린 단백질이라면 이것을 발현시키는데 어려움을 겪는 경우가 많이 있다. 이러한 것은 결국 ‘단백질을 어디서 발현할 것인가?” 와 “단백질의 전부 혹은 일부를 발현할 것인가?” 등과의 문제와도 결부되어 있다.

단백질을 네이티브한 형태로 과발현할 것인가? 아니면 퓨전 단백질로 발현할 것인가? 대장균에서 전체 수용성 단백질의 20-30% 정도로 왕창 발현되는 단백질이라면 굳이 퓨전단백질로 발현하지 않아도 그리 어렵지 않게 정제할 수 있을지도 모른다. 그러나 웬만한 경우라면 정제의 용이성을 위하여 GST, His-tag 등과 같은 어피니티 태그를 이용하여 발현할 필요가 있다. 이러한 어피티니 태그의 경우 단백질을 단순히 정제하는 것 뿐만아니라 단백질의 발현정도를 높인다든지, 단백질의 solubility를 높인다든지 등의 보조적인 역할도 한다는 것을 유념해야 한다.

단백질을 어떤 발현계에서 발현할 것인가? 물론 모든 단백질이 대장균과 같은 값싸고 간편한 발현시스템에서 발현되고 그것이 생물학적인 활성을 띄게 된다면 얼마나 좋겠는가만 현실은 그렇지 않다. 때로는 효모, 곤충세포, 동물세포등과 같은 시스템을 이용해야만 자신이 원하는 단백질을 얻을 수 있는 경우는 많다. 반면에 대장균과 같은 간단한 시스템에서도 충분히 발현해서 목적에 맞게 얻을 수 있는 상황에서 곤충세포나 동물세포와 같은 값비싼 발현계를 쓸 필요는 없을 것이다.

여기에 대해서는 각각 독립된 항목으로 다룰 것이므로 오늘은 그닥 오래 다루지는 않는다. 그러나 지금 단계에서 기억해야 할 것은 오늘날 단백질을 정제한다면 일단 이런 것을 유념해서 가능한 많은 양의 단백질의 발현을 어떻게 할것인지를 고민해야 한다는 것이다.

“단백질이 많이 나오는데 몽땅 다 펠렛으로 가요 엉엉엉”

대장균에서 단백질을 발현할때 많은 사람들이 고통을 겪는 것이 단백질 자체는 많이 만들어지는데 대개 불용성 분획으로 가 버리는 것, 소위 말하는 인클루전 바디 (Inclusion Body) 의 형성이다. 이런 것을 어떻게 할 수 있는 방법이 없을까?

일단 이런 방법을 제시하기 이전에 세균 유래의 단백질이 아닌 동물, 식물 유래의 단백질은 일단 대장균과는 다른 환경에서 번역되고 폴딩된다는 것을 알아야 한다. 결국 제대로 된 폴딩이 이루어지지 않는 것이 인클루전 바디의 형성의 원인일진데, 이런 것의 원인에는 여러가지가 있다.

단백질 복합체를 형성하는 경우 : 원래의 세포에서 단일한 단백질로 존재하는 것이 아니라 다른 단백질과 복합체를 형성하는 경우, 하나의 단백질만을, 그것도 대장균과 같은 서로 다른 환경에서 발현한다면 사실 제대로 수용성으로 나오는 것 자체가 힘들 것이다. 반대로 생각한다면 이렇게 다른 단백질과 복합체를 이루는 단백질의 경우 대장균 등의 이질적인 호스트에서 발현하기 위해서는 해당 파트너와 같이 발현하는 것이 필요할 경우가 많다. 여기에 대해서는 나중에 따로 쓸 것이다.

폴딩 환경의 차이 : 진핵생물의 단백질 중에서 생체막을 통과하는 영역이 있는 경우, 혹은 막단백질인 경우에는 거의 대장균에서 제대로 발현하는 것이 힘들 수가 있다. 이런 경우에는 아예 다른 호스트를 선택하거나, extracellular domain 정도만을 파악하는 것이 중요하다.

Disulfide bond가 많이 존재하는 경우 : 대장균과 진핵생물은 산화환원 환경이 틀리고, Disulfide bond가 많이 함유되어 있는 단백질일수록 대장균에서의 발현은 쉽지 않다. 이러한 것을 도와주는 대장균 Host가 몇 가지 나와 있으나, 뭐 역시 케바케.

Posttranslational Modification 이 단백질 폴딩에 필수적인 경우 : 가끔은 당쇄결합, 혹은 인산화 (대장균에는 진핵생물에 많이 존재하는 Serine/Threonine 혹은 Tyrosine Kinase는 거의 없는 반면, 대신 Histidine Kinase가 많이 존재한다) 등이 단백질의 폴딩에 필수적인 경우가 있다. 이런 것은 사실 대장균에서 발현한다면 거의 노답.

Disordered region 등이 많이 존재하는 경우 시퀀스를 아미노산 원레터 코드로 읽어볼때 “프프프프프크프프크크으으으으드드드듣” 하는 소리가 나오는 영역이 가끔 있을 것이다. 이런 부분의 경우 soluble하게 발현되기도 힘들뿐더러 발현된다고 하더라도 극심한 Degradation을 초래한다.

등등 온갖 잡스러운 원인으로 인해서 대장균에서 ‘단백질은 많이 나오는데 전부 불용성으로 가요 엉엉엉’ 하는 분들이 많다. 이런 분들은 다음과 같은 것들을 차근차근 해보기 바란다.

1. 발현 온도를 낮춰본다. 몇도씨까지 알아보고 오셨어요에서 발현을 해보셨음? 섭씨 37도라면 일단 30도, 25도, 18도까지 발현온도를 낮추어 본다. 요즘은 대장균에서 저온에서 최적으로 단백질을 발현하는 시스템도 나와있다. 물론 처음부터 배양을 할때 저온에서 키운다면 세포성장이 너무 느린 관계로 37도 등에서 세포를 어느정도 키운 다음 induction을 할때 온도를 낮추는 것 등을 권장한다. 그러나 본인은 귀찮아서 온도조건 따위는 최적화하지 않고 처음부터 18도에서 induction한다. 경험상 37도에서 불용성으로 가는데 18도에서는 제대로 발현되는 것은 많지만 그 반대는 별로 없거던요 ㅋㅋ

2. 벡터를 바꾸어 본다. 특히 목적단백질을 수용성으로 바꾸어주는데 효험이 있다고 알려진 어피니티 택인 MBP (Maltose Binding Protein)이나 SUMO, trx (thioredoxin A) 태그를 이용해 본다. (GST, His-tag 등은 그닥 solubility에는 큰 영향을 안 주는 경우가 많다)

3. 컨스트럭트의 위치를 바꾸어 본다. 즉 도메인 분석이나 disordered 된 영역의 분석을 통해 ‘잘라낼’ 부분의 위치를 파악하고 정확히 원하는 영역의 단백질만을 발현해 보도록 한다. 여기에 대해서도 나중에 다룰 것임.

4. Binding Partner가 있을 경우 동시발현을 할 수 있을지를 검토해 본다. (역시 나중에..)

5. 가끔은 Chaperon 등을 같이 과발현하면 효과가 있을수도 있다.

6. 시중에는 ‘이 호스트에 넣으면 발현이 안되던 것이 잘 발현되요’ 하고 선전하는 대장균 host 들을 많이 판매하고 있다. 그러나 우리가 단백질 정제의 십계명중 첫번째가 무엇인지를 잘 기억해 보자. “단백질은 그때그때 달라요” 였지? 모든 단백질을 항상 Soluble 하게 발현해 주는 마법의 호스트는 없는 편이다. 그래도 혹시 모르니 한번쯤은 속아보는 것도 나쁘지는 않다.

7. 이래도 안되면 대장균을 포기하고 다른 호스트로 옮겨간다. 효모, 곤충세포, 동물세포 등등..물론 막단백질이라든지 항체라든지 등등 대장균에서 잘 발현되지 않는다고 알려진 클래스의 단백질은 처음부터 다른 호스트부터 시작하는 게 상책이다.

나올 단백질은 어찌했거나 나온다. 안나오는 넘은 안나오지만

어느정도 단백질이 발현된다는 것이 확인된다면, 일단은 정제작업에 들어가는 것이 좋다. 물론 과발현이 된다면 보다 적은 스탭의 정제과정을 거쳐도 좀 더 높은 수율로 많은 양의 단백질을 얻을 수 있다는 장점이 있다. 그렇지만 상업적으로 지속적으로 단백질을 생산할 것이 아닌 연구목적이라면, 이리가든 저리가든 자신의 용도에 필요한 정도의 양과 순도의 단백질만 얻으면 그만. 만약 연구목적으로 일정량의 단백질만 얻으면 되는 상황이라면 충분히 발현이 안되지만 발현은 되긴 된다고 생각한다면, 지나친 최적화 노력을 하는 것보다는 일단 세포의 양을 늘려서 정제를 시도하는 것이 낫다고 생각한다. 상업적으로 단백질을 생산한다면? 뭐 뼈빠지게 최적화 해야죠..뭐 그게 일인데..

발현이 잘 되서 100ml 의 배양만으로 수십 mg 의 단백질을 얻을 수 있는 경우가 있는가하면, 수십 리터를 컬쳐해도 1mg 의 단백질도 얻지 못하는 경우가 있다. 그러나 어찌하겠는가? 다시한번 외쳐보자 ‘단백질은 그때그때 달라요’. 그때는 양을 늘리는 것 이외에는 답이 없다.

산업적인 목적으로 단백질 수율을 개선하려는 목적이 아닌 연구용으로 일정한 양의 단백질만 얻으면 되는 상황이라면 단백질 발현 최적화는 항상 ‘적당한’ 정도로만 하는 것이 좋다고 생각한다. 특히 IPTG의 농도를 변화시킨다든지, Induction 시간을 변화시킨다든지, 호스트 균주를 변화한다든지와 같은 것은 극히 제한적인 성공을 주는데, 여기에 시간을 많이 투자하지는 말길. 차라리 그럴 시간이 있다면 벡터를 바꾸거나, 컨스트럭트를 새롭게 제조하는데 시간을 투자해라.

즉, 일단 단백질이 어느정도 발현된다면 일단 정제를 시도해라. 충분하지 않다고? 양이 해결해줄거다. 저 위에 보여주는 500리터 배양까지는 안해도 되니 쫄지마라.

단백질이 왕창 안나오면 원스텝으로 정제가 안나온다구요? 그런 분들을 위해서 “어피니티 크로마토그래피가 다가 아니느니라” 라는 내용을 또 다룰 것이다.

과발현을 경배하되, 때로는 자연산에 의존해야 할 때도 있으니라

그래서 세상의 모든 단백질이 다 과발현이 될수 있으면 좋으련만, 그렇지 않은 경우가 있고, 아주 가끔은 자연내에도 무궁무진하게 존재하여 자연산만으로 수요를 충족할 수 있는 경우도 있다. 가령 본인이 꽤나 집적거리는 단백질 중에서는 Actin이라는 단백질이 있는데, 이것은 근육의 구성요소. 삼겹살은 액틴맛  근육조직에서 워낙 엄청나게 존재하고, 또한 어느정도 이상의 염농도 (100mM 이상) 에서는 중합되고, 저염 농도에서는 분리되는 특성이 있으므로 컬럼 크로마토그래피를 전혀 쓰지 않고 센돌이 몇 번 돌리는 것만으로도 95% 이상의 순도로 정제 가능하다.

Screenshot 2014-07-15 22.33.57

컬럼 없이 센돌이 만으로 이정도 ㅋ 출처

이런 축복받은(?) 단백질을 연구하지 않는 경우라도 가끔은 아직도 양으로 승부하여 복잡한 단백질 복합체를 정제해야 할 경우가 있는데, 가령 이렇게 6개의 단백질로 구성된 복합체로써 재조합에 의한 발현은 곤란해서 소의 흉선 혹은 대뇌 (약 5mg 의 순수정제된 단백질을 위해서는 소대가리 1개가 필요함 ㅋ) 에서 정제하는 단백질도 있긴 하다.

Screenshot 2014-07-15 22.36.54

Arp2/3 complex

물론 천연소스에서 단백질을 정제하기 위해서는 그야말로 “단백질은 단백질마다 틀려요” 의 그말의 원류대로 단백질의 성질에 따라서 고유한 정제조건, 대개는 어피니티 크로마토그래피와 같은 치트키 수준의 프로토콜에 의존하지 않고 이온교환, 젤여과 크로마토그래피등과 같은 정통적인 방법에 의존해야 할 필요가 있다. 애들은 가라 

어쨌든 전통적인 방식으로 단백질을 정제하기 위해서는 (혹시 그래야 할 필요가 있다면) 제일 먼저 유념해야 할 것은 “충분한 시작물량 확보” 일 것이다.

결국은 물량 확보

결국 이전의 자연산 단백질을 정제할때나 단백질을 과발현할때나 단백질 정제의 준비에 필요한 제 1단계는 언제나 동일하다. 즉 ‘목적하는 단백질의 물량 확보’. 즉 자연산처럼 원래 조직에 그닥 많이 없는 경우에는 대신 ‘단백질이 들어있는 원재료’ 의 물량을 증가시켜서 목적하는 단백질을 늘리고, 과발현은 ‘단백질이 들어있는 원재료’ 내에서 원하는 단백질의 양을 늘리는 정도의 차이랄까? 즉, 단백질을 정제하기 위해서는 “원하는 단백질”부터 많이 확보하고 봐야한다는 것은 예나 지금이나 단백질 정제의 첫 단계에서 유념해야 할 사항이다.

그러니까 빨리 셀이나 더 컬쳐하라고..싫으면 벡터나 하나 더 만들거나

단백질 정제의 십계명 2. 폴리펩타이드 결합은 언젠가는 끊어질지니 단백질 분해효소에 유의할지어다

단백질 정제의 십계명

1. 단백질은 단백질마다 다 다르니 그들의 특성을 잘 파악할지어다.

그리고 오늘 알아볼 이야기는 이것이다.

2. 폴리펩타이드 결합은 언젠가는 끊어질지니 단백질 분해효소에 유의할지어다.

약한 존재, 그대는 단백질

DNA를 가지고 실험해 본 사람이라면 누구나 느낀 것이지만, 이 물질 참 튼튼하다. 상온에 며칠 쳐박아도 (DNA를 아주 개판으로 뽑지 않은 이상) DNA는 안정한 편이며, 심지어 몇만년 전에 죽은 맘모스라든지 네안데르탈인과 같은 시료에서도 DNA를 추출하여 (물론 PCR이라는 치트키가 있긴 하지만) 시퀀스를 확인하니 말이다.

그러나 단백질은 그렇지 않느니라.

그런데 지금 님은 단백질을 정제한답시고 여기 와 있는데 웬 DNA 타령. DNA 는 잊어! 잊어! 잊으라고.

세포내에서도 단백질이라는 것은 필요할 때 만들어졌다가 필요가 없어지면 잽싸게 분해되는 ( 들어봤나 유비퀴틴-프로테오솜?) 존재인데, 단백질을 분리정제하기 위해서 세포를 파쇄해서 조효소액 (Crude Extract)을 만들어 놓은 순간은 우리가 정제하려고 하는 단백질에게 있어서 가장 위험한 순간이다. 즉 세포안에 존재하는 단백질 분해효소들이 세포가 깨지기 전에는 억지로 잡아놓았다면 세포가 깨진 후에는 단백질을 분해하려고 늑대떼처럼 달려드는 광경을 생각하면 될 것이다. 결국 단백질 정제라는 것은 연약한 목적단백질을 단백질 분해효소라는 마수로부터 어떻게 빨리 구조하여 원하는 단백질만을 회수하는 일이라고 해도 과언이 아니다.

그러면 어떻게 하나? 단백질 분해를 최소화할 수 있는 방법은 없을까?

“저…Protease inhibitor 넣었는데요'”

이런 거 넣어도 모든 단백질 분해효소를 방어하는 것은 불가능하다. 유일한 살길은 가장 빨리 일차단계의 정제를 거쳐서 대부분의 단백질 분해효소와 목적하는 단백질을 분리해내는 길이다.

흔히들 실험을 꼼꼼하게 한다고 1 리터 버퍼를 만들때 0.1ml의 오차도 없이 만들려고 한다든지 시간을 끄는 사람들을 보는데, 일단 단백질을 정제하기 위해서 세포를 파쇄한 다음에는 진짜로 서둘러야 한다. 어느정도로 서둘러야 하냐면, 자신의 자식이 물에 빠져서 의식을 잃은 상태에서 골든타임 내에 인공호흡을 시켜야 할 때 서둘러야 하는 정도? 특히 불안정한 단백질의 경우에는 이 외에 다른 방법이 없다. 가장 빨리 첫번째 단계의 정제과정을 거쳐서 조효소액에 들어있는 대부분의 단백질 분해효소로부터 목적단백질을 건져내야 한다. 조금 부정확해도 시간을 최대로 단축하여 일차 정제과정에 들어가는 것이 좋다. 세포를 깬 다음에는 눈썹이 휘날리도록 빨리 실험진행을 한다.
(세포를 파쇄한 후 오버나잇을 하거나 이런 경우라면 그냥 노답. -.-;;;)

또 하나 정제 단계를 거치면 거칠수록 단백질이 분해될 가능성이 많으므로 정제 단계를 어느정도 거친 이후에는 더이상 단계를 거치지 않는 것도 한가지 방법이다. 잡밴드 한두개를 제거하려고 컬럼을 걸었더니 밴드가 늘어나는 창조경제(?) 의 형국을 걷게 되는 것도 종종 있는 일. (참고로 그 ‘잡밴드’ 는 당신이 정제하는 단백질이 분해된 산물일 가능성이 높다.)

결국 정제된 단백질의 장기 보관을 위해서는 Glycerol 등과 같은 안정제가 혼합된 버퍼를 이용하여 -20도 혹은 -80 도와 같은 저온(단백질 분해효소의 활성이 완전히 억제되는) 에 보관하는 것 이외에는 답이 없다. (제한효소와 같은 ‘단백질’ 을 어떻게 보관하는지를 잘 기억할 것) 어쨌든 당신이 다루는 단백질이 수용액 상에 녹아 있고, 빙점 이상의 온도에 있다면 이 단백질은 언젠가는 분해된다고 간주하는 것이 좋다.
EDTA, PMSF, Protease inhibitor cocktail…

물론 단백질 분해효소의 악명은 단백질을 정제하는 사람들이라면 다 알고 있기에, 이를 최소화하기 위해서 여러가지 성분들이 버퍼에 들어간다. 가령 많은 단백질 분해효소의 필수요소인 2가 양이온을 chelating 하는 EDTA라든지, Serine Protease 를 불활성시키는 PMSF 라든지, 아니면 각종 Protease inhibitor cocktail 이 혼합된 칵테일이라든지..

그러나 중요한 것은 이런 것이 완벽히 모든 단백질 분해효소를 저해하기는 힘들다는 것이다. 심지어 완전히 정제된 단백질에 이러한 Protease inhibitor cocktail 이 들어가 있는 버퍼에서도 분해될 넘들은 분해된다. 내려갈 팀은 내려가는게 아니라 분해될 단백질은 분해된다

게다가 이러한 단백질 분해효소 저해제들중 몇 가지는 항상 모든 단백질의 정제과정에 이용될 수 없다는 단점도 있다. 가령 EDTA가 함유된 버퍼로 His tag 이 달린 단백질을 정제하기 위해서 Ni-NTA 컬럼에 로딩한다면 참으로 안좋은 꼴을 보게 될거다. (따라하지마라. EDTA는 니켈을 Chelating 하므로 컬럼에 충진되어 있는 니켈이 깔끔하게 컬럼에서 빠져나간다.)

즉, 단백질 분해효소를 저해하는 여러가지 인자들을 잘 챙겨넣되, 이들을 너무 과신하면 안된다는 이야기.

분해될 단백질은 분해된다. Don’t Panic.

이렇게 Protease inhibitor를 때려넣고, 조심스럽게 저온에서 가능한 빠른 속도로 단백질을 정제하려고 해 보아도 단백질이 분해되는 것을 피할 수 없는 경우가 있다. 그럴 경우에는 어떻게 하나.

“가게 두어라”
“….넵?”

지금까지 “단백질 분해효소 ㄷㄷㄷ 단백질이 분해되면 너 그냥 ..되는거야” 하다가 어쩌라구.. 라고 생각할지 모르겠지만 단백질을 정제하다 보면 어떤 단백질들은 분해되는 것을 피하는 것이 거의 불가능한 경우가 있다. 단백질에는 폴딩되어 있어서 비교적 단백질 분해에 저항성을 가지고 있는 부분이 있는 반면, 무정형으로 흐느적거려서 거의 단백질 분해효소에게는 맛난 브런치처럼 노출되어 있는 부분이 있을 수 밖에 없다. 특히 진핵생물 유래의 멀티도메인 단백질에는 이렇게 단백질분해에 취약한 영역이 반드시 존재한다.

이렇게 어떤 안간힘을 써도 정제 도중에 단백질이 분해되는 경우에는 과연 단백질을 왜 정제하는지 그 이유부터 생각해보자. 결정을 만들어 구조를 결정한다? 이 경우에는 어차피 이렇게 단백질 분해에 취약한 영역은 구조로 보이지 않으며, 많은 경우 결정 성장을 막는다. 그렇다면 이런 부분은 과감하게 제거하고 다시 컨스트럭트를 제조하는 것이 정답.

그리고 구조생물학 목적이 아니더라도 단백질의 N 혹은 C말단에 존재하는 흐느적거리는 부분은 대개의 경우 가수분해를 피할 수 없는 경우가 많으며, 상당수의 경우 이를 제거하더라도 목적하는 용도에 크게 영향을 미치지 않을 수 있다. 그땐 과감히 잘라버려라. 또한 여러개의 도메인으로 구성된 단백질의 경우 단일한 단백질을 정제하는 것은 단백질 분해와 같은 문제로 어려울 경우, 잘 분해되지 않는 부분만을 파악하여 이 부분만을 발현정제하는 것도 하나의 방법이다.

단백질 가수분해에 취약한 부분을 없애버리는 것은 구조생물학 (특히 단백질 결정학) 에서는 흔히 사용되는 테크닉이다. 심지어 결정이 제대로 만들어지지 않는 경우에는 인위적으로 단백질에 미량의 단백질 분해효소를 첨가하여 결정화를 방해하는 흐느적거리는 부분을 제거하는 테크닉도 존재한다. 단백질 결정학을 하는 사람들 사이에서는 “몇 년 동안 특정 단백질을 결정화하려고 했는데 결국 안되서 랩을 그만둘려고 결정하고 자신이 세팅한 크리스탈 플레이트를 청소하다가 결정이 생긴 것을 발견해서 이거가지고 구조풀어서 네이처 냈다” 와 같은 도시전설이 존재하는데, 이런 일이 생기는 이유라면 원래 단백질 중에 존재하는 흐느적거리는 부분이 단백질 결정화를 방해하다가 크리스탈 드롭 사이에 포함되어 있는 미량의 단백질 분해효소에 의해서 이런 부분이 제거된 이후에야 결정이 만들어졌을 가능성이 많다.

여튼 기억할 것은 최대한 단백질 분해를 피해서 정제를 하되, 어떤 짓을 해도 단백질 가수분해를 피할 수 없을 경우에는 ‘가게 두어라’. 쓰레기통이 굶주렸다

앞뒤로 붙이는 어피티니 태그를 이용한 단백질 낚시

그러나 무슨 수를 써서라도 툭 건드리면 부서져 버리는 단백질을 온전하게 정제하고 싶을 때에는 어떻게 하나. 일단 앞에서 쓴 것처럼 여러가지 단백질 분해효소 저해제를 왕창 때려넣고, 눈썹이 휘날리도록 빨리 진행해도 정제가 끝날때면 단백질은 예쁘게 두 조각이 나 있다면? 이때 사용할 수 있는 트릭 중의 하나로 N말단과 C말단에 서로 상이한 어피니티 태그를 붙이는 것이다.

이렇게 양쪽에 서로 다른 어피니티 태그 (예 :  N 말단에 GST, C말단에 His-tag)를 붙인다. 개중에는 앞쪽이 잘린 넘, 뒤쪽이 잘린 넘이 있겠지만 온전하게 양말단에 태그를 가지고 있는 넘들도 존재할 것이다.  Slide1

처음 N말단에 붙은 태그를 인식하는 어피니티로 정제를 한 후,

Slide2

이제 두번째로 정제!

Slide3

 완전히 흐느적거리는 단백질을 정제할 때

가끔은 완전히 구조가 없는 단백질, 업자용어로 Instrinscally disordered protein (개흐느적흐느적단백질) 이라고 불리는 단백질을 발현 정제해야 할 떄가 있다. 그런데 이런 단백질은 거의 단백질 분해효소에게는 간식거리지 ㅋ 어마어마하게 빨리 가수분해가 될 때가 많다. 그리고 어느정도 정제가 된 다음에도 가수분해가 점점 진행되는 경우가 많다. 이런 단백질을 정제하는 비법은?

제대로 된 폴딩을 이루지 못하는 단백질이라는 이야기는 반대로 대개의 모든 단백질이 폴딩을 못하는 조건 (6M Urea 와 같은) 이든 그렇지 않은 조건이든 비슷하다는 이야기다. 그런 경우에는 단백질 분해효소와 같은 다른 단백질들은 제대로 활동 못하는 조건에서 정제를 하는 경우가 좋겠지? 이런 단백질의 경우에는 Denaturation 조건 (6M Urea 등) 에서 정제를 하는 것이 좋다. 가령 His-tag 과 같은 경우에는 6M Urea 조건 등에서도 작동하고, 어차피 이 단백질은 Denaturation 되는 조건이건 다른 조건이건 마찬가지로 흐느적거리겠지. 그러나 대개의 단백질 분해효소는 이러한 조건에서는 불활성화되므로 가수분해를 최소화할 수 있다.

그리고 이러한 단백질의 경우에는 Reverse Phase Chromatography와 같이 acetonitrile 과 같은 유기용매로 단백질의 hydrophobicity에 의해서 단백질(펩타이드)를 분리하는 컬럼을 이용하면 중간에 생긴 degradation product를 꽤 좋은 해상도로 분별해 낼 수 있다.

오늘의 이야기를 요약해 보자.

1. 단백질 분해효소는 단백질 정제의 최대의 적. 단백질 분해효소를 주깁시다

2. 제일 좋은 것은 목적하는 단백질이 분해되기 전에 단백질 분해효소로부터 원하는 단백질을 분리해 내는 것이다.  빨리빨리는 단백질 정제의 미덕 그러니 밥도 먹지말고 빨리 정제를 하라고!

3. 도저히 분해를 피할 수 없을 때는 차라리 분해가 안되는 부분만 오려내서 그것만 정제한다. 가게 두어라

단백질 정제의 십계명. 1. 단백질은 단백질마다 다 다르니 그들의 특성을 잘 파악할지어다.

한때는 세포 내에 존재하는 새로운 단백질을 순수정제하고 이것의 특성을 파악하는 것이 생명과학의 가장 최첨단인 연구방법이던 시기가 있었다. 그러나 그런 시대는 이전에 가 버렸다. 미안 콘버그 영감님

Image

영감님의 단백질 정제 테이블..이제 아무도 기억하지 못하긔

그럼에도 불구하고 단백질을 순수 정제하는 것은 긴요한 테크닉이며, 특히 단백질의 구조를 규명한다든지, 단분자 생화학/생물물리학등의 최신 테크닉으로 단백질의 특성을 연구할때는 여전히 필수적이다. 그러나 단백질 정제를 해야하는 뉴비 연구자들에게 단백질 정제가 DNA 혹은 RNA 같은것처럼 “그저 키트만 사서 따라하면” 되는 것이 아니라는 것은 크나큰 스트레스로 다가온다.

옛날에 생화학으로 DNA 복제의 거의 모든 스텝을 규명한 아서 콘버그 (Arthur Konberg)라는 영감님은 “효소학의 십계명” (Ten commandments of enzymology) 이라는 에세이에서 이제는 유행에서 웬지 뒤쳐져가는 것 같은 단백질/효소를 연구할 때 우리가 잊지 말아야 하는 것들을 나열한 바 있다. 물론 콘버그 영감님에 비하면 일개 찌그레기에 불과한 본인이 어찌 N모상 세습수상의 위엄을 자랑하는 콘버그 영감님의 흉내를 내는 것은 천부당 만부당이긴 하지만 영감님 가셨으니까 상관없지 그저 단백질을 아직도 만들어야 하는 저랩 뉴비 연구자들에게 약간이나마 보탬이 되도록 “단백질 정제의 십계명” 이라는 이름으로 한번에 한가지씩 적어보고자 한다.

그 첫번째 계명.

1. 단백질은 단백질마다 다 다르니, 그들의 특성을 잘 파악할지어다

 

단백질은 그때 그때 틀려요

디엔에이나 알엔에이 같은 핵산쪼가리 -.- 나 가지고 놀던 뉴비들이 단백질이라는 것을 한번 만들어 볼까 할때 가장 먼저 닥치게 되는 것은 이런 것이다.

아그 A
“DNA나 RNA는 키트로 슥 뽑으면 되잖아여. 근데 단백질은 그런게 있나요?”

MadScientst
“없음 ㅋ”

아그 B
“왜요?”

MadScientist
“단백질은 그때그때 다 다르니까”

아그 A & B
“(뭔말이래)….??????”

단백질은 다 그때그때 다 다르다!가 단백질을 정제하고자 하는 사람이 제일 먼저 유념해야 하는 사항이다. 괜히 십계명의 첫번째로 넣은 것이 아니다.

(여기서 ‘그때그때 다 다르다’ 의 의미를 잘 새겨봐야 하는데, 동일한 종류의 단백질이 오늘 실험할때와 내일 실험할때가 다르다는 이야기가 아니라, 오늘 단백질 A 를 실험할 때와 내일 단백질 B 를 실험하는 것은 전혀 새로운 상황이라는 것이다. ㅇㅋ? )

여기에 대해서 조금 자세히 알아보자. DNA나 RNA와 같은 다른 생체고분자는 DNA나 RNA의 서열에 따라서 물리적 특성이 틀려지는 경우가 그다지 없다. (물론 CG Content가 심각하게 틀리다든가 하는 경우라면 약간씩 틀려질 수 있어도) 따라서 물리화학적인 방법에 의해서 DNA 혹은 RNA 를 분리한다든지 할때 유전자에 따라서, 심지어는 기관이나 종에 따라서 틀려질 것은 그닥 없다. 따라서 솔루션 1 을 넣고, 솔루션 2 를 넣고 따라하면 지나가는 초딩도 만들 수 있는게 DNA/RNA인 것이며, 온갖 잡생물에 대한 지놈 시퀀싱 프로젝트가 이루어지며, 이제는 하루이틀이면 웬만한 개별 생물의 지놈시퀀스를 뽑아낼 수 있는 이유가 “DNA나 RNA는 내용물과는 상관없이 언제나 다 비슷해요” 라는 사실 때문이다.

그럼 단백질은? 그건 핵산쪼가리 이야기고 ㅋㅋㅋ   단백질은 아니란다

pink

디엔에이나 가지고 놀다가 온 뉴비를 갈구는 단백질생화학자들

일단 우리가 ‘단백질’ 이라고 총칭하는 것들이 얼마나 다양한 모양과 크기를 가지고 있는지부터 한번 봐라!

Screenshot 2014-07-01 22.54.28링크
크기와 모양뿐이랴? 이렇게 각각 틀린 단백질은 그 물리적 성질이 다 틀리다. 매사에 항상 긍정적인 넘 (이런 넘들은 Anion exchange chromatography에 잘 붙는다 ㅋ) 이 있는가 하면 부정적인 넘 (이런 넘은 역시 Positive charge를 띈 cation exchange에 붙고) 이 있기도 하다. 어떤 넘들은 생체막에서만 제대로 존재하고 수용액 상에서는 제대로 존재하지 않는 넘들도 허다하다. 항상 자기 짝궁이 있지 않으면 제대로 존재할 수 없는 넘이 있는가 하면 그런것 개의치 않는 넘들도 많다. 온도가 슬며시 상온(섭씨 20도) 을 넘어가면 못 버티고 헬렐레하는 넘들이 있는가 하면 온도가 90도가 넘어도 거뜬히 자기 일을 하는 넘들도 존재한다 (PCR이라고 들어봤나?). 빛을 받으면 형광을 내는 넘이 있는가하면 ATP를 넣으면 빛을 만들어내는 넘도 있다. 암튼 단백질은 그때그때 다 틀리다.

그러므로 단백질을 가지고 하는 제일 첫 단계인 단백질 정제를 잘 하기 위해서 알아야 하는 첫번째는 “단백질은 다 그때그때 틀리며 각각 다른 단백질을 정제하기 위해서는 별도의 실험법을 너님이 개발해야 한다” 라는 것이다.

“어머 이게 웬 소리여~ 키트없이는 우린 실험 못해여” 하는 뉴비님들. 단백질 동네에 오신 걸 환영한다. 이게 이 동네의 법칙이다.

비단 정제뿐이랴? 단백질을 가지고 하는 모든 실험의 경우 그 단백질을 연구한 사람이 당신이 최초인 경우 그 방법을 만드는 것은 온전히 당신의 일이다. 가령 단백질 구조를 풀기 위해서 만들어야 하는 단백질 결정을 생각해보자. 특정한 단백질 결정이 만들어지는 조건을 찾고, 그 조건을 최적화하여 X선 회절을 하는 결정을 만드는 것 등등 단백질 하나하나마다 처음부터 그 실험법을 님이 만들어야 한다는 것이다. 야모 아저씨가 찾아낸 4개의 유전자만 발현시키면 줄기세포 나와요~ 하시던 동네에서 오신 분들이라면 참으로 새롭게 느껴질 이야기겠지만 원래 단백질을 가지고 일하는 사람들은 이것을 숙명으로 받아들인다. 원래 단백질은 그때그때 틀리니까.

왜 각종 생물의 DNA나 RNA 서열은 거의 다 규명되었지만 생물이 가진 단백질 구조는 제대로 다 규명되지 않았냐, 이것도 그냥 돈 확 들여서 생물에 존재하는 모든 단백질의 구조를 파악해버리면 쉽지 않겠냐? 이미 해봤다. 그리고 처절히 실패했다. 결국 단백질 구조를 푸는 것과 같이 단백질을 가지고 일하는 것은 ‘그때 그때 다 다른’ 조건을 잡고, 단백질 하나하나마다 처음부터 연구를 해야 하는 것이 정도이고, 지놈 프로젝트와 같은 ‘치트키’ 는 없다라는 것이 수많은 돈을 쓰고 얻은 결론인 것이다. 원래 다 그러하느니라.

론 재조합 단백질 (뒤에서 다룰 것이다) 기술에 의해서 단백질을 우리 멋대로 바꿀 수 있다는 것에 의해서 단백질 정제에 한해서는 어느정도 공통적으로 사용할 수 있는 테크닉들이 개발된 것이 사실이다. 그러나 이런 것을 다 감안하더라도 단백질을 할 때 항상 생각해야 하는 사실은 ‘단백질은 그때 그때 달라요‘ 이다. (지겹다 이제 ㅋ)

그나마 다행인 것은 일단 특정한 단백질이 해피하게 세포 외에서 어울릴 수 있는 조건을 파악했다면, 그 환경하에서는 같은 단백질은 ‘그때그때 다르지는 않고’ 대개는 비슷하게 행동하며, 재현성있게 행동한다는 것도 잊어서는 안된다. 사실 이런 것이 가능하지 않았더라면 우리가 DNA 자르고 붙이고, 미량의 시료에서 DNA를 증폭해내는 PCR와 같은 것, 혹은 임신진단키트로 임신이 되었는지 안 되었는지의 여부를 아는 것 등등 단백질을 가지고 할 수 있는 수많은 것들이 가능하지 않았을 것이다. 단백질마다 성질은 틀리지만,  특정한 단백질을 다룰 수 있는 조건이 확립된 순간, 그 단백질은 당신의 뜻대로 세포 외에서 작동할 것이며, 그 조건을 찾는 것이 단백질을 다루는 당신의 할 일이다.

 

서로 다른 단백질들의 개성을 잘 파악할지어다

그렇다면 우리가 특정한 단백질을 가지고 일을 하기 위해서 먼저 정제를 한다고 할때, 제일 먼저 해야 할 일은 무엇일까? 당연하겠지만 그 단백질에 대해서 알려진 모든 정보를 파악하는 것. ‘그때 그때 성질이 다른 단백질’ 의 성질에 대해서 얼마나 정보를 가지느냐에 따라서 너님의 삽질양이 줄어든다.

생물의 종류에 따라서 틀리고, 단백질의 종류에 따라서 제각각이지만, 비슷한 단백질은 어느정도 비슷한 성질을 공유한다. 지금 건드리는 단백질이 세상에서 당신만이 처음 연구하기 시작한 단백질이 아니라면 누군가는 그 단백질을 가지고 각종 삽질을 이미 했다. 일단 그런 것들을 찾는게 급선무다.

어떻게?

Screenshot 2014-07-01 23.03.19펍메드. 굳이 말해야 되냐

그리고 대개의 단백질 관련한 실험법은 요기에 잘 나와있다.

Screenshot 2014-07-01 23.05.01

Method in Enzymology  (온라인을 구독할 수 없으면 도서관 저널 서고 가봐라. 꽤 많이 있을거다)

그 다음에는? 물론 이미 연구된 단백질과 유사한 단백질이면 좋겠지만 그렇지 않은 경우는 어떻게 하나. 걍 맨붕? 이럴때 쓰라고 여러가지 예측툴들이 나와 있다. 단백질의 2차 구조/3차 구조에서부터 어디가 단백질 내에서 흐느적거리는 부분이예요? 혹은 어디가 항체로써 제일 잘 작용할 것 같나요? 까지 다양하겠지만 일단 단백질의 가장 기본적인 호구조사 (분자량, 수용액 상에서의 isoelectric point, 정제된 단백질의 흡광도) 를 하기 위해서는 다음 사이트를 이용해 본다.

Screenshot 2014-07-01 23.07.36

Protparam

단백질의 시퀀스가 얼마나 비슷한 것인지를 파악하는 상동성 분석은 단백질의 기능을 파악하는데 매우 중요한 툴이다. (물론 단백질이 뭐 하는 넘인지 단지 상동성분석만으로 때려잡는게 얼마나 위험한 일인가에 대해서도 이 시리즈 중반에 다룰 생각이긴 하나…일단 기본은 기본이다)

Screenshot 2014-07-01 23.09.06

BLAST. 설명이 필요韓紙?

진핵생물 유래의 단백질이라면 대개 하나의 폴리펩타이드 체인은 여러가지 각각의 기능을 가진 도메인으로 구성되어 있다. 그냥 BLAST 만 돌려봐도 도메인 구조가 나오지만, 이러한 도메인을 제일 잘 파악할 수 있는 곳은 PFAM 이다. 만약 기존에 알려진 도메인과 크게 상동성은 없지만 뭔가 비슷한 다른 도메인이 있을 것 같다면? hhpred 라는 것을 돌려보자.

단백질 3차 구조를 예측하는 것의 정확도는 어느정도 상동성이 있는 단백질의 구조가 풀려 있지 않는한 그리 높지는 않지만 단백질 2차 구조, 즉 alpha-helix냐, beta-sheet냐와 같은 정보는 거의 80% 정도의 정확도로 예측할 수 있다. Jpred 와 같은 서버를 이용하자.

앞에서 말했듯이 어느정도 상동성이 있는 단백질의 구조가 풀려 있다면 우리는 대략적인 단백질의 3차 구조를 예측할 수 있다. (물론 여기서 ‘대략적’ 이라는 의미를 잘 파악해야 한다. 용도에 따라서 ‘대략적인’ 구조를 아는 것만으로 충분할 수 있지만 아주 정밀한 구조를 알아야 하는 경우도 있으니까) 역시 hhpred 가 정답.

이러한 생물정보학적인 툴에 대한 자세한 설명은 생략한다. 지금은 단백질 정제의 십계명 중 제 1장을 공부하는 시간이지 생물정보학 시간이 아니다. ㅠ.ㅠ

Screenshot 2014-07-01 23.13.27

여튼 명심해라. “단백질은 그때그때 다르고, 노가다를 덜 하려면 그 단백질에 대한 뒷조사를 잘 해야 하느니라” 가 첫번째 계율이다.

P.S. 두번째 계율은? 하나씩 쓸테니 궁금하면 기다려라! 단백질 정제의 0번째 계명은 인내이니라.옛날 본인의 지도교수님이 그러셨지. “단백질 정제는 밥도 먹지 말고 해야 한다구욧!”