단백질 구조 겹치기 (Structural Superposition) – 전편

단백질은 왜겹침?

Q: 여러종류의 단백질/DNA의 서열을 비교하려면 어떻게 하나요?
A: 시퀀스 얼라이먼트를 합니다 고갱님.

Q: 그렇다면 이미 구조가 풀린 단백질이 서로 어떻게 다른가 비교하려면 어떻게 하나요?
A: ……그냥 눈으로 잘 비교하세염

……눈으로 잘 비교하는 것은 그렇다치는데, 일단 비교를 하기 위해서는 동일한 조건에서 비교를 해야 하고, 제일 좋은 방법은 두개를 가장 최적으로 중첩시켜서 비교하는 것이다.

Image

가령 이런 넘과 (GFP, PDB 1EMA)Image
이런 넘 (mCherry, 2H5Q)은 척봐도 비슷하고 이걸 겹쳐보면
Image
이렇게 전체적인 맥주통 모양의 구조가 매우 유사하다는 것을 알 수 있지만, 이렇게 틀린 부분이 있다는 것을 알 수 있는데
Image
초록색 내냐 체리색 내냐를 결정하는 Fluorophore의 차이
Image
이런 넘(PDB:1GZN)과
Image
이런 넘 (PDB:1W84) 은 그닥 개별적으로 놓고 보면 별로 닮아보이지 않지만, 이 구조를 중첩시켜 보면,
Image
확실히 전체적으로 닮았고, 닮은 부분과 닮지 않은 부분이 어디인지가 확실히 나온다.

알다시피 단백질의 구조는 단백질의 서열에 비해서 변하는 속도가 느리기 때문에 서열비교로만으로는 상동성이 없다고 생각하는 단백질의 경우에도 구조를 비교해보면 놀라울만큼 유사한 구조를 보이는 경우가 자주 있다. 가령

>1FHW:A|PDBID|CHAIN|SEQUENCE
MNPDREGWLLKLGGRVKTWKRRWFILTDNCLYYFEYTTDKEPRGIIPLENLSIREVEDPRKPNCFELYNPSHKGQVIKACKTEADGRVVEGNHVVYRISAPSPEEKEEWMKSIKASISRDPFYDMLATR

이런 시퀀스하고

>3HIE:A|PDBID|CHAIN|SEQUENCE
SSQTSNFLAEQYERDRKAIINCCFSRPDHKTGEPPNNYITHVRIIEDSKFPSSRPPPDSKLENKKKRLLILSAKPNNAKL
IQIHKARENSDGSFQIGRTWQLTELVRVEKDLEISEGFILTMSKKYYWETNSAKERTVFIKSLITLYIQTFEGHVPELVN
WDLSLFYLDER

를 단순 아미노산 서열만 고려해서 align을 한다치면

#=======================================
#
# Aligned_sequences: 2
# 1: EMBOSS_001
# 2: EMBOSS_001
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 67
# Identity:      18/67 (26.9%)
# Similarity:    26/67 (38.8%)
# Gaps:          12/67 (17.9%)
# Score: 40.0
# 
#
#=======================================

EMBOSS_001        10 EQYERDRKA-IINCCFSRPDHKTGEPPNNYITHVRIIEDSKFPSSRPPPD     58
                     |.|....|. :|..|.:..|.:..|  .|::.: ||        |.|.|:
EMBOSS_001        66 ELYNPSHKGQVIKACKTEADGRVVE--GNHVVY-RI--------SAPSPE    104

EMBOSS_001        59 SKLENKKKRLLILSAKP     75
                     .|.|..|.....:|..|
EMBOSS_001       105 EKEEWMKSIKASISRDP    121


#---------------------------------------
#---------------------------------------

음 이 두개가 비슷한 단백질이라구? ㅋㅋㅋ구라즐ㅋㅋㅋㅋ 하는 반응이 보일수도 있겠으나, 구조를 비교해보면

거의 유사한 fold를 가진 단백질이고 유사한 기능(Phospholipid binding)을 수행한다는 것이 결국 확인되었다.

즉, 단순한 시퀀스 비교로만으로는 이해하기 힘든 단백질의 기능을 파악하기 위해서는 구조를 비교하는 것이 좋으며, 구조를 비교하려면 일단 단백질 구조를 동일한 선상에서 비교할 수 있도록 구조를 겹치는 (Superposition)작업을 해야한다 하는 이야기.

그래서 어떻게 하냐구..

단백질 몇 개의 구조를 서로 비교하는데는 PyMol과 같은 단백질 구조 비쥬얼라이제이션 프로그램에 있는 Structure Superposition 기능을 쓰면 좋다. 리빙포인트

가령 앞에서 예로 보여준 GFP와 mCherry구조를 PDB에서 불러서 PyMol로 띄워보면
알바야 맥주통 정렬해라 거의 유사한 구조라고 해도 이렇게 임의의 위치 (결정구조에서 실제 단백질 체인이 위치하는 위치이므로 ‘임의’라고 하면 좀 어폐가 있지만) 에 존재하기 때문에 두개의 구조를 거의 유사한 위치에 정렬해야 비교가 가능하다. 이걸 하려면 명령어 라인에서

align 2H5Q, 1EMA

을 치면


간단하게 정렬가능하다. 참 쉽져? 여기서 2H5Q는 움직일 넘, 1EMA는 기준이 되는 넘

그러나 앞에서 예로 보여준 아미노산 서열기준으로 그닥 상동성이 높지 않은 경우라면

align 3HIE, 1FHW


아까와는 달리 그닥 겹쳐지는 것이 부실하다. ;;; 왜그런가? 그 이유는 Pymol의 명령어인 align의 경우에는 구조에 기반한 align을 하는 것이 아니라 아미노산 서열 기준의 align을 수행하고, 단백질의 서열이 같은 두 단백질이거나 서열 상동성이 있는 경우에는 꽤 잘 맞추지만, 이렇게 서열 상동성은 낮은 경우에는 제대로 구조 superposition이 되지 않기 때문이다. 따라서 이런 경우에는 align 명령어를 사용하는 것은 좋지 않다. 따라서 이를 위해서는 다른 방법을 사용해야 한다.

cealign
cealign 은 PyMol 1.3 버전부터는 정식 명령어로 추가되었지만, 이전 버전에서는 플러그인으로만 제공되는 기능으로써, 자세한 설명은 아래 링크를 참조하기 바란다.

CEALIGN (PymolWiki)

이 기능은 아까와 같이 서열 상동성은 매우 낮지만 구조적으로 유사한 두개의 단백질을 순전히 구조정보만 가지고 align을 하는데 유용하게 사용된다. PyMol 최신 버전이거나 위 링크의 방법대로 플러그인을 설치했다면

cealign MASTER, TARGET

기준이 되는 넘을 앞에, 움직일 넘을 뒤에 (align 명령과 반대이다) 써서 두개의 alignment를 다시 수행하면

cealign 1FHW, 3HIE

이제 잘 겹쳐진다. 응?

때로는 여러개의 chain을 가진 모델끼리 겹치는데 특정 chain에 한정하여 Superposition 을 수행해야 할 때가 있다. 가령

여러개의 subunit 중에서 원하는 위치에 중첩을 시키고 싶다면 이동할 기준이 될 subunit를 파악해서

cealign /3LUE//I, 3M1F

이동의 기준이 되는 I Chain으로 3M1F 를 중첩시킬 수 있다.

이렇게 cealign 플러그인 (혹은 최신버전의 PyMol) 을 이용하면 ‘살짝 비슷한’ 구조라고 할지라도 가능한 최대한 superposition을 수행하여 구조간의 같은 점과 다른 점을 손쉽게 비교할 수 있다. 참 쉽져?

그러나 몇 개 정도의 구조를 대상으로 비교를 한다면 이렇게 PDB를 불러오고 하나씩 cealign 명령을 수행한다든지 하면 되겠지만 만약 수십, 수백개의 구조를 불러들여와서 여기에 대해서 일괄적으로 superposition을 해서 비교를 하려면 어떻게 해야 할까?

…………그건 ‘후편’ 을 기대하세염. ㅋ

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s