Pipeline

생명정보에서의 자동화, 파이프라인의 문제

I don’t want pipelines. I want well documented software/APIs/modules that do specific tasks well, that I can pipeline easily for my work.

— Nick Loman (@pathogenomenick) March 26, 2013

1. 남이 만든 파이프라인을 제대로 작동하게 만드는 데 시간과 노력이 걸린다. 설치과정부터 한번에 되는 게 없다.
2. 제대로 작동하게 만든 다음에는 자신이 원하는 기능이 결여되어 있거나 확장성이 떨어진다는 것을 깨닫는다.
3. 어떻게 고쳐보려고 낑낑대다가 결국 새로 다시 만들고 논문을 내야 하니까 이것을 발표한다.
4. 다른 사람이 내가 만든 파이프라인을 받고 1부터 다시 반복한 후 새로운 ‘파이프라인’ 이 나온다.

즉 가장 좋은 것은 위의 트윗 아저씨가 언급한 것처럼 특정한 테스크를 잘 수행할 수 있는 소프트웨어/API/모듈이 존재하고 이것을 간단한 스크립팅 (쉘 스크립트 등) 에 의해서 원하는 부분만을 골라서 연결시켜 원하는 일을 자동화하는 것일듯.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s