살며사랑하며

google deepvariant tip 본문

PROGRAM/GENOMICS

google deepvariant tip

drawhan 2018. 11. 29. 16:50

구글 딮베리언트에 대한 간단한 팁


구글 딮베리언트는 총 3가지 단계를 거칩니다.


  • alignment가 완료된 bam을 입력받습니다.
  • make_examples 과정을 거칩니다.
  • call_varaint를 처리합니다.
  • post_process를 처리후 완료가 됩니다.


구글 딮베리언트로 30x bam을 워크스테이션로 분석을 하면 대략 100시간이 걸립니다.


하지만 make_examples는 parallel을 이용해서 처리속도를 올릴수가 있습니다. 그리고 call_variant는 gpu나 tpu를 이용해서 분석속도를 높일수 있습니다.

그러나 마지막 과정인 post_process는 속도를 올릴수 있는 방법은 없으나 한시간 이내로 끝나기에 문제 없습니다.


물론 TPU는 구글 클라우드에서 처리를 해야 합니다.


https://cloud.google.com/genomics/docs/tutorials/deepvariant 에 보시면 처리하는 방법이 잘 나와있습니다.


비용은 적어놓은것보다는 조금 더 나오는 수준으로 gatk 를 대신해서 돌리면서 속도도 원하신다면 좋은 선택이 되지 않을까 합니다.


참고로 preemptible로 처리하면 금액의 7~80%는 줄일수 있다고 합니다. (실제 그정도인지 까지는 비교하지 못했으나 확실히 비용이 저렴해집니다.)