nw  

DeepVariant - Variant Calling with DeepVariant

Zusammenfassung

Variant Calling mit Deep Neural Networks

Schlüsselbegriffe

CNN, Python, Deep Learning, Genetik

Zielsetzung

Ausgangslage

Das Zentrum für Kardiovaskuläre Genetik und Gendiagnostik ist spezialisiert auf genetische Tests für Patienten mit Verdacht auf seltene, genetische Erkrankungen. Um mögliche krankheitserregende genetische Mutationen zu finden, wird die DNA erst mit Whole Genome Sequencing (WGS) sequenziert. Die daraus resultierenden "Reads" werden dann nach einem als gesund erachteten Referenzgenom ausgerichtet. Schliesslich werden mittels Variant Calling vom Referenzgenom abweichende Stellen gefunden.

DV Workflow

DeepVariant ist ein neuer, auf Deep Learning basierender, Ansatz für den letzten Schritt dieses Prozesses, das Variant Calling. DeepVariant soll nun verglichen werden mit aktuellen Callern wie GATK, PEMapper, Isaac und GENALICE MAP.

Ergebnisse

Wir haben festgestellt, dass DeepVariant im Vergleich zu oben genannten Callern zum Teil viel langsamer ist. Was die Metriken Precision, Recall und F1-Score betrifft, lässt DeepVariant jedoch PECaller und Isaac zurück und ist mehr als nur auf Augenhöhe mit GATK und GENALICE MAP.

Projektdaten

Projektdauer: 1 Semester
Aufwand in Personenstunden: 360 Stunden
Teamgrösse: 2

Auftraggeber

Banner ZKG
PD Dr. Gabor Matyas
Zentrum für Kardiovaskuläre Genetik und Gendiagnostik
Wagistrasse 25
CH-8952 Schlieren-Zürich
Website

Projektteam

Sascha Tribelhorn
Informatik
5. Semester

Joel Fischer
Informatik
5. Semester

Kontakt

Prof. Dr. Manfred Vogel
manfred.vogel@fhnw.ch

Michel Plüss
michel.pluess@fhnw.ch

<< zurück