TECHNOLOGIE-SPEZIFISCHE FEHLERSIGNATUREN IN DEN DATEN DES 1000-GENOME PROJEKTS

PD Dr. Michael Nothnagel
Institut für Medizinische Informatik und Statistik Christian Albrechts Universität Kiel
Ort des Vortrages: 
AM S2, Universitätsklinikum Schleswig-Holstein Campus Lübeck, Ratzeburger Allee 160, 23538 Lübeck
Uhrzeit: 
14.00 Uhr s.t.
Datum: 
18. Mai 2011

 

Next-Generation-Sequencing (NGS) ist eine Schlüsseltechnologie für das Verständnis der Ursachen und Konsequenzen genetischer Variabilität beim Menschen. In diesem Kontext ist die Validität NGS-inferierter Single-Nucleotide Variants (SNVs) von großer Wichtigkeit. Wir haben daher einen statistischen Ansatz entwickelt, um die Genauigkeit von drei häufig genutzten NGS-Plattformen und ihren Anteil falsch-positiver Heterozygoten-Detektionen abzuschätzen, basierend auf der Read-Verteilung.
Eine Anwendung dieses Ansatzes auf die alignten DNA-Sequenzdatan zweier vollständig sequenzierter HapMap-Proben des 1000-GenomeProjekts zeigte bemerkenswert verschiedene Fehlerprofile der drei Plattformen. Neu detektierte SNVs zeigten durchgängig höhere Falsch-positiv-Raten (3–17%) als bestätigte HapMap-Varianten. Dieser Anstieg konnte nicht durch Unterschiede in der flankierenden Sequenz, der Read-Abdeckung oder Mapping-Qualität erklärt werden. Anwendung auf andere Datensätze und unter Benutzung eines anderen SNV-Calling-Algorithmus zeigte ähnliche Ergebnisse. Konsens-Calling durch mehr als eine Plattform führte zu signifikant geringeren Fehlerraten (1–4%). Die Nutzung mehrerer NGS-Plattformen könnte daher ein kosteneffizienterer Weg als die Benutzung nur einer einzelnen Plattform sein, insbesondere in örtlich lokalisierten Sequenzierungsexperimenten, die kleine Fehlerraten erfordern. Unsere Studie zeigt auch, dass unterschiedliche NGS-Plattformen für unterschiedliche praktische Anwendungen geeignet sind.
 

 

(Folien)