Verbesserungen von multiplen Testverfahren unter Berücksichtigung der Anzahl der wahren Hypothesen

Dipl.-Math. Claudia Hemmelmann
Institut für Medizinische Statistik, Informatik und Dokumentation Klinikum der Friedrich-Schiller-Universität Jena
Ort des Vortrages: 
S IMBS
Uhrzeit: 
15.00 Uhr
Datum: 
18. Juni 2008

Heutzutage handelt es sich bei vielen klinischen Fragestellungen um multiple Testprobleme, d. h. es sollen gleichzeitig mehrere Hypothesen getestet werden. Würde jeder der interessierenden Vergleiche auf dem Niveau a durchgeführt werden, muss mit vielen falsch positiven Ergebnissen, d. h. Fehlern 1. Art, gerechnet werden. Um die Anzahl V der Fehler 1. Art zu begrenzen, existieren einige verschiedene Fehlerkriterien. Unsere Untersuchungen beschränken sich jedoch auf multiple Testverfahren, die entweder die verallgemeinerte familienbezogene Irrtumswahrscheinlichkeit (engl.: generalized family-wise error rate, gFWE) oder die (Überschreitungs-)Wahrscheinlichkeit des Anteils der falschen Entdeckungen (engl.: tail probability of the proportion of false positives oder false discovery proportion, FDP) kontrollieren. Bei der gFWE wird P(V > u) £ a mit u ³ 0 gefordert und bei der FDP P(V/R > g) £ a für ein g (0 £ g < 1), wobei R die Anzahl der insgesamt abgelehnten Hypothesen ist. Für diese Fehlerkriterien existieren wiederum einige Testverfahren, jedoch sind diese in vielen Situationen nicht sehr sensitiv, d. h. sie habe eine geringe Güte.

Im Vortrag werden Verbesserungen dieser Verfahren vorgestellt, welche darauf beruhen, dass bei hochdimensionalen Daten häufig nicht alle Hypothesen wahr sind. Ist die Anzahl der wahren Hypothesen oder zumindest eine obere Schranke dieser Anzahl bekannt, dann können die meisten multiplen Testverfahren durch Ausnutzen dieser Kenntnis modifiziert werden. Die Höhe des möglichen Gütegewinns gegenüber den Originalverfahren wird anhand einer Simulationsstudie demonstriert. Erwartungsgemäß ist der Gütegewinn umso größer, je weniger die Anzahl der wahren Hypothesen überschätzt wird und je weniger Hypothesen wahr sind. Des Weiteren wird der Nutzen der verbesserten Testverfahren anhand von EEG-Daten dargestellt.