Entriopiebasierten Statistischen Verfahren

Vergleich von Verfahren zur statistischen Analyse genetischer Assoziationsstudien

Die Fragestellung resultiert aus der statistischen Analyse eines Datensatzes, der uns für den GAW (Genetic Analysis Workshop) 15 (2006) in Florida zur Verfügung gestellt wurde. Mit diesen Daten haben wir Assoziationen zwischen Genotypen und Genexpressionen untersucht. Eine besondere Schwierigkeit war dabei die besondere Datenstruktur aufgrund heteroskedastischer Fehler, Ausreißer, schiefen Verteilungen, etc.. Folglich können klassische Verfahren, wie die parametrische Varianzanalyse und der Test von Kruskal-Wallis als nichtparametrisches Pendant, zur Detektion eines Lageunterschiedes in den Daten der verschiedenen Genotypen ungeeignet sein. Als Ausweg bieten sich hierbei robuste, entropiebasierte Verfahren, wie die Quantitative Mutual Information an. Aus diesem Grunde ist es unser Ziel, konkurrierende Verfahren zu vergleichen und detailliert zu analysieren, wann welche Methode sinnvoll eingesetzt werden kann und warum. Unsere Forschungen basieren auf realen wie auch simulierten Datensätzen.

S. Szymczak, A. Nuzzo, C. Fuchsberger, D. Schwarz, A. Ziegler, R. Bellazzi, B.-W. Igl (2007): "Genetic association studies for gene expressions: Permutation-based mutual information in a comparison with standard ANOVA and as a novel approach for feature selection", BMC Proceedings, in press