Lubke GH, Laurin C, Walters R, Eriksson N, Hysi P, Spector TD, Montgomery GW, Martin NG, Medland SE y Boomsma DI
Por lo general, los estudios de asociación de todo el genoma consisten en realizar una regresión del fenotipo en cada SNP por separado utilizando un modelo genético aditivo. Aunque existen modelos estadísticos para interacciones recesivas, dominantes, SNP-SNP o SNP-ambiente, la carga de pruebas hace que la evaluación de todos los efectos posibles sea poco práctica para los datos de todo el genoma. Nosotros recomendamos un enfoque de dos pasos, en el que el primer paso consiste en un filtro que es sensible a diferentes tipos de efectos principales y de interacciones de SNP. El objetivo es reducir sustancialmente el número de SNP de modo que sea posible un modelado más específico en un segundo paso. Ofrecemos una evaluación de un método de aprendizaje estadístico llamado “máquina de refuerzo de gradiente” (GBM) que se puede utilizar como filtro. La GBM no requiere una especificación a priori de un modelo genético y permite la inclusión de un gran número de covariables. Por lo tanto, la GBM se puede utilizar para explorar múltiples interacciones GxE, lo que no sería factible dentro del marco paramétrico utilizado en GWAS. Demostramos en una simulación que el GBM funciona bien incluso en condiciones favorables al modelo de regresión aditiva estándar que se utiliza habitualmente en los GWAS, y es sensible a la detección de efectos de interacción incluso si una de las variables interactuantes tiene un efecto principal nulo. Este último no se detectaría en los GWAS. Nuestra evaluación se acompaña de un análisis de datos empíricos sobre la morfología del cabello. Estimamos la varianza fenotípica explicada por un número creciente de SNP de mayor rango, y demostramos que es suficiente seleccionar entre 10.000 y 20.000 SNP en el primer paso de un enfoque de dos pasos.