Tengfei Yin, Mahbubul Majumder, Niladri Roy Chowdhury, Dianne Cook, Randy Shoemaker y Michelle Graham
En un análisis de datos de secuenciación de ARN de soja, las pruebas iniciales de significancia realizadas con un paquete de software produjeron listas de genes muy diferentes de las obtenidas con otro. ¿Cómo puede suceder esto? Este artículo demuestra cómo se investigaron las disparidades entre los resultados y cómo se pueden explicar. Este tipo de contradicción puede ocurrir de manera más general en análisis de alto rendimiento. Para explorar el ajuste del modelo y las pruebas de hipótesis, implementamos un gráfico interactivo que permite explorar el efecto de la estimación de la dispersión en la estimación general de la varianza y las pruebas de expresión diferencial. Además, proponemos un nuevo procedimiento para probar la presencia de cualquier estructura en los datos biológicos.