Me gustaría desarrollar una prueba para identificar qué variables de mi conjunto de datos tienen una variación superior a la "variabilidad media".
Estoy luchando con eso desde hace días, y también he intentado en vano buscar ayuda en otros foros.
Tengo datos de experimentos biológicos, que se parecen a esto:
v1 2 1.8 1.5 1.9 2.1 1.78 1.95 2.0 2.1
v2 2 100 -5.2
v3 1 -1.3 -2 2.3
v4 1 1.5 1.6 1.9 2.1 2.0 2.4 -1.1 2.3 1.5 1.6 1.9 1.8 1.6
Estos representan las expresiones de los genes. Ahora, yo esperaría que todos los valores de cada variable(genes) sean más o menos similares, ya que los valores son medidas repetidas del mismo gen.
Tener una variable con una diferencia tan grande, como v2 , no tiene sentido, porque las mediciones repetidas deberían dar valores consistentes. Por lo tanto, tiene que provenir de un error metodológico y la variable (gen) tiene que ser descartada.
Estaba buscando un método (posiblemente una prueba estadística) en R que pudiera identificar la "variabilidad media" entre mis muestras y me informara de qué variables (genes) tienen una variabilidad significativamente mayor. Esto significa que para estos genes mis datos no son lo suficientemente buenos para estimar la expresión, y tengo que descartarlos.
Agradecería mucho cualquier sugerencia/enlace/consejo/método de prueba que pueda utilizar para mi propósito.