4 votos

Pruebas circulares/elípticas para conjuntos de datos con magnitud y dirección

Estoy tratando de analizar (usando R) un conjunto de datos r(theta) para ver si la magnitud (r) depende de la dirección (theta). He mirado las estadísticas circulares pero éstas sólo parecen ocuparse de la distribución de las observaciones theta(i) alrededor del círculo.

Nuestra hipótesis nula es r=1 para todos los theta, vs su no.

Si H0 es falsa, entonces nos gustaría poder encontrar las principales direcciones implicadas. Por consideraciones teóricas esperamos que r(180)>1 y r(0)<1 con r(90)=r(270)=1

Sería útil alguna forma de representarlo gráficamente.

Los datos proceden de la interacción de las olas del agua y las corrientes de marea, con cero grados que representan las olas que viajan en la misma dirección que la corriente.

5voto

jldugger Puntos 7490

Esto parece necesitar una combinación de exploración y confirmación.

Para explorar, grafica los datos. Los gráficos polares funcionan bien. Este incluye una versión suavizada de los datos (línea roja), que se obtuvieron en 49 ángulos seleccionados al azar:

Polar plot

Sólo hay un ligero indicio de que los radios pueden tener el patrón alternativo: la suavidad es sólo un poco mayor que 1 para los ángulos cercanos a 0 y sólo un poco menos que 1 para los ángulos cercanos a $\pi$ . Sin embargo, la dispersión en torno al liso es mucho mayor que eso, lo que sugiere que este resultado puede deberse al azar.

Un método más potente de trazar estos datos para probar este particular alternativa es hacer coincidir los datos obtenidos en los ángulos $\theta$ con los obtenidos cerca de los ángulos $\theta+\pi$ . (Aunque esto reduce a la mitad la cantidad de datos disponibles para la comparación, su amplificación de la respuesta esperada lo compensa con creces). Según $H_0$ las diferencias en los radios se dispersarán alrededor de $0$ mientras que según $H_1$ las diferencias tenderán a ser negativas para ángulos pequeños, pasan por $0$ cerca de $\pi/2$ y se convierta en algo positivo. La siguiente figura muestra estas diferencias. En concreto, ordena los 49 valores observados de $(\theta,r)$ y traza los 24 pares $((\theta_{i} + \theta_{i+24} - \pi)/2, (r_{i} - r_{i+24}))$ para $i=1,2,\ldots,24$ :

Derived scatterplot

Este enfoque abre el análisis a los métodos estándar (exploratorio y confirmatorio) para comprobar las tendencias. Por ejemplo, podríamos realizar un ajuste ingenuo por mínimos cuadrados (de una tendencia lineal). El resultado para estos datos, $p = 0.038$ podría considerarse una prueba significativa a favor de la alternativa.

Otros métodos más sofisticados que vale la pena considerar son:

  • Para la exploración o la confirmación, dividir los datos en tres grupos para los ángulos cercanos $0$ , $\pi/2$ y $\pi$ . Compara las medianas (o medias) de las diferencias de $r$ dentro de cada grupo. En este caso, el ANOVA (así como el examen visual) indica que hay diferencias:

Box and whisker charts

  • Para confirmarlo, realice un ajuste multivariante por mínimos cuadrados de los datos a unos cuantos cosenos (de periodos $2\pi$ y $\pi$ para empezar). $H_0$ dice que como mucho el término constante es significativo; $H_1$ se demostraría por la importancia de cualquiera de los términos de frecuencia impar.

  • Para la exploración o la confirmación, ajuste splines periódicas a los datos.

Por cierto, estos datos fueron generados por la relación $r = 1 + \cos[\theta]^3/10$ con iid Error normal de la desviación estándar $1/10$ añadido. La figura muestra esta curva junto con la hipótesis nula (un círculo rojo discontinuo) y los datos.

Data with reference curves

1voto

Zizzencs Puntos 1358

No es una solución perfecta, pero me parece que todas sus hipótesis están relacionadas con $\theta$ de la distancia de 360. Por lo tanto, si transformas tu $\theta$ a 360- $\theta$ Entonces podría utilizar las estadísticas "normales" para examinar las hipótesis.

0voto

aron Puntos 174

Podría resolver las mediciones direccionales en un componente de proa-popa y un conjunto de valores de estribor-popa. Si theta= 0 es el valor recto hacia las olas, entonces toma abs(sin(theta)) como la componente que está "fuera del eje" y cos(theta) como la componente "proa-popa".

> theta=seq(0,2*pi, by=pi/2)
> options(digits=4)
> abs(sin(theta))
[1] 0.000e+00 1.000e+00 1.225e-16 1.000e+00 2.449e-16
> abs(cos(theta))
[1] 1.000e+00 6.123e-17 1.000e+00 1.837e-16 1.000e+00

También creo que deberías dedicar más tiempo a examinar el paquete circular en R. Tus datos se miden esencialmente en coordenadas polares, por lo que se pueden resolver en componentes de magnitud y dirección. Ofrece métodos de regresión para este tipo de datos que llama "c-l" (circular-lineal).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X