Como kjetil escribe, hay más bien poco de los datos aquí - demasiado poco para dibujar realmente conclusiones firmes.
Mi personal de impulso en tal situación es mirar varios modelos y ver si están de acuerdo en principio.
Primero vamos a dibujar un gráfico.
year <- 2001:2016
sightings <- ts(c(1,0,3,2,0,4,2,2,5,4,4,10,8,3,6,5),start=2001)
plot(sightings,type="o",pch=19)
Así, en el gráfico se ve bastante convincente, incluso si es sólo 16 puntos de datos. Yo sin duda más bien apuesta en el 2017 observación a ser mayor que 4, en lugar de 4 o menos.
Aquí está la R analógica a la regresión lineal se calculó con el programa estadístico SPSS. Tenga en cuenta que los valores de p de partido:
summary(lm(sightings~year))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -796.7588 220.6300 -3.611 0.00283 **
year 0.3985 0.1098 3.628 0.00274 **
Como kjetil sugerido, una regresión de Poisson también tendría sentido:
summary(glm(sightings~year,family="poisson"))
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -227.69850 61.49336 -3.703 0.000213 ***
year 0.11395 0.03058 3.726 0.000194 ***
Este modelo también se encuentra una tendencia significativa. Sin embargo, la lineal y la regresión de Poisson postulan muy específicos tendencias: uno lineal en el primer caso y una exponencial uno en el segundo caso.
Una alternativa podría ser la prueba de la correlación entre los avistamientos y año. El de pearson correlación de nuevo calcula una tendencia lineal:
cor.test(sightings,year,method="pearson")
t = 3.628, df = 14, p-value = 0.002742
Nota cómo el valor de p es exactamente el mismo que para el simple modelo lineal.
Las alternativas serían el de spearman y kendall correlaciones, lo que prueba que para cualquier tipo de relación monótona entre los años y los avistamientos, no sólo lineal o exponencial:
cor.test(sightings,year,method="kendall")
z = 2.9576, p-value = 0.0031
cor.test(sightings,year,method="spearman")
S = 156.75, p-value = 0.0004915
Aunque ambas pruebas de salida de las advertencias, porque no se puede calcular con exactitud los valores de p si los lazos están presentes, se vuelve a encontrar las tendencias más importantes.
Finalmente, como Michael Chernick notas, en realidad tiene una serie de tiempo, por lo que un análisis de series de tiempo pueden ser útiles. Su número de datos que realmente llame para una INAR modelo o similar, pero en realidad no hay común recuento de datos de series de tiempo los modelos que dan cuenta de la tendencia, así que sólo voy a ajustar un modelo ARIMA y una ETS uno:
library(forecast)
auto.arima(sightings)
Series: sightings
ARIMA(0,1,0)
sigma^2 estimated as 8: log likelihood=-36.88
AIC=75.76 AICc=76.07 BIC=76.47
ets(sightings)
ETS(A,N,N)
Call:
ets(y = sightings)
Smoothing parameters:
alpha = 0.3891
Initial states:
l = 1.3
sigma: 2.3277
Tomamos nota de que auto.arima()
modelos ARIMA(0,1,0) proceso, lo que significa que se cree que las primeras diferencias son ruido blanco. Primeras diferencias de nuevo indicar una tendencia. Finalmente, ETS es el único que no encuentra una tendencia, sólo se encuentra un aditivo de error (la primera "a"), no hay una tendencia ("N") y sin estacionalidad ("N"). Sin embargo, encuentra una gran suavizado valor de $\alpha = 0.39$, por lo que piensa que su avistamientos podría ser una débil clase de una caminata aleatoria. Tenga en cuenta que estos modelos están equipados utilizando los criterios de información, por lo que no tiene sentido asignar un valor de p de las tendencias que encontrar (o no).
En resumen, la mayoría de estos diferentes modelos encontramos una tendencia, incluso si están diseñados para observar diferentes tipos de tendencias (lineal, exponencial, general monotono, primeras diferencias). Esto, junto con la trama, sin duda sería suficiente para convencerme de que, efectivamente, hay una tendencia en los datos.