Tengo 2 exponencialmente distribuido conjuntos de datos y quiero estar seguro de que son de diferentes distribuciones. Desafortunadamente necesaria de error en la detección de los datos me obliga a descartar todos los datos bajo un cierto umbral. En cada conjunto que tengo cerca de 3000 puntos de datos y el trazado de los datos que me hace pensar que la lambda valor es diferente. Ajuste también los rendimientos de los diferentes valores de lambda.
¿Cómo puedo estar seguro de que los datos proceden de una distribución diferente?
Aquí una parcela de cómo los conjuntos de aspecto (tenga en cuenta que todos los valores de toda la vida=3sec tienen que ser descartados):
UPDATE: El por encima de las distribuciones son en ambos casos normalizado sobre N sólo para comparar mejor en un gráfico debido a que el número total de puntos de datos N es diferente.
UPDATE2: Después de truncamiento tengo alrededor de 150 valores de vida útil de la red de datos y 350 azul para el conjunto de datos. Resulta que 3000 fue exagerada (lo siento).
UPDATE3: Gracias por dar conmigo. Aquí es los datos crudos:
http://pastebin.com/raw.php?i=UaGZS0im
http://pastebin.com/raw.php?i=enjyW1uC
Hasta ahora me ajustó una función exponencial a ambos conjuntos de datos y la comparación de las pendientes. Desde cualquier normalización no debe cambiar la pendiente de los datos de diferentes pendientes debe implicar subyacentes diferentes distribuciones exponenciales (Mi experiencia con el análisis estadístico es muy limitada).
Los valores por debajo del umbral se descartan debido a que la medida detecta muchos eventos muy a menudo en ese régimen.
UPDATE4: me di cuenta de que mi problema es mucho más complicado de lo que pensaba. De hecho he dejado censurados (no sé el inicio de algunos de los eventos) y a la derecha censurados (no sé el final de algunos de los eventos) de datos Y tengo que descartar todas las vidas menores de 3 años (truncamiento). Es allí cualquier manera de incorporar todo esto en un análisis? Hasta ahora he encontrado un poco de ayuda sobre cómo trabajar con datos censurados (análisis de supervivencia), pero ¿qué debo hacer con el truncamiento?