Tengo algunos datos que estoy jugando con el; para simplificar, vamos a suponer que los datos que contiene información sobre el número de mensajes de un blogger ha escrito vs número de personas que se han suscrito a esa persona en el blog (este es sólo un ejemplo).
Quiero conseguir algunos áspero modelo de la relación entre # puestos vs # de suscriptores, y cuando se mira en un log-log de la parcela, veo lo siguiente:
Esto se parece a una áspera relación lineal (en el log-log de la escala), y la revisión rápida de los residuos parece estar de acuerdo (no aparente patrón, no notable desviación de una distribución normal):
Así que mi pregunta es: ¿es correcto el uso de este modelo lineal? Sé vagamente que hay problemas utilizando regresiones lineales en log-log parcelas para estimar las distribuciones de ley de potencia, pero mis datos no es un poder de la ley de distribución de probabilidad (es simplemente algo que parece seguir más o menos un $subscribers = A * (postings) ^ k$ modelo; en particular, no necesitas nada para sumar 1), por lo que no estoy seguro de si las mismas críticas se aplican. (Tal vez estoy sobre-corrección en la mención de "log-log" y "regresión lineal" en la misma frase...) También, todo lo que realmente estoy tratando de hacer es:
- A ver si hay algún patrón para los blogs con residuos positivos vs blogs con residuos negativos
- Se sugieren algunas áspero modelo de cómo los suscriptores están relacionados con el número de publicaciones.