Estoy estudiando 100 juegos de temperatura ( $N_{sample}=500$ ), que depende $4$ variables explicativas como la potencia o la velocidad.
La dependencia es siempre la misma en cada conjunto, pero a veces la media y la varianza son diferentes.
- Me gustaría agrupar conjuntos similares y estudiar cada grupo por separado: encontrar un modelo de regresión múltiple para cada grupo.
- Entonces me gustaría clasificar futuros conjuntos Descubriré en uno de esos grupos.
No sé si se refiere a la clusterización o al reconocimiento de patrones o quizá a algo más. Pero no tengo ni idea de cómo hacer classifiy / comparar mis conjuntos, excepto la comparación de la media y la varianza de uno en uno.
¿Alguien tiene consejos o sugerencias?
He aquí un ejemplo de 3 series:
0 votos
Cuando dice "estudiar cada grupo", ¿está pensando en algo como un modelo de regresión múltiple o en otra cosa?
0 votos
Sí, exactamente. Al principio hice una regresión múltiple para estimar la tempetaure. Pero luego me di cuenta de que mi modelo era "un modelo promedio" de todos los conjuntos, por lo que no era lo bastante preciso. Así que quise clasificar mis varios conjuntos de temperatura antes de hacer mi regresión para poder tener un modelo por conjunto.
1 votos
¿Pero no podría simplemente incluir maniquíes para cada conjunto, y maniquí $\times$ interacciones variables y, por tanto, ajustar hiperplanos diferentes a cada conjunto dentro de un único modelo?
0 votos
No sé mucho sobre variables ficticias. Pero si he entendido bien tendré 100 variables ficticias y 100 modelos de regresión escritos en un solo formulario, ¿no? Lo que me gustaría es tener un modelo de regresión para cada grupo, no para cada conjunto.
0 votos
Lo siento, al utilizar la palabra "conjunto" pensé que se refería a "grupo". Lee 'grupo' por 'conjunto' en lo que dije antes. Así que en sus diagramas, esto agregará dos variables ficticias que dan tres interceptos diferentes, y si quiere coeficientes diferentes para cada uno también (pendientes diferentes), entonces las interacciones variable x ficticia triplicarán el número total de coeficientes.
0 votos
Las variables ficticias son objeto de numerosas preguntas aquí en CV, y son una forma estándar de tratar el problema de los grupos múltiples en los problemas de regresión. Algunos paquetes construirán y ajustarán variables ficticias automáticamente (como R); sólo tiene que decirles que tiene una variable de grupo ('factor' en R).
0 votos
Cuando dice "conjunto", ¿hay algo que asocie el conjunto a los distintos grupos (como que se tomen al mismo tiempo, por ejemplo)?
0 votos
Ah, vale. Creo que utilizaré variables ficticias como has dicho, pero sólo cuando tenga mis grupos, que es mi problema inicial. Cada grupo corresponde a una máquina. Algunas máquinas parecen tener el mismo comportamiento con respecto a su temperatura (misma intersección y, misma media...), otras no y espero descubrir algo sobre los motivos de esas similitudes/diferencias una vez que forme mis grupos.