5 votos

Normalización de la estadística circular, como la dirección del viento en grados, para el agrupamiento

Tengo un conjunto de puntos de datos, cada uno representando un día y una serie de características asociadas con él: temperatura, velocidad del viento, dirección del viento, humedad, etc... Antes del análisis, estoy destinado a normalizar los datos, sin embargo tengo problemas para lidiar con la "dirección del viento" en función de como se expresa en grados. Los vientos que soplan en la 1° y 359° son casi idénticos, sin embargo, en un gráfico que están muy alejados el uno del otro.

Alguien podría sugerir un método para superar este problema? Yo estaba pensando en transformar el "grado" en función de dos dimensiones de la característica de "cos(θ)" y "sen(θ)", sin embargo, eso significaría que habría un 2 dimensiones del vector en lugar de 1. Cualquier sugerencia se agradece. Gracias!

0voto

David Parks Puntos 106

Pregunta interesante. Esto es sólo una improvisada pensamiento, no tengo experiencia específica que lo apoyaría, así que tome mi consejo, sin garantía. Pero mi primer pensamiento al abordar el problema podría ser el fin de convertirlo en un curso más de grano 1-de-K codificación de características.

Por ejemplo:

feature 1 = 1 if wind is N  (0 otherwise)
feature 2 = 1 if wind is NE (0 otherwise)
feature 3 = 1 if wind is E  (0 otherwise)
And so on...

Me podía imaginar, quizás, 8 funciones, si usted piensa que afinar la dirección del viento es importante me podía imaginar a la que se sumó que a los 12 o 16 características.

Al menos intuitivamente este sentido, un cálido viento sur pueden tener diferentes propiedades de un frío del oeste, y este enfoque haría que la distinción fácil de aprender, y ser linealmente separables.

La interacción entre el pecado y el cos no me da una cálida y difusa sensación acerca de lo bien que un algoritmo puede aprender de ella.

Algunas preocupaciones acerca de este enfoque para pensar: podría ser el aumento de la dimensionalidad del problema que causa algunos efectos secundarios no deseados en el aprendizaje (especialmente si usted tiene un pequeño conjunto de datos). También puede eliminar los detalles más finos que quizás son importantes para el problema.

Asegúrate de jugar con algunos de los diferentes enfoques. Encontrar una buena algoritmo de aprendizaje, y sostienen que la estática, mientras que usted juega con sus características de entrada y ver lo que mejora las cosas o de otra manera.

Después de volver aquí después de hacer algunos análisis y háganos saber lo que terminó de trabajar o no.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X