12 votos

Debería tipos de datos (nominal/ordinal/intervalo/ratio) realmente ser considerada tipos de variables?

Así, por ejemplo, aquí están las definiciones que tengo de libros de texto estándar

Variable característica de la población o de la muestra. ex. Precio de una acción o de grado en una prueba

Los datos reales de los valores observados

Así, por un informe de dos columnas [Nombre | Ingresos] la columna de nombres de las variables y el valor real de los valores observados {dave | 100K} , {jim | 200K} sería el de datos

Lo que si me dicen que el [Nombre] columna datos nominales y que [ingresos] es la relación de los datos, no puedo ser más preciso describirlo como un tipo de variable en lugar de un tipo de datos, como la mayoría de los libros de texto? Entiendo que esto puede ser semántica, y que bien que todo lo que hay es demasiado. Pero me temo que puede ser que falte algo aquí.

20voto

AdamSane Puntos 1825

Stevens' escala tipología no es necesariamente cierta característica inherente de las variables, ni siquiera los datos en sí, sino de cómo tratamos la información de lo que están usando para decir.

En algunas circunstancias, exactamente el mismo valor puede ser considerado de razón, de intervalo, ordinal o nominal, dependiendo de lo que estamos haciendo con él - es una cuestión de cuál es el significado que le dan los valores, que puede cambiar de un análisis a la siguiente. Stevens tipología tiene algún valor, pero no es de ser demasiado prescriptivas acerca de él.

Esta cuestión de la importancia de la escala de significado se remonta al menos al Señor (1953), quien ofreció un ejemplo donde hubo tanto nominal y el intervalo de interpretaciones de un mismo conjunto de números.

Este punto fue aún más claramente por Velleman y Wilkinson (1993), que ofrecen un ejemplo de personas que reciben consecutivos contados los boletos en la entrada a una recepción con un premio que se concede a uno de los billetes; dependiendo del uso que se hace de los números de las entradas, que tienen interpretaciones en las cuatro escalas.

Así, por ejemplo, " ¿voy a ganar?' es una pregunta que el tratamiento de la cantidad nominal, mientras que el 'no me llega demasiado temprano para conseguir el boleto ganador?' es una pregunta a la que trata como ordinal; por otro lado (y no creo que este está en el papel) mediante 5 aleatoria de los números de ticket con el fin de estimar el número de personas en la sala de tratarlos como a la relación (por ejemplo, si hay 4 al azar los números que consiguió premios de consolación, tendrías 5 números aleatorios por completo a partir de la cual estimar el total de la asistencia).

Ellos argumentan que "los buenos datos de análisis no asume tipos de datos", "Stevens categorías de no describir atributos fijos de datos", "Stevens categorías son insuficientes para describir los datos de las escalas" y "Estadísticas de los procedimientos no pueden ser clasificados de acuerdo a Stevens criterios" (de hecho cada instrucción es también el título de la sección).

Las críticas también fueron ofrecidos en varios lugares por Tukey (por ejemplo, en el capítulo 5 de Mosteller y Tukey libro, de 1977, análisis de Datos y de regresión); Mosteller y Tukey ofrece una tipología - los nombres, grados (ordenado etiquetas), los rangos (a partir de 1, que puede representar la más grande o la más pequeña), contados fracciones (delimitada por el cero y el uno, estos incluyen porcentajes), cuenta (enteros no negativos), cantidades (no negativo números reales), los saldos (sin límites, valores positivos o negativos).

En mi propio trabajo, me he visto en situaciones donde los problemas graves de análisis fueron causados por las personas que no aprecian la gran diferencia entre las variables relacionadas con los niveles (a veces llamado 'stock' de las variables) y los flujos de - un simple ejemplo de estos tipos es la diferencia en los tipos de análisis apropiado para las cantidades de agua en un tanque de almacenamiento en cada una secuencia de períodos, y la cantidad de agua que fluye en él. Estos serían (en algunos de esos casos) tanto ser sub-categorías de la Mosteller y Tukey 'cantidades' tipo (y en esos mismos casos, tanto la relación de las variables en Stevens' scheme), lo que indica que los problemas de la tipología puede ser muy sutil, pero todavía se puede críticamente el impacto adecuado análisis.

P. F. Velleman y L. Wilkinson (1993),
"Nominal, Ordinal, de Intervalo y de Proporción de Tipologías son Engañosas"
El Estadístico Americano, vol.47 no.1 p 65-72

(una versión de trabajo parece estar disponibles en el 2º autores de la página web aquí)

Señor, F. (1953),
"En el tratamiento estadístico de fútbol de los números"
Psicólogo estadounidense, 8, páginas de 750 751

(El año de este documento se da de manera errónea en las referencias de la versión de la Velleman y Wilkinson papel he ligado, pero referida correctamente en el cuerpo del artículo)

1voto

Mohammadreza Puntos 1964

El tipo de los datos relacionados pero no idénticos al tipo de la variable. La mayoría de los casos, son los mismos, pero no tienen que ser.

Por ejemplo, si usted recoge N muestras de una distribución normal. Usted podría pensar que es una numérico (proporción o escala) de datos. Pero también puedo decir que es una variable categórica con N diferentes categorías, con una frecuencia de 1 por cada categoría. Parece estúpido pero también es una variable válido.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X