5 votos

Son todos los atributos/puntos de datos inherentemente nominal?

Estoy tratando de diseñar un paquete de estadísticas .NET, y me gustaría aplicar orientado a objetos de principios de diseño en algunas de las estructuras de datos que estoy desarrollando.

Al mirar a través de conjuntos de datos de ejemplo para los clasificadores simples, aunque existen otros tipos de atributos (ordinal siendo el único otro que he visto, con discretas y continuas variaciones sobre eso), en última instancia, todos ellos son capaces de ser clasificados por un valor distinto de alguna manera.

Esto me hace pensar que todos los tipos de atributo son inherentemente nominal, y que debe haber un tipo de base nominal de atributos, como la instrucción para todos los demás atributos que parece ser cierto:

<tipo de atributo> es un tipo nominal de

(Nota: esto no significa que no se excluyen mutuamente)

Si ese es el caso, entonces la clase que representa el tipo de un atributo en un nivel fundamental sería un nominal tipo de atributo, con ciertos métodos/propiedades que son inherentes a todos los tipos de atributo.

La parte superior de mi cabeza, el primer método consiste en ser capaz de determinar si es o no una instancia del tipo de variable es el mismo como otro ejemplo del mismo tipo de atributo.

Dado lo anterior, es que cada tipo de atributo inherentemente nominal, incluso si puede poseer otras cualidades más allá de nominal cualidades (por ejemplo, el ordinal atributos podría tener el concepto de distancia entre dos instancias)?

8voto

jldugger Puntos 7490

La pregunta (y su respuesta) invocar Stevens' teoría de los niveles de medición. Este hilo tal vez no es el lugar para una evaluación crítica de la (vieja) de la teoría, que posteriormente ha sido encontrado para ser limitado y contraproducente en muchos (pero no todos) de las aplicaciones. La pregunta, sin embargo, sugiere implícitamente que esta teoría podría proporcionar una base para el diseño y desarrollo de software, más probable es que un esquema de herencia de clases.

Tal vez podría funcionar, pero creo que no.

Tiene sentido tener un universal abstracto o de la base de datos de la clase de la cual todas las demás se heredan, y para el suministro de algunos métodos predeterminados para probar la igualdad, la impresión de los valores de etc. Siéntase libre de llamar a esto el "nominal" de la clase. En este sentido, la respuesta a la pregunta como se dijo es "sí", usted puede pensar de cada tipo de datos (al menos) nominal. Pero ¿qué es lo siguiente? Vamos a considerar los siguientes tipos de datos correctamente se encuentran dentro de Stevens de la taxonomía y las implicaciones que podría tener para el diseño de software:

  • Orientaciones relativas: estas son pedidas pero no totalmente ordenado y disfrutan de un gran grupo continuo de significativas transformaciones (rotaciones). La falta de orden total les impide ser ordinal, sin embargo, disfrutan de todas las otras propiedades de los datos de intervalo.

  • Ubicación geográfica: la distancia entre ellos tener sentido, pero la mayoría de las transformaciones no. Así, por Stevens, parece que sería nominal y el intervalo pero no tanto.

  • Los datos de la imagen: una vez más, muchos tipos de distancias sentido. No hay ningún orden intrínseco. Diversas formas de transformaciones y comparaciones podría decirse que estas un complejo y rico formulario de datos de los datos de proporción, sin embargo. (¿Qué acerca de una imagen que representa a todo un campo de datos de proporción?)

  • Los números complejos, que representan ubicaciones en el avión o Euclidiana transformaciones de los mismos. Más rica que la relación de datos, pero sin un orden.

  • Intervalo de valores de datos, que representa tanto a datos censurados y los datos conocidos sólo a estar entre definitivo de límites. En caso de que estas se heredan del tipo de datos cuyos rangos que representan (ordinal o de relación) o, teniendo en cuenta que incluso la desigualdad de pruebas, a menudo, son indefinida, en caso de ser considerado puramente nominal (a la que tira de ellos de casi la totalidad de la información que contienen)?

  • Porcentajes y contó proporciones. Estos números tienen algunas de las características de todos los de Stevens tipos, así como las peculiaridades de su propio. Claramente ellos no califican como intervalo o relación de datos, pero tratarlos como tal es algo muy común (y puede ser eficaz en el análisis).

Estos y otros ejemplos sugieren que podría ser una limitante a la fuerza de una jerarquía en el Stevens de la taxonomía, o su utilización para el diseño de una clase para representar datos.

Otro problema, uno grande-con la visualización de Stevens' la taxonomía como una jerarquía, es que simplemente no es así. Por ejemplo, los datos que aparecen puramente ordinal a menudo puede ser analizada como intervalo o de razón (por ejemplo, el uso ordenado de regresión logística). Por lo tanto, si usted desea un apoyo eficaz de análisis de datos, usted no debe obligar al usuario ver los datos en un nivel, ni debe arbitrariamente o limitar innecesariamente lo que se puede hacer con los datos basados en el nivel al cual ha sido asignado.

Una cosa que hacer quiero hacer es asegurarse de que las representaciones internas se utilizan para codificar los valores nominales ("factores" a menudo) nunca confundirse con los números reales. Este es un error básico hecho por muchos usuarios de los sistemas que utilizan códigos numéricos para representar factores, pero luego permitir que esos códigos se calcula con (como en la regresión) como si sus valores reales fueron significativos. No creo que esta es una cuestión de diseño de clase o de la colocación de los datos en una jerarquía. Una mejor manera de ver puede ser que de fijación semántica de las etiquetas a los datos para dar pistas sobre su adecuado uso, exhibición, o de la interpretación.

Porque la cuestión no expresa ningún objetivos de diseño, no es posible sugerir alternativas, pero parece bueno sólo para ignorar el Stevens enfoque a menos que el software está diseñado para limitar el uso de los datos con las que trabaja. En su lugar, hacer el diseño de software el uso de buenas prácticas de ingeniería: inicio de una declaración clara de que el software de propósito y cómo se utilizará. ¿Qué tipo de datos debe almacenar y gestionar? ¿Qué tipos de operaciones que es necesario realizar en los datos? ¿Hasta qué punto debe ser extensible? ¿Qué requisitos de rendimiento podrían restringir los métodos de datos interna de la representación? Y así sucesivamente... Esta línea de investigación va a ser más relevante y más productivo que tratar de adherirse a Stevens sistema (o cualquier otra persona).

4voto

SQLMenace Puntos 68670

Stanley Smith Stevens propuso un nivel de medición en 1946, el cual es utilizado por muchos de los estadísticos de hoy.

En él, hay cuatro diferentes clases de escala propuesto:

  1. Nominal Escala
  2. Escala Ordinal
  3. Intervalo De Escala
  4. La Medida De Relación

Con cada tipo de escala construyendo sobre el fundamento de los otros. Por ejemplo, mediciones de relación puede tener todas las operaciones de todas las otras escalas aplicadas a los valores de la escala tipo.

Dicho esto, es lógico que el árbol de jerarquía para un tipo de sistema sería así:

  • Nominal Atributo
    • Ordinal Atributo
      • Intervalo De Atributo
        • Relación de escala

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X