En el AGU, me presentó un póster sobre el vocabulario para la discusión de los sistemas de datos, y alguien ha dejado una nota en mi cartel que indica:
Usted tiene un sesgo de aquí hacia los datos de observación. Es necesario reconocer que una gran cantidad de datos proviene de modelos y análisis.
Y estoy totalmente de acuerdo; no he mencionado los modelos y los valores que vienen de ellos en absoluto, y que había definido 'datos' de tal manera que sólo se cubrió de datos de observación:
Los valores recogidos como parte de una investigación científica; puede ser calificado como "ciencia de datos". Esto incluye los valores calibrados (datos en bruto), derivados de los valores (datos calibrados), y otras transformaciones de los valores (datos procesados).
... pero los científicos consideran que los valores resultantes para ser 'datos'? He hablado con un par de científicos durante esta última semana (todos en la solar o la física del espacio), y cada uno de ellos, incluyendo a aquellos que se ocupan de modelado, se de la opción de que era el modelo de 'salida', pero no 'datos', (a pesar de que uno se hizo la distinción entre el philosphical concepto de 'datos' de ser varios valores, pero dijo que él no la consideran la "ciencia de datos" y comentó que algunas de las ciencias de la tierra de la gente considera los valores de sus modelos de datos)
Así, la pregunta -- ¿hay un término mejor para otro uso que el modelo de 'salida', y hay campos donde el modelo de 'salida' se considera 'datos'?
nota : hay también la cuestión de las definiciones de raw vs derivados vs procesado de datos, ya que hay diferentes definiciones utilizadas por el instrumento de los operadores, pero simplemente ignorar el problema en la definición de 'datos' por el momento.
nota 2 : me pidió originalmente esta en el meta, y allí fueron suggetions me mueve a la página principal; he editado el texto ligeramente debido a una respuesta que tuve ayer de mi encuestar a los científicos con los que trabajo.
nota 3 : para establecer el contexto, la intención original era identificar claro o ambiguo de los términos a través de las disciplinas de la ciencia, pero la intención de los usuarios fueron los datos informática de la comunidad (los datos de los edificios de sistemas para la mayor parte, no necesariamente los científicos), pero parte del problema es el uso de un lenguaje que no ofenda o confundir la disciplina científicos