9 votos

Son los resultados de los modelos considerados "datos"?

En el AGU, me presentó un póster sobre el vocabulario para la discusión de los sistemas de datos, y alguien ha dejado una nota en mi cartel que indica:

Usted tiene un sesgo de aquí hacia los datos de observación. Es necesario reconocer que una gran cantidad de datos proviene de modelos y análisis.

Y estoy totalmente de acuerdo; no he mencionado los modelos y los valores que vienen de ellos en absoluto, y que había definido 'datos' de tal manera que sólo se cubrió de datos de observación:

Los valores recogidos como parte de una investigación científica; puede ser calificado como "ciencia de datos". Esto incluye los valores calibrados (datos en bruto), derivados de los valores (datos calibrados), y otras transformaciones de los valores (datos procesados).

... pero los científicos consideran que los valores resultantes para ser 'datos'? He hablado con un par de científicos durante esta última semana (todos en la solar o la física del espacio), y cada uno de ellos, incluyendo a aquellos que se ocupan de modelado, se de la opción de que era el modelo de 'salida', pero no 'datos', (a pesar de que uno se hizo la distinción entre el philosphical concepto de 'datos' de ser varios valores, pero dijo que él no la consideran la "ciencia de datos" y comentó que algunas de las ciencias de la tierra de la gente considera los valores de sus modelos de datos)

Así, la pregunta -- ¿hay un término mejor para otro uso que el modelo de 'salida', y hay campos donde el modelo de 'salida' se considera 'datos'?

nota : hay también la cuestión de las definiciones de raw vs derivados vs procesado de datos, ya que hay diferentes definiciones utilizadas por el instrumento de los operadores, pero simplemente ignorar el problema en la definición de 'datos' por el momento.

nota 2 : me pidió originalmente esta en el meta, y allí fueron suggetions me mueve a la página principal; he editado el texto ligeramente debido a una respuesta que tuve ayer de mi encuestar a los científicos con los que trabajo.

nota 3 : para establecer el contexto, la intención original era identificar claro o ambiguo de los términos a través de las disciplinas de la ciencia, pero la intención de los usuarios fueron los datos informática de la comunidad (los datos de los edificios de sistemas para la mayor parte, no necesariamente los científicos), pero parte del problema es el uso de un lenguaje que no ofenda o confundir la disciplina científicos

3voto

Jason Gritman Puntos 3339

Bueno, para ser realmente pedante, casi todo es de datos. Cualquier medición u observación de datos. Supongo que me gustaría definir datos como cualquier pieza de información, independientemente de cómo se haya obtenido o si es válida.

Por supuesto, creo que tu pregunta era realmente llegar a lo que se considera evidencia, en el contexto de la prestación de apoyo o de oposición a un modelo teórico. Yo diría que la respuesta es muy dependiente de la situación. El uso de los resultados de la simulación como un ejemplo, ya que fue en su pregunta, me gustaría certeza tomar los resultados de la simulación en apoyo de la teoría, pero sólo con la condición de que la simulación ha sido muy bien validado contra experimento. Los detalles de cómo y por qué los resultados de la simulación son favorables a la teoría también es ciertamente importante.

En última instancia, toda ciencia debe ser validado por el experimento o la observación, pero que a veces puede ser un largo viaje, y no es definitivamente un lugar para otro tipo de datos a lo largo del camino.

2voto

Jonathan Puntos 197

Los datos de la modelización es todavía datos; la única cosa es que describe el modelo, no el fenómeno real.

2voto

aceinthehole Puntos 1460

Soy un experimentador, así que estoy muy fuertemente con la idea de que los "datos" viene de los experimentos. Pero la vida rara vez es fácil y hay algunos factores de complicación.

En física de partículas el principal factor de complicación viene en la forma de lattice QCD.

Esto funciona así: evaluar el tiempo-dependiente en el campo teórico potenciales en una red, y aplicar algunas inteligente magia debido a Pedro LePage y otros para cuidar de la alta frecuencia de cosas que de otra manera que el cálculo es demasiado grande para manejar).

Exactamente lo que el potencial de evaluar es un asunto de elección, ya que hay un número de parámetros libres en la teoría. Por supuesto, también puedes elegir la situación simulada. Ahora, debido a que este es un QCD cálculo hay muy pocas situaciones en las que usted ya sabe la respuesta. Eso es lo que hace la técnica útil. Pero también significa que usted no puede anticipar el resultado de un cálculo hasta que se ejecute el código.

Lattice QCD a veces las personas hablan de esto como "un experimento" y de los resultados como "datos". Al menos lo hacen entre sí y cuando se habla de los más tradicionales teóricos.

Acepto esto como un poco de una zona gris en los "datos" frente a la "teoría" del espacio.

Por un lado, que no conoce los resultados hasta que la crisis de los números y, a continuación, tienen que vivir con ellos. Los resultados son repetibles, y a veces toma un poco de trabajo para comparar con "pura" de la teoría.

Por el otro, es el cálculo y que pueden (y lo hacen) cambiar la micro-física de los supuestos que ir en los modelos.


Otra área gris en mi mente de preocupaciones ("real" de datos experimentales) que se han transformado en un modelo para hacerlos comparables a otro conjunto de datos. (Esto es independiente de análisis, por ejemplo, en la nuclear o la física de partículas secciones transversales, los factores de forma y el como a veces ser "ajustado" por factores conocidos de modelos que permitan su comparación con los resultados de otros experimentos realizados en diferentes cinemática.) De datos? Así, en su mayoría, pero depende de la teoría, también.

También, cuánto selección y corrección están dispuestos a permitir que antes de un determinado conjunto de datos tiene que ser tomado con un "si ellos hicieron todos los cálculos posteriores a la derecha" grano de sal.

2voto

Ryan Olson Puntos 1095

Este es políticamente cargado pregunta, que es probablemente la razón por la que usted tiene la respuesta a la AGU, donde hay personas que trabajan en temas de cambio climático. Hay un esfuerzo concertado en algunos sectores de poner en duda la ciencia mostrando que la Tierra se está calentando, y la predicción de los efectos del cambio climático. Como estas predicciones se basan en gran medida en las simulaciones, una parte de este esfuerzo es un intento de desacreditar a los modelos y simulaciones de como tener menor estatus, científicamente.

Como para el estado real de los modelos y simulaciones, que varía de un (sub) (sub)de campo, más o menos de acuerdo con lo difícil que es interpretar experimental o de observación de los datos. Mi propio campo de experimentación Atómica, Molecular y Óptica física tiene bastante clara línea divisoria entre el experimento y la teoría, en gran parte debido a los experimentos que hacemos son relativamente claro: un átomo de absorber la luz o no, o de que en esta posición, o que uno. Necesitamos simulaciones para comparar a algunos experimentos, pero nunca hay mucha duda que aquellos son la teoría, y no como parte del experimento.

Al llegar a la nuclear y la física de partículas, donde los detectores son el tamaño de los edificios de oficinas, la línea se vuelve un poco más débil. Los sistemas que utilizan para detectar e identificar los productos de las colisiones entre las partículas son tan complejas que es imposible interpretar lo que sucede sin una cantidad significativa de simulación. Como resultado, nuclear experimental y los físicos de partículas pasan una gran cantidad de tiempo en la generación y análisis de datos simulados, para dar cuenta de los problemas de detector de eficiencia y así sucesivamente. No creo que iba a llamar a estos resultados "datos" de por sí, pero la simulación computacional es una parte absolutamente esencial de la física experimental en los campos, y las simulaciones cuentan con más de estado que en AMO de la física.

Las cosas se ponen aún más complicado cuando se puede llegar a partes de la física que son fundamentalmente la observación más que experimental. Si eres un físico de partículas, puede repetir los experimentos de millones o miles de millones de veces, y construir una muy buena estadística comprensión de lo que sucede. Si usted es un astrofísico o geofísica, usted consigue solamente uno de los datos de ejecución-- sólo tenemos un universo observable, y sólo uno de la Tierra dentro de ella para estudiar. No se puede rebobinar la historia del universo observable y volver a intentarlo con un poco diferentes parámetros de entrada. A menos que lo haga en una simulación.

Mi extraño comprensión de los campos es que la simulación y el modelado es que se da una mucho mayor estatus que en mi esquina de la física, que acaba de salir de la necesidad. Si desea utilizar un modelo físico para explicar algunos geológicos o astrofísicos fenómeno, la única manera de hacerlo es mediante la ejecución de un montón de simulaciones, y mostrando que la única realidad que observamos es un posible resultado de sus modelos. Interpretar correctamente y el establecimiento de correspondencias entre las simulaciones y la observación es una sutil y complicado de negocios, y constituye una gran parte de la labor en las comunidades.

No sé que muchos astrofísicos, y menos aún los geofísicos, así que no conozco la terminología que utilizan. Mi impresión de la astrofísica, las conversaciones que he visto es que no iba a poner los resultados de la simulación en el mismo nivel que los datos de observaciones o experimentos, pero entonces mi muestra no de forma remota representante. Bien puede ser que hay campos en los que los resultados del modelo se consideran "datos" en la jerga local.

1voto

Herb Wilf Puntos 196

Sé que esta es una vieja cuestión, pero yo sólo quería añadir que en la Tierra de los sistemas de ciencia que he oído a menudo la gente usa el término "datos de reanálisis" para referirse a la salida del modelo cuando se utiliza como datos de entrada a una técnica de análisis. (Creo que esto podría ser más concreta de lo que estás pidiendo a pesar de que, como creo que se refiere a la salida de un tipo específico de modelo, es decir, basadas en la red global de modelos que han sido adaptados para el grueso de los datos de entrada. Pero aún parecía digno de mención.)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X