Estoy buscando un libro una introducción Computación estadística que tiene las pruebas para los métodos, así como ejemplos. Quisiera que las pruebas que están sobre el mismo niveles como (o inferiores) las pruebas en Inferencia estadística de Casella y Berger. Me gustaría también ejemplos en R o MATLAB. Si no hay buenos libros que combinan estas dos características, por favor recomendar dos libros.
Respuesta
¿Demasiados anuncios?Arroz del libro que vale la pena ejemplos de diferentes técnicas de computación a partir de datos reales, pero la principal de las pruebas es lo que encontrará en Casella/Berger, tal vez a menor matemáticas, pre-medida de la teoría de nivel.
Uno de los varios libros muy buenos introducción de la estadística básica métodos en R (estadística descriptiva, t y chi-cuadrado pruebas, ANOVA de los modelos de uno y dos factores, simples y múltiples regresión lineal) usando R para datos reales es por Dalgaard. (Es un Springer libro, pero él ha publicado una libre .pdf en danés página web.) Primeros 3-4 capítulos sobre todo R, saltar más allá de aquellos a los ver stat aplicaciones. Existe un gran número de ficheros de datos resultante de graves investigaciones, principalmente en medicina y ciencias biológicas.
Quizás desee examinar la totalidad de las listas de 'usar y R' libros de Springer y Chapman-Hall, lee los comentarios y muestras de vistas previas, y de la recogida de estadística temas de interés para usted personalmente. Yo puedo hablar de personal la experiencia que tanto las editoriales a los autores de graves ayuda de los revisores anónimos, en cuanto a contenido, relevancia, y la corrección. (En estos días algunos " de los editores a poner más esfuerzo en la bonita cubre de lo que entre ellos).
R no es el único equipo del paquete de útiles para la estadística análisis. Python (con Scripy) y otros que también se utilizan. Sin embargo, hoy por hoy, creo que R es su mejor apuesta: libre, un montón de libros autoritativos; experto, abierta, a cargo de la programación de los procedimientos; disponible para windows, Mac y UNIX; R studio, R Commander, etc., además de los básicos de la R; varios atractivos bibliotecas para la visualización gráfica; y (¿he mencionado) gratis. [Matlab hace cosas increíbles, pero es caro y para la mayoría de los estudiantes sólo disponible en matemáticas departamento de configuración.]
Usted puede tener dificultad para encontrar útil computacional orientación y sólido matemático-estadísticas de las pruebas en el mismo libro. Como se discute en los comentarios, una de las razones es que el manejo de ambos podría hacer un libro de difícil de manejar longitud.
Como importante es que una enorme contribución de la estadística cálculo es permitir la práctica de análisis de datos que no ser manejado por métodos estándar cubierto en matemáticas-stat libros. Muchos paquetes de software de estadística (por ejemplo, SAS, SPSS, Minitab, Saltar, y R) disponer de procedimientos para el manejo de situaciones estándar. De servicio pesado e innovador cálculo surge cuando los supuestos o modelos que están más allá del territorio cubierto por métodos estándar.
La validez de los básicos de métodos de simulación está cubierto por la Ley de los Grandes números (WLLN), a veces con un poco de trabajo extra. Algunas de máxima verosimilitud de los cálculos requieren equipo intensivo de cálculos deterministas. (Justificado por el análisis numérico, no de las estadísticas.) Bootstrap CIs y pruebas de permutación uso extensivo de la simulación. Muchos Bayesiano de modelos requieren de muestreo de Gibbs o el de Metropolis-Hastings algoritmo, tanto La Cadena de Markov Monte Carlo (MCMC) los métodos. Hay preguntas de investigación acerca de la convergencia y de la velocidad de convergencia de algunos de estos métodos; mientras tanto. numérica y gráfica de los métodos descriptivos son necesarios para comprobar que están trabajando como la intención de.
Fundamentalmente, me gustaría hacer hincapié en que se deben utilizar datos reales como tanto como sea posible de obtener en estadística informática. Usted puede ser razonablemente seguro de que a alguien le importaba lo suficiente acerca de la investigación que produjo los datos que hay son interesantes los temas a explorar y potencialmente importante conclusiones que se pueden extraer. Falsa y simulada de datos puede tener pedagógico de los usos, pero también pueden ser utilizados para promover maravillosamente inteligente y sin cesar intrincados métodos para responder a preguntas que nadie está preguntando en serio. Hay un montón de desafiantes de responder a las preguntas sobre datos reales para mantener estás aprendiendo cosas importantes para un largo tiempo.
Finalmente, para 'recreativo' de la lectura para llegar a un marco útil de la mente, usted puede leer los libros de Dyson: "la catedral de Turing" y Plata: "La señal y el ruido." Un poco de historia y un poco racional de visión hacia el futuro.