Tengo curiosidad de saber si hay una transformación que altera la asimetría de una variable aleatoria, sin afectar la curtosis. Esto sería análogo a cómo una transformación afín de un RV afecta a la media y la varianza, pero no el sesgo y la curtosis (en parte debido a la asimetría y curtosis son definidos para ser invariante a cambios de escala). Es este un problema conocido?
Respuestas
¿Demasiados anuncios?Mi respuesta es el comienzo de un total de hack, pero yo no soy consciente de ninguna forma establecida para hacer lo que pides.
Mi primer paso será ordenar un conjunto de datos se puede encontrar la posición proporcional en el conjunto de datos y, a continuación, transformarla a una distribución normal, este método fue utilizado en Reynolds & Hewitt, 1996. Véase el ejemplo de R código de abajo en PROCMiracle.
Una vez que la distribución es normal, entonces el problema se ha convertido en su cabeza - una cuestión de ajustar la curtosis pero no sesgar. Una búsqueda en google sugirió que se podría seguir los procedimientos de John & Draper, de 1980, para ajustar la curtosis, pero no el skew - pero yo no podía replicar ese resultado.
Mis intentos para desarrollar un crudo de propagación/estrechamiento de la función que lleva a la entrada (normalizada) de valor y agrega o resta de un valor proporcional a la posición de la variable en la escala normal da como resultado una monótona de ajuste, pero en la práctica tiende a crear una distribución bimodal, aunque uno de los que ha deseado la asimetría y la curtosis de los valores.
Me doy cuenta de que esto no es una respuesta completa, pero pensé que podría proporcionar un paso en la dirección correcta.
PROCMiracle <- function(datasource,normalrank="BLOM")
{
switch(normalrank,
"BLOM" = {
rmod <- -3/8
nmod <- 1/4
},
"TUKEY" = {
rmod <- -1/3
nmod <- 1/3
},
"VW" ={
rmod <- 0
nmod <- 1
},
"NONE" = {
rmod <- 0
nmod <- 0
}
)
print("This may be doing something strange with NA values! Beware!")
return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
}
Otra posible técnica interesante ha venido a la mente, a pesar de que esto no acaba de responder a la pregunta, es la transformación de una muestra para tener una muestra fija L-el sesgo y la muestra L-curtosis (así como un fijo de la media y la L-escala). Estas cuatro restricciones son lineales en las estadísticas de orden. Para mantener la transformación monotónica en una muestra de $n$ observaciones sería necesario, entonces, otra de las $n-1$ ecuaciones. Esto podría ser planteada como un problema de optimización cuadrática: minimizar el $\ell_2$ norma entre la orden de la muestra estadísticas y la transformada versión sujeta a las restricciones dadas. Esta es una especie de loco enfoque, sin embargo. En la pregunta original, yo estaba buscando algo más básico y fundamental. Yo también estaba implícitamente buscando una técnica que podría ser aplicado a las observaciones individuales, independientes de tener toda una cohorte de muestras.