Hay una variable dependiente que se mide en £ y puede adoptar la forma de £0-£100.000. Se trata del valor del pago realizado. Si adopta la forma de £0, significa que no se ha efectuado ningún pago (porque no se ha autorizado). Si adopta la forma de cualquier número entre £0,01 y £100.000 significa que el pago fue autorizado por esa cantidad.
Nos interesa ver cómo varía el valor del pago en función de otra información que tengamos (variables independientes).
Una de las propuestas que se plantean es utilizar un modelo Tobit con un límite inferior de 0. No he trabajado antes explícitamente con un modelo Tobit, pero no veo por qué es apropiado. Los pagos no pueden ser negativos. No hay censura en 0 - esos puntos en 0 son simplemente aquellos en los que no se han realizado pagos.
Mi intuición es eliminar todas las observaciones en las que el pago realizado es de 0 libras esterlinas y simplemente ejecutar el MCO en las observaciones en las que la variable dependiente es de 0,01 a 100.000 libras esterlinas.
¿Es justificable el enfoque de Tobit? ¿Es tan sencillo como aplicar el método OLS a un conjunto de datos truncados?
Editar - Para aclarar - mi preocupación sobre si el modelo Tobit es apropiado se basa en mi confusión sobre si las respuestas de £0 son "soluciones de esquina". Entiendo, como ejemplo no relacionado, que alguien puede decidir no hacer ninguna donación (0€) o hacer una donación (>0€). Se trata de una decisión tomada con respecto a sus preferencias/opiniones. Sin embargo, un £0 en mi escenario es simplemente una entrada para representar el hecho de que no se ha realizado un pago.
Edit2 - Para aclarar más:
Son muchas las solicitudes de pago que nos llegan. Todas ellas son de entre 0,01 y 100.000 libras esterlinas. Para ser pagados, tienen que ser autorizados. Sólo se autoriza un subconjunto de las solicitudes. Las que no autorizamos reciben un pago de 0 libras.
Así que tenemos 2 campos:
- Pagos solicitados: también serán de 0,01 £ a 100.000 £. Nadie solicitará nunca un pago de 0 libras, ya que sería ilógico
- Pago efectuado: tendrá la forma de 0,01 £ - 100.000 £ para los pagos que autorizamos y la forma de 0 £ para los pagos que no autorizamos. Esta variable es el centro de nuestro análisis, ya que queremos comprender cómo varía el valor del pago efectuado según la información que tenemos sobre la solicitud (es decir, quién la solicitó, en qué departamento está, para qué fue la solicitud).
Los pagos se solicitan pero no se autorizan porque no cumplen los criterios de elegibilidad que tenemos en la empresa. Por poner un ejemplo algo relacionado: alguien puede solicitar un pago de 50 libras para reembolsar un gasto en el que ha incurrido. Sin embargo, esto quedaría fuera de nuestros criterios de elegibilidad y, por lo tanto, no autorizaríamos el pago y el pago realizado sería de 0€.
Esto me sugiere lo siguiente:
Las entradas de £0 en el campo de pagos realizados se deben a nuestros criterios de elegibilidad como empresa. Las entradas de £0,01 - £100.000 en el campo de pago realizado se deben a la información que tenemos sobre el propio pago.
El ejemplo típico que veo para las "soluciones de esquina" son las donaciones benéficas de un individuo. En este caso, la decisión de dar 0 libras o >0 libras son decisiones tomadas con respecto a las características del individuo.
Así pues, tengo curiosidad por saber si el enfoque de la "solución de esquina" sigue siendo aplicable a mi escenario. Las características que determinan el tamaño del pago realizado y las características que determinan si autorizamos los pagos no son necesariamente las mismas características.