Me gustaría crear una serie de tablas sobre las calles más baratas y más caras alrededor de donde vivo, y me pregunto si alguien podría ayudar con una consulta sobre la confianza.
Tengo un conjunto de datos de transacciones de casas que proporciona variables para el precio de las propiedades en un año, junto con la calle y la zona.
He pivotado los datos por zona y calle y he calculado columnas para el precio medio y el recuento de propiedades vendidas:
price
median count std
district street
CANNOCK CHASE ABBEY STREET 182500 3 23780.787063
ABBOTS WALK 134000 1 NaN
Aunque podría clasificar los resultados en función del precio medio y publicarlos tal cual, me siento incómodo sin incluir alguna medida de la representatividad real para poder filtrar los valores atípicos basados en propiedades individuales (como la segunda entrada de esta tabla).
Sé que esto es trivial, pero ¿puede alguien darme una orientación sencilla sobre cómo proceder?