En realidad, ninguna de las dos explicaciones es correcta.
Una elipse de confianza tiene que ver con parámetros poblacionales no observados como la verdadera media poblacional de su distribución bivariante. Una elipse de confianza del 95% para esta media es, en realidad, un algoritmo con la siguiente propiedad: si se repitiera muchas veces el muestreo de la distribución subyacente y se calculara cada vez una elipse de confianza, el 95% de las elipses así construidas contendrían la media subyacente. (Tenga en cuenta que cada muestra produciría, por supuesto, una elipse diferente).
Así, una elipse de confianza suele no contienen el 95% de las observaciones. De hecho, a medida que aumenta el número de observaciones, la media suele estimarse cada vez mejor, lo que da lugar a elipses de confianza cada vez más pequeñas, que a su vez contienen una proporción cada vez menor de los datos reales. (Lamentablemente, algunas personas calculan la elipse más pequeña que contiene el 95% de sus datos, lo que recuerda a un cuantil, que en sí mismo está bastante bien... pero luego pasan a llamar a esta "elipse cuantil" una "elipse de confianza", lo que, como ve, lleva a confusión).
La varianza de la población subyacente se relaciona con la elipse de confianza. Una varianza elevada significa que los datos están dispersos, por lo que la media no está bien estimada y la elipse de confianza será mayor que si la varianza fuera menor.
Por supuesto, también podemos calcular elipses de confianza para cualquier otro parámetro de población que deseemos estimar. O podríamos buscar otras regiones de confianza además de las elipses, especialmente si no sabemos que el parámetro estimado se distribuye (asintóticamente) con normalidad.
El análogo unidimensional de la elipse de confianza es la intervalo de confianza y echar un vistazo a las preguntas anteriores de esta etiqueta es útil. La pregunta más votada de esta etiqueta es especialmente interesante: ¿Por qué un IC del 95% no implica una probabilidad del 95% de contener la media? La mayor parte de lo que allí se expone es igualmente válido para análogos unidimensionales del intervalo de confianza unidimensional.