A mí me parecen iguales.
Una buena prueba visual para estimar o comparar las desviaciones estándar (después de comprobar si hay valores atípicos evidentes) es observar el rango de un conjunto de datos. Para un tamaño de muestra determinado, el rango suele estar cerca de un múltiplo fijo de la DE. Con unas 250 muestras independientes de una distribución normal, por ejemplo, el rango será unas 7 veces la DE. Así que aquí tenemos rangos de alrededor de 1,3 (panel de la izquierda), 1,0 (panel del medio) y 1,1 (panel de la derecha), y cada panel comprende aproximadamente la misma cantidad de datos. Por lo tanto, los cocientes de las varianzas, que serán iguales a los cuadrados de los cocientes de los rangos, oscilan en torno a $(1.3 : 1.1)^2$ = sobre $1.4$ hasta $(1.0 : 1.1)^2$ = sobre $0.8$ . Se puede utilizar una prueba F como muy duro estimación de la significación, pero yo reduciría los grados de libertad para dar cuenta de la evidentemente fuerte correlación serial. En cualquier caso, no sería raro obtener un par de estadísticas F (con 250 y 250 grados de libertad) en el rango $(0.8, 1.4)$ y reducir el df sólo aumenta esa posibilidad. A la luz de esto, un valor p de $0.26$ se ve bien.
En realidad, no se necesita una prueba formal en este caso: no tiene sentido, porque obviamente estos residuos no son ni de lejos independientes y muestran fuertes tendencias dentro de la serie. Puede que no haya mucho que la regresión pueda hacer para eliminar toda la correlación serial, pero se necesita un modelo más rico para capturar la variación que es evidente aquí. Hasta que eso ocurra, no tiene mucho sentido comprobar la homogeneidad de los residuos.