Tal vez pueda ayudarte a intuir algo y luego puedas volver a intentar el problema.
Piensa algebraicamente por un segundo.
Una breve secuencia exacta $0\to A\to B\to C\to 0$ de los grupos abelianos es, en secreto, sólo una descripción que $B$ se "arma" de alguna manera a partir de $A$ y $C$ . En un mundo perfecto esta secuencia se divide, lo que, entre otras cosas, nos dice que $B\cong A\oplus C$ de la manera más natural". Así, lo que podemos ver es que, en general, la existencia de una secuencia corta exacta como la mencionada anteriormente es que $B$ es "casi" un producto de $A$ y $C$ donde, en general, esto casi se debe a algún tipo de obstrucción.
Topológicamente, un haz de fibras es una expresión de la forma $F\to E\to B$ . Analizando antes esto nos dice que $E$ es de alguna manera reunida a partir de $B$ Y $F$ . Y, una vez más, en un mundo perfecto $E$ se reuniría de la forma más sencilla posible: sólo sería el producto $B\times F$ . Y, una vez más, no vivimos en un mundo perfecto, por lo que existen haces de fibras que no son triviales. Dicho esto, lo que sí obtenemos es que el espacio medio de un haz de fibras es "casi" un producto de $F$ y $B$ . Sin embargo, ahora tenemos una explicación más sencilla y agradable de lo que significa "casi", es decir, localmente. Intuitivamente, poniendo $F\to E\to B$ significa que localmente $E$ parece el producto de $B\times F$ aunque ambos difieran globalmente.
La cuestión es, pues, cómo expresarlo con rigor. Bueno, por supuesto, al igual que en el caso del álgebra, queremos que nuestro tipo medio se proyecte sobre nuestro tipo derecho. En particular vamos a querer algún mapa suryectivo $\pi:E\to B$ (por eso $B$ es un B es el espacio base) llamado proyección. Vemos entonces que lo que debe significar "parece localmente un producto" es que para cada punto $x\in E$ existe una vecindad $U$ de $\pi(x)$ tal que $\pi^{-1}(U)$ es homeomorfo a $U\times F$ por alguna homeomórfica $\varphi:\pi^{-1}(U)\xrightarrow{\approx}U\times F$ de una manera agradable. En concreto, queremos que nuestro homeomorfismo respete $\pi$ para que $\pi$ es lo mismo que $\pi_1\circ \varphi$ (donde $\pi_1$ es la proyección estándar $U\times F\to U$ ). Esto nos dice que $\pi^{-1}(U)$ parece $U\times F$ lo mismo en todas partes".
Así que, ahora si puedes averiguar por qué $X$ parece localmente un producto de $X$ y $Y$ .
EDIT: Espero no haber entendido mal tu pregunta. Pensaba que pedías una intuición sobre los haces de fibras, y puede que sólo estuvieras intentando averiguar por qué el problema era tan fácil. Si es así, me disculpo por esta respuesta tan poco convincente.