El vector de estado en la imagen de interacción $|\psi_I\rangle$ está definido como $U_0^\dagger |\psi_S\rangle$, donde $|\psi_S\rangle$ es el vector de estado en la imagen de Schrödinger, y $U_0=e^{-iH_0(t-t_0)/\hbar}$ como dices$^*$. Si no te gusta el conjugado complejo en la ecuación, puedes escribirla alternativamente como $|\psi_S\rangle=U_0|\psi_I\rangle$ si así lo deseas. Pero aquí es donde puedes comenzar con la imagen de interacción y derivar otras relaciones útiles a partir de ahí. En otras palabras, esta es una relación entre los vectores de estado dentro de cada imagen. No es una representación completa de la imagen de interacción en sí misma.
Esto también responde a "¿por qué solo estamos usando $H_0$ y no el $H$ completo? Nuevamente, de esta forma estamos definiendo el vector de estado en esta imagen en términos del vector de estado en la imagen de Schrödinger. La parte dependiente del tiempo del Hamiltoniano sí juega un papel en la imagen de interacción. Daré algo de esto ahora.
Debes tener en cuenta que el Hamiltoniano $H$ mencionado anteriormente es realmente el Hamiltoniano en la imagen de Schrödinger. Si definimos $H_{0,I}=U_0^\dagger H_0 U_0=H_0$ (ya que $U_0$ y $H_0$ conmutan) y $H_{1,I}=U_0^\dagger H_1 U_0$, entonces podemos obtener la evolución temporal de nuestro vector de estado en la imagen de interacción.
Si utilizamos estas definiciones y comenzamos con la ecuación de Schrödinger dependiente del tiempo, puedes mostrar que $$i\hbar\frac{\partial}{\partial t}|\psi_I\rangle=H_{1,I}|\psi_I\rangle$$ (Si no te gusta cómo acabamos de definir estos operadores de esta forma, sustituye el vector de estado en la EDSE primero y verás que definir los operadores de esta manera termina siendo muy útil).
Esto es lo que debería ayudarte con tu confusión. $H_{1,I}=U_0^\dagger H_1 U_0=e^{iH_0(t-t_0)/\hbar}H_1e^{-iH_0(t-t_0)/\hbar}$ depende tanto de $H_0$ como de $H_1(t)$, por lo que aún tenemos ambas partes del Hamiltoniano original.
Esto muestra cómo realmente cualquier operador se transforma de la imagen de Schrödinger a la imagen de interacción: $$A_I=U_0^\dagger A_S U_0$$ Pero, nuevamente, el hecho de que no estemos usando $H_1$ aquí no significa que no sea importante. Esto es solo cómo relacionamos las dos imágenes (interacción y Schrödinger). Por eso los valores esperados no dependen de $H_1$ como señalas. Es simplemente un artefacto de cómo definimos la imagen de interacción para que sea "relativa a" la imagen de Schrödinger.
$^*$ El Hamiltoniano $H=H_0+H_1(t)$ se ve en la "imagen de Schrödinger". Ahora, en tus comentarios y preguntas anteriores discutimos que los operadores en la imagen de Schrödinger no tienen dependencia temporal. Esto fue hablar un poco a la ligera. Lo que deberíamos haber dicho es que no hay dependencia temporal debido a las transformaciones unitarias. Los operadores en la imagen de Schrödinger aún pueden tener una dependencia temporal si algo está cambiando físicamente. Un ejemplo de esto es si tenemos una partícula en un campo eléctrico dependiente del tiempo. El problema es más fácil de resolver si podemos descomponer el Hamiltoniano en una suma de partes independientes del tiempo y dependientes del tiempo, aunque esto no tiene que ser siempre el caso.
En cuanto al uso de $U_0$ versus $U_0^\dagger$, esto es puramente una definición. Si deseas asociar algo "más físico" con esto, podrías decir que $|\psi_S\rangle=U_0|\psi_I\rangle$ significa que $|\psi_S\rangle$ es un estado evolucionado temporalmente de $|\psi_I\rangle$ si el Hamiltoniano fuera simplemente $H_0$. Pero este no es el sistema real en cuestión, ya que $H=H_0+H_1(t)$