Primero considera el caso de que $\sigma$ sea una función simple, es decir,
$$\sigma(s) =\sum_{j=1}^n 1_{[t_{j-1},t_j)} \xi_j \tag{1}$$
donde $(\xi_j)_{j=1,\ldots,n}$ son variables aleatorias independientes del movimiento Browniano $W$. Sin pérdida de generalidad, podemos suponer que $t_k = t$ para algún $k \in \{1,\ldots,n\}$ (en caso contrario, agregamos el punto a la partición). Entonces
$$\begin{align*} \mathbb{E} \left( \exp \left[ \imath \, u \int_t^T \sigma_s \, dW_s \right] \mid \mathcal{F} \right) &= \mathbb{E} \left( \exp \left[ \imath u \sum_{j=k+1}^n \xi_j (W_{t_j}-W_{t_{j-1}} \right] \mid \mathcal{F} \right). \end{align*}$$
Dado que $W$ es independiente de $\mathcal{F}$ y $\xi_j$ es medible con respecto a $\mathcal{F}$, obtenemos
$$\begin{align*} \mathbb{E} \left( \exp \left[ \imath \, u \int_t^T \sigma_s \, dW_s \right] \mid \mathcal{F} \right) &= \mathbb{E} \left( \exp \left[ \imath \, u \sum_{j=k+1}^n y_j (W_{t_j}-W_{t_{j-1}}) \right] \right) \bigg|_{y_j = \xi_j} \\ &= \exp \left( - \frac{1}{2} u^2 \sum_{j=k+1}^n y_j^2 (t_j-t_{j-1}) \right) \bigg|_{y_j = \xi_j} \\ &= \exp \left( - \frac{1}{2} u^2 \int_t^T \sigma^2(s) \, ds \right). \end{align*}$$
Para $\sigma$ general, aproximamos $\sigma$ por funciones simples adecuadas de la forma $(1)$ y utilizamos el teorema de la convergencia dominada para concluir que
$$ \mathbb{E} \left( \exp \left[ \imath \, u \int_t^T \sigma_s \, dW_s \right] \mid \mathcal{F} \right) = \exp \left( - \frac{1}{2} u^2 \int_t^T \sigma^2(s) \, ds \right).$$
En cuanto a tu segunda pregunta: Para funciones de variación acotada, se puede definir una integral estocástica por integración por partes, es decir, estableciendo
$$\int_0^t \sigma(s) \,d W_s := \sigma(t) W(t) - \int_0^t W(s) \, d\sigma(s).$$
La integral en el lado derecho está bien definida ya que $\sigma$ es de variación acotada. Esto lleva a la llamada integral de Paley-Wiener-Zygmund (que es un caso especial de la integral de Itô); ver por ejemplo
Rene Schilling, Lothar Partzsch: Movimiento Browniano - Una introducción a los procesos estocásticos, Comentario 13.5
para una (breve) introducción.