Permítanme responder a la pregunta general primera: en función de lo que realmente quieres hacer, el código de barras de tipo invariantes extraídos por el análisis topológico de datos puede ser muy útil en su trabajo. Y no se tarda demasiado conocimiento previo para el uso de la TDA herramientas. Por ejemplo, si todo lo que quiero hacer es demostrar que dos conjuntos de datos son cualitativamente diferentes, usted puede calcular su código de barras (yo he escrito un software para hacer esto, como tienen los demás) y calcular la diferencia entre ellos. Es fácil, rápido y gratis, así que ¿por qué no probar algo ortogonal y complementarios a los existentes técnicas?
La costumbre de canalización para la TDA es la siguiente: a partir de los datos, imponer la estructura de un filtro de células complejas, calcular la homología persistente, y la salida de código de barras. La razón que usted puede encontrar que es difícil obtener respuestas precisas a sus preguntas es muy simple: todo depende de cómo la filtración es inventado! Es un poco de una forma de arte para saber exactamente lo que para el cálculo de la homología persistente de, teniendo en cuenta las características que usted realmente preocupa.
He aquí un típico TDA enfoque a su primera pregunta: vamos a la variable dependiente ser $x$ y las variables independientes $y_1,\ldots,y_n$.
Supongamos, por umbralización y binning si es necesario, que cada una de las $y_j$ alcanza sólo un número finito de estados. Construir el indicador complejo en el $n$-partita gráfico cuyo vértice papeleras corresponden a los valores obtenidos por el $y_j$s. Cada simplex es ponderado por la mínima $x$-valor correspondiente a la $y$-valores fijos por sus vértices. Estos pesos darle un filtrado simplicial complejo, y los generadores de la $0$-dimensiones de la persistencia de los intervalos de la super-levelset de filtración de decirle que la configuración de $y$s corresponden a $x$ valores.
Respecto a su segunda pregunta, depende mucho de lo que quieres decir por "predicciones". Dos ejemplos de uso persistente de homología de las predicciones, considere la posibilidad de Liz Munch tesis de Doctorado disponible aquí. Es posible predecir -- hasta cierto punto-la cobertura de falla en el sensor de redes de modelado como de los dispositivos con una determinada probabilidad de fallos. Tal vez una modificación de este modelo podría hacer predicciones en situaciones que son de interés para usted.