6 votos

supervisado vs clasificación no supervisada en la identificación de la región de interés

Se me presentó machine learning y remote sensingrecientemente. Mi tarea fue la de clasificar las imágenes de satélite en vegetation y non vegetation. Nos presentaron a dos enfoques.

  1. Supervised learning - donde tuvimos wkt o geojson ficheros de la tierra de la verdad. Estos archivos se había polígonos que fueron utilizados para entrenar el modelo. imágenes de satélite de WorldView-3 Satellite Sensor

  2. Unsupervised classification donde los píxeles se clasifican con base en NDVI valores con el uso de modelos de agrupación en clústeres como K-means, Fuzzy C-meansde la agrupación. imágenes de satélite de landsat 8

Mientras que todas estas cosas eran prácticamente al bebé con una cuchara y me tomó de los ejemplos de código de aquí y de allá. Sigo sin entender qué método se utiliza cuando, específicamente con el contexto de la previsión de cosechas?

¿Cuál es la ventaja de recoger el terreno de la verdad, cuando podemos utilizar la supervisión de aprendizaje para clasificar las imágenes. Si es con respecto a la exactitud, a continuación hay ejemplos específicos de cómo terreno verdad ayuda en la precisión en la predicción de cultivos?

3voto

Aaron Puntos 25882

Ambas supervisadas y no supervisadas métodos de clasificación requieren de algún grado de conocimiento de la zona de interés. Más importantes son: 1) la calidad de los datos espectrales en el que el algoritmo de clasificación que se utilizará y 2) el nivel de la clase de detalle requerido.

Clasificación no supervisada algoritmos requieren el analista de asignar etiquetas y combinar las clases tras el hecho en información útil clases (por ejemplo, los bosques, la agricultura, el agua, etc). En muchos casos, esto después de que el hecho de asignación de espectral de los grupos es difícil o no es posible debido a que estos grupos contienen conjuntos de la mezcla de los tipos de cobertura terrestre. Hablando en general, una clasificación no supervisada es útil para la rápida asignación de etiquetas sin complicaciones, la amplia cobertura de la tierra de las clases, tales como el agua, la vegetación o no de vegetación, bosques/no forestales, etc). Además, una clasificación no supervisada puede reducir analista de sesgo.

Clasificación supervisada permite que el analista de ajustar la información de las clases, a menudo mucho más fino subcategorías, tales como especies de las clases de nivel. La capacitación de los datos se recogen en el campo con una alta precisión, dispositivos GPS o por expertos seleccionados en el equipo. Considerar, por ejemplo, si usted desea clasificar por ciento de los daños a los cultivos en los campos de maíz. Supervisado enfoque sería muy adecuado para este tipo de problema porque se puede medir directamente el porcentaje de daño en el campo y utilizar estos datos para entrenar el algoritmo de clasificación. Utilizando los datos del entrenamiento en el resultado de una clasificación no supervisada probablemente produciría más de error debido a que el espectro de clases de contener más variada de píxeles que el supervisado enfoque. Del mismo modo, la recogida en el campo de las especies de cultivos de datos de entrenamiento es preferible a la experta selección de píxeles en la pantalla ya que a menudo es difícil determinar cuál de los cultivos están creciendo de forma visual.

Le recomiendo revisar la investigación del Dr. Russell Congalton, que ha producido muchos hito de la exactitud de los documentos de evaluación relativos a la teleobservación de la clasificación de los enfoques. Aquí hay algunas referencias para empezar:

  1. Congalton, R. G. (1991). Una revisión de la evaluación de la precisión de clasificaciones de datos obtenidos por teleobservación. La teledetección de medio ambiente, 37(1), 35-46.
  2. Congalton, R. G., & Green, K. (2008). Evaluación de la precisión de datos obtenidos por teleobservación: principios y prácticas. CRC press.

3voto

Nathan Thomas Puntos 204

El uso de cualquiera de las supervisada o no de algoritmos de clasificación es impulsado por la naturaleza de lo que usted está tratando de lograr. A veces, los datos que usted tiene, o el resultado que se desea alcanzar, se dictan qué algoritmo es el más eficiente para su uso. Este va a ser el resultado de un trade-off entre el tiempo, la precisión y la complejidad y el detalle de su resultado esperado.

En última instancia, supervisado generalmente, las clasificaciones de lograr una mayor precisión debido a que son capacitados en "el conocimiento del usuario'. Por ejemplo, si usted fuera a clasificar las imágenes de su zona de origen, es probable que quiera saber algo de información sobre la cobertura de la tierra de clases, en comparación con un lugar a medio mundo de distancia, donde usted no tiene ningún conocimiento previo. Este conocimiento podría ser utilizado para recopilar precisa de los datos de entrenamiento a la entrada en su algoritmo. En comparación, sin supervisión algoritmos tienen que definir sus propias clases en base al número que le diga lo que usted desea. Esto puede causar el error si hay más clases en la escena en la que se le han pedido que clasificar en este caso, usted encontrará que las clases se han fusionado. Sin supervisión de los algoritmos también buscan a 'encontrar' las clases que son más diferentes, que no puede distinguir exactamente sutilmente diferentes clases que usted puede entrenar dentro de un algoritmo supervisado.

Sin embargo, supervisado algoritmos requieren la recolección de datos de entrenamiento y por lo tanto más tiempo para construir. Posteriormente, sólo serán tan precisos como los datos de entrenamiento que usted utilice. Si los datos de su entrenamiento, no es representativo de su cobertura de la tierra, a continuación, la clasificación no funcionará bien. También hay advertencias con respecto a los supuestos subyacentes del algoritmo. Por ejemplo, el de máxima probabilidad algoritmo se supone que la formación de la clase de datos sigue una distribución normal, mientras que un Azar de los Bosques o algoritmo KNN no.

La clasificación de la vegetación y no de la vegetación es una tarea relativamente fácil. En este caso, dependiendo de los datos de entrada que tiene, sólo está buscando para lograr dos clases de datos que va a ser muy espectralmente diferentes. En este caso, una clasificación no supervisada es probable que se desempeñan tan bien como un algoritmo supervisado, mientras que hacerlo en un tiempo mucho más corto. Sin embargo, como la complejidad de la escena aumenta la precisión de la clasificación es probable que disminuya con el uso continuado de un algoritmo no supervisado. Imagine que usted ahora tiene que clasificar una escena, no sólo por la cobertura de la tierra (es decir, bosque, hierba, tierra), sino también por las especies - esto es mucho más complejo. ¿Cómo saber el número total de clases que se necesitan? Las clases que son sutilmente diferentes?

La elección de qué algoritmo utilizar por lo tanto depende de tu objetivo. Si, por ejemplo, de que quería crear una vegetación/no-mapa de vegetación como una capa de entrada de una mayor cobertura de la tierra de la clasificación, luego de un algoritmo no supervisado podría ser un método preciso para rápidamente lograr esto, antes de implementar un más tiempo supervisado algoritmo para clasificar específicos de cobertura de la tierra de clases o especies.

1voto

Hameno Puntos 129

Una forma de evaluar si el uso supervisado vs clasificación no supervisada es, si usted tiene conocimiento de la zona de interés. Si usted, y usted puede crear exactamente la muestra de entrenamiento (de las características de las muestras de campo o de alta resolución de las antenas), a continuación, supervisado puede dar un mejor modelo, si no, veo que no supervisado como el método de reserva.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X