martes, 31 de marzo de 2020

REDES NEURONALES II

Redes neuronales no supervisadas

Mapas auto organizativos de Kohonen o self-organizing maps  (SOM)


Conocen los conceptos de algoritmos no supervisados y supervisados por ello, pero como seguramente ya lo olvidaron veamos que son de forma rápida:

Los algoritmos de clasificación no supervisados son aquellos que no requieren etiquetado de cada uno de los vectores de entrada; se suelen llamar también algoritmos auto-asociativos, porque asocian entradas a ellas mismas.

Y bueno comencemos con las redes no supervisadas, y más concretamente sobre los mapas auto organizativos de Kohonen o self-organizing maps  (SOM), que son un algoritmo de redes neuronales no supervisadas que suele ser de los más utilizados - ojo que no es el único-.
Este tipo de redes fue desarrollado por el profesor Teuvo Kohonen (1982) e intenta imitar el comportamiento del cerebro en el tratamiento de la información en ciertos casos concretos. Y es que el cerebro se organiza, corrige errores y procesa nueva información sin tener referencias previas donde apoyarse. Es capaz de crear mapas mentales clasificando la información en determinadas zonas en base a los estímulos  que le llegan. Información con los mismos patrones de entrada o estímulos similares son clasificados en zonas próximas del cerebro.  
También entran dentro de las redes competitivas, porque también imitan la competición de las neuronas cerebrales cuando nueva información es procesada. Solamente las neuronas que más se parecen o están especializadas en un patrón de entrada son activadas y por lo tanto pueden ser consideras como ganadoras recopilando la nueva información. Un esquema habitual de SOM es el siguiente:

Pero bueno es difícil entenderlo de esta manera por ello ve el siguiente video para que podamos entender mejor el concepto de esta red neuronal SOM.



Clasificación de animales


Supongamos ahora que tenemos la siguiente tabla de información acerca de las propiedades de un conjunto de animales:
PalomaGallinaPatoGansoBuhoHalcónÁguilaZorroPerroLoboGatoTigreLeónCaballoCebraVaca
PequeñoNoNoNoNoNoNoNoNoNo
MedioNoNoNoNoNoNoNoNoNoNoNoNo
GrandeNoNoNoNoNoNoNoNoNoNoNo
2 patasNoNoNoNoNoNoNoNoNo
4 patasNoNoNoNoNoNoNo
PeloNoNoNoNoNoNoNo
PezuñasNoNoNoNoNoNoNoNoNoNoNoNoNo
MelenaNoNoNoNoNoNoNoNoNoNoNoNo
PlumasNoNoNoNoNoNoNoNoNo
CazaNoNoNoNoNoNoNoNo
CorreNoNoNoNoNoNoNoNoNoNo
Vuela NoNoNoNoNoNoNoNoNoNoNo
NadaNoNoNoNoNoNoNoNoNoNoNoNoNoNo



Usando las columnas anteriores como vectores de entrenamiento, y un tamaño adecuado del mundo para que los vectores puedan distribuirse en él con comodidad (pero no tan grande como para que no se les olbigue a reorganizarse localmente), podemos obtener una clasificación 2D de los elementos a los que caracterizan (animales), dando relaciones de similaridad (clasificándose) automáticamente:




Aquí hay algo importante y es que los datos se normalizan las componentes de los vectores (ya están normalizados, convirtiendo No = 0, Sí = 1) y se generan pesos al azar con componentes aleatorias entre 0 y 1. En este caso, debido a que cada vector tiene 13 componentes, usamos sólo las 3 primeras para dar una ligera clasificación por colores, pero no reflejan la información adicional que hay en los pesos reales que se usan en el algoritmo.

Puede observarse que la clasificación tiene sentido, ya que agrupa de forma coherente animales que consideramos similares por causas diversas.


¿Y qué aplicaciones tienen este tipo de redes? Han sido ampliamente empleadas, dada la gran capacidad de sintetizar la información de manera muy visual. Además, se preservan las distancias entre los datos de entrada, de tal forma que distancias entre neuronas en el mapa también son distancias equivalentes en los datos de entrada. Han sido ampliamente utilizados para clasificar países en base a su pobreza, clasificar textos y páginas web, música, detección de linfomas en imágenes, procesamiento del lenguaje…
En el ámbito de finanzas han sido empleadas para clasificar acciones y bonos en función de rentabilidad y volatilidad, lo que es útil para gestión de carteras de valores, también para la selección de fondos de inversión, detección de grupos de empresas en problemas financieros y quiebras o  predicción de ratings de las agencias de calificación crediticia entre otros.
La reducción de dimensiones de gran cantidad de información a solamente un mapa bi-dimensional permite procesar y comprender patrones en los datos que de otra forma sería más complicado. Con este artículo se ha pretendido introducir al lector en esta metodología así como el posible interés en alguna de sus versiones (supervised self-organising maps, fuzzy self-organizing maps…).

Tarea: Qué es la normalización de datos, ejemplos de normalizacion de datos- La tarea debe ser enviada a mi correo escaneada o fotografia, pues deben elaborarla a mano. 


Aviso importante

Aviso importante a los alumnos.  Para unificar en una sola plataforma todas las clases de cada una de las licenciaturas que se impar...