Aprendizaje por Refuerzo y Avanzado

El aprendizaje por refuerzo (o Reinforcement Learning) es una variedad del Machine Learning que permite a una Inteligencia Artificial planear estrategias efectivas en base a la experimentación con los datos.

Se trata de una forma de optimización basada en datos. La máquina aprende a partir de su propia experiencia, interaccionando con el entorno hasta dar con el comportamiento ideal. A partir de la información disponible, emprenderá acciones que repetirá y “reforzará” según las recompensas que obtenga, que pueden ser positivas o negativas.


Un breve video para comprender mejor el tema 





No hay comentarios:

Publicar un comentario