Transformación del Q-Learning para el Aprendizaje en Agentes JADE

Nayma Cepero-Pérez, Mailyn Moreno-Espino

Resumen


El aumento de la interacción entre los sistemas informáticos ha modificado la forma tradicional de analizarlos y desarrollarlos. La necesidad de la interacción entre los componentes del sistema es cada vez más importante para poder resolver tareas conjuntas, que de forma individual serían muy costosas o incluso imposibles de desarrollar. Los sistemas multi-agente ofrecen una arquitectura interesante y completa para ejecutar tareas distribuidas que cooperan entre sí. La creación de un sistema multi-agente o un agente requiere de gran esfuerzo por lo que se han adoptado métodos como los patrones de implementación. El patrón Proactive Obsever_JADE permite crear los agentes e incluirle en cada uno comportamientos dotados de inteligencia que pueden evolucionar utilizando técnicas de aprendizaje automático. El aprendizaje por refuerzo es una técnica del aprendizaje automático que permite a los agentes aprender a través de interacciones de prueba y error, en un ambiente dinámico. El aprendizaje por refuerzo en sistemas multi-agente ofrece nuevos retos derivados de la distribución del aprendizaje, como pueden ser la necesidad de la coordinación entre agentes o la distribución del conocimiento, que deben ser analizados y tratados.

Palabras clave


Agentes; Aprendizaje Reforzado; JADE Patrones de implementación

Texto completo:

PDF

Referencias


M. Wooldridge. “An Introduction to MultiAgent Systems”. 2nd. 2009, John Wiley & Sons. ISBN: 9780470519460.

FIPA, FIPA Agent Management Specification, 2003, Foundation for Intelligent Physical Agents. URL: http://www.fipa.org/specs/fipa00023/

FIPA, FIPA Communicative Act Library Specification, 2003, FOUNDATION FOR INTELLIGENT PHYSICAL AGENTS. URL: http://www.fipa.org/specs/fipa00037/SC00037J.html

J. Ferber. “Multi-agent systems: an introduction to distributed artificial intelligence”. 1999, Addison-Wesley. ISBN 0-201-36048-9

F. L. Bellifemine, G. Caire & D. Greenwood. “Developing Multi-Agent Systems with JADE”. 1st. 2007, Chichester: John Wiley & Sons, Ltd. ISBN: 978-0-470-05747-6. URL: http://www.wiley.com/WileyCDA/WileyTitle/productCd-0470057475.html

F. Bellifemine, F. Bergenti, G. Caire & A. Poggi, “Jade-A Java Agent Development Framework”, in Multi-Agent Programming, R. Bordini, et al. (Ed.). 2005, Springer US. pp. 125-147. URL: http://link.springer.com/chapter/10.1007%2F0-387-26350-0_5

M. Moreno, A. Carrasco, A. Rosete & M. D. Delgado. “Patrones de Implementación para Incluir Comportamientos Proactivos”. Polibits, Vol. January-June 2013, No. 47, pp. 73-87, 2013.

B. Henderson-Sellers, “From Object-Oriented to Agent-Oriented Software Engineering Methodologies”, in Software Engineering for Multi-Agent Systems III, R. Choren, et al. (Ed.). 2005, Springer Berlin Heidelberg. pp. 1-18. URL: http://link.springer.com/chapter/10.1007%2F978-3-540-31846-0_1

DARPA Envisions the Future of Machine Learning, 2013. URL: http://www.darpa.mil/news-events/2013-03-19a

T. Ishida, L. Gasser & M. Yokoo. “Organization self-design of distributed production systems”. IEEE Transactions on Knowledge and Data Engineering, Vol. 4, No. 2, pp. 123-134, 1992. DOI: 10.1109/69.134249

OMG, Agent Platform Special Interest Group: Agent Technology – Green Paper, 2000. URL: http://www.objs.com/agent/agents_Green_Paper_v100.doc

S. Franklin &A. Graesser, “Is It an agent, or just a program?: A taxonomy for autonomous agents”, in Intelligent Agents III Agent Theories, Architectures, and Languages, J. Müller, M. Wooldridge, and N. Jennings (Ed.). 1997, Springer Berlin Heidelberg. pp. 21-35. URL: http://link.springer.com/chapter/10.1007%2FBFb0013570

S. Russell &P. Norvig. “Artificial Intelligence: A Modern Approach”. 3rd, illustrated. 2010, Prentice Hall. ISBN: 978-0136042594

J. M. Crant. “Proactive Behavior in Organizations”. Journal of Management, Vol. 26, No. 3, pp. 435-462, 2000. DOI: 10.1177/014920630002600304

A. M. Grant &S. J. Ashford. “The dynamics of proactivity at work”. Research in Organizational Behavior, Vol. 28, No. -, pp. 3-34, 2008. DOI:10.1016/j.riob.2008.04.002

S. K. Parker, U. K. Bindl & K. Strauss. “Making Things Happen: A Model of Proactive Motivation”. Journal of Management, Vol. 36, No. 4, pp. 827-856, 2010. DOI: 10.1177/0149206310363732

F. Bellifemine, A. Poggi & G. Rimassa, JADE – A FIPA-compliant agent framework, 1999. URL: http://sharon.cselt.it/projects/jade/papers/PAAM.pdf

E. Gamma, R. Helm, R. Johnson & J. Vlissides. “Design Patterns: Elements of Reusable Object-oriented Software”. 2004, Pearson Education. ISBN: 978-0201634983

FIPA, FIPA Subscribe Interaction Protocol Specification, 2003, FOUNDATION FOR INTELLIGENT PHYSICAL AGENTS. URL: http://www.fipa.org/specs/fipa00095/PC00095A.pdf

R. Barr &C. Rovee-Collier. “Encyclopedia of the Sciences of Learning”. 2012, Estados Unidos: Springer. URL: http://www.springer.com/us/book/9781441914279

P. Domingos. “A few useful things to know about machine learning”. Commun. ACM, Vol. 55, No. 10, pp. 78-87, 2012. DOI: 10.1145/2347736.2347755

A. Shhab, G. Guo & D. Neagu, A Study on Applications of Machine Learning Techniques in Data Mining, 2005. URL: http://pythia.inf.brad.ac.uk/paper/BNCODWorkshop.pdf

Leslie Pack Kaelbling, Michael L. Littman & A. W. Moore. “Reinforcement Learning: A Survey”. Artificial Intelligence Research, Vol. 4, No. pp. 237-285, 1996. DOI: 10.1.1.134.2462

R. S. Sutton &A. G. Barto. “Reinforcement Learning: An Introduction”. 1998, Cambridge, Massachusetts: The IMT Press. ISBN: 978-0262193986

INTECHOPEN. “New Advances in Machine Learning”. 2010, InTech. 374p. ISBN 978-953-307-034-6

C. Germain-Renaud, A. Cady, P. Gauron, M. Jouvin, Ch. Loomis, et al. "The Grid Observatory". IEEE Computer Society Press. IEEE/ACM International Symposium on Cluster, Cloud, and Grid Computing, May 2011, Newport Beach, United States. 2011




DOI: https://doi.org/10.21501/21454086.1517

Enlaces refback

  • No hay ningún enlace refback.




Copyright (c)

 
Directora/Editora - Ingrid Durley Torres Pardo

ISSN (En línea): 2145-4086

DOI de la revista: https://doi.org/10.21501/issn.2145-4086

Universidad Católica Luis Amigó - Transversal 51A #67B 90. Medellín - Colombia.

 


 © 2019 Universidad Católica Luis Amigó

La revista y los textos individuales que en esta se divulgan están protegidos por las leyes de copyright y por los términos y condiciones de la Licencia Creative Commons Atribución-No Comercial-Sin Derivar 4.0 Internacional. Permisos que vayan más allá de lo cubierto por esta licencia pueden encontrarse en http://www.funlam.edu.co/modules/fondoeditorial/

Derechos de autor. El autor o autores pueden tener derechos adicionales en sus artículos según lo establecido en la cesión por ellos firmada.

 

Se recomienda visualizar este contenido con los navegadores: Mozilla Firefox, Google Chrome, Safari.