El responsable del grup de Tecnologies Emergents per a la intel·ligència artificial del Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC), Jordi Torres, acaba de publicar el llibre "Introducció a l’aprenentatge per reforç profund. Teoria i pràctica en Python". El manual vol ser una guia d’iniciació per als investigadors que vulguin conèixer les bases teòriques d’aquest àrea i els proporciona coneixements pràctics a partir de la implementació de Python i una explicació detallada dels algoritmes presentats.
És el primer llibre en espanyol sobre aquest àrea. “La complexitat d’aquesta àrea de la IA i la manca de manuals en espanyol dificultaven l’entrada d’investigadors en aquest camp”, afegeix Torres.
El líder de Tecnologies Emergents per a la intel·ligència artificial ha dividit el llibre en quatre parts. La primera tracta sobre els elements claus en l’aprenentatge per reforç. A la segona es presenten els algoritmes fonamentals, que són la base dels algorismes actuals. A la tercera part, l’investigador del BSC fa un repàs als conceptes bàsics de l’aprenentatge profund i introdueix una versió pràctica mitjançant la llibreria PyTorch. En la quarta part, es presenta com l’aprenentatge profund ha fet ressorgir l’interès per l’aprenentatge per reforç i com es poden implementar aquests algoritmes amb noves llibreries que estan canviat l’escenari. Finalment el llibre acaba amb una reflexió de l’autor sobre la responsabilitat dels programadores d’aquests algoritmes perquè compleixin certs principis ètics i legals que en previnguin un ús indegut.
“Aquest llibre és una excel·lent introducció a la teoria i a les aplicacions de l'aprenentatge per reforç i hauria de servir com a base sòlida per als seus avenços en aquest tema. Espero que aquest llibre no només serveixi com una introducció a la comunitat i als problemes ja establerts, sinó que també sigui útil per anar més enllà i aprofundir en aquesta àrea, ja que hi ha moltíssimes oportunitats en recerca i en aplicacions en indústria”, segueix Torres.
Tot i que sovint l'aprenentatge per reforç es descriu com una part especial de l’aprenentatge automàtic, la realitat és que està impulsant algunes de les millores més importants per a la societat. Diferents articles d’investigació recents suggereixen l’aplicació del aprenentatge per reforç en l’atenció mèdica, els sistemes educatius o les ciutats intel·ligents, entre molts altres àmbits.
Jordi Torres, que també és professor al Departament d’Arquitectura de Computadors de la Universitat Politècnica de Catalunya, ha publicat diversos llibres, entre ells alguns sobre big data, computació al núvol i intel·ligència artificial.
- Accés obert:https://torres.ai/aprendizaje-por-refuerzo/
- Versió paper: https://amazon.es/dp/B092L5XBQ9
- Versió Kindle: https://amazon.es/dp/B092L5XBQ9