链接: https://pan.baidu.com/s/1AwYbLS0XPAgx6U3Ab4EkXA?pwd=c9gm 提取码: c9gm
出版社: 电子工业出版社
ISBN:9787121295164
版次:2
商品编码:12696004
品牌:电子工业出版社
包装:平装
外文名称:Reinforcement Learning
开本:16开
出版时间:2019-09-01
用纸:胶版纸
页数:548
字数:705000
产品特色
编辑推荐
适读人群 :《强化学习(第2版)》适合所有对强化学习感兴趣的读者阅读、收藏。
《强化学习(第2版)》被业界公认为任何对人工智能领域感兴趣的人员的必读书。
《强化学习(第2版)》是被称为“强化学习教父”的Richard Sutton在强化学习领域的开创性、奠基性著作。自1998年第1版出版以来,一直是强化学习领域的经典导论性教材,培育了好几代强化学习领域的研究人员。
在第2版中,随着强化学习的蓬勃发展,作者补充了很多新的内容:人工神经网络、蒙特卡洛树搜索、平均收益大化……涵盖了当今关键的核心算法和理论。不仅如此,作者还以真实世界的应用为例阐述了这些内容。
内容简介
《强化学习(第2版)》作为强化学习思想的深度解剖之作,被业内公认为是一本强化学习基础理论的经典著作。它从强化学习的基本思想出发,深入浅出又严谨细致地介绍了马尔可夫决策过程、蒙特卡洛方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法,并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。
《强化学习(第2版)》适合所有对强化学习感兴趣的读者阅读、收藏。
作者简介
Richard Sutton(理查德·萨顿)
埃德蒙顿 DeepMind 公司的杰出科学家,阿尔伯塔大学计算科学系教授。他于2003年加入阿尔伯塔大学,2017年加入DeepMind。之前,曾在美国电话电报公司(AT&T)和通用电话电子公司(GTE)实验室工作,在马萨诸塞大学做学术研究。
1978年获得斯坦福大学心理学学士学位,1984年获得马萨诸塞大学计算机科学博士学位,加拿大皇家学会院士和人工智能促进会的会士。
主要研究兴趣是在决策者与环境相互作用时所面临的学习问题,他认为这是智能的核心问题。其他研究兴趣有:动物学习心理学、联结主义网络,以及能够不断学习和改进环境表征和环境模型的系统。
他的科学出版物被引用超过7万次。
他也是一名自由主义者,国际象棋选手和癌症幸存者。
Andrew Barto (安德鲁·巴图)
马萨诸塞大学阿默斯特分校信息与计算机科学学院名誉教授。1970年获得密歇根大学数学专业的杰出学士学位,并于1975年获该校计算机科学专业的博士学位。1977年他加入马萨诸塞州阿默斯特大学计算机科学系。在2012年退休之前,他带领了马萨诸塞大学的自主学习实验室,该实验室培养了许多著名的机器学习研究者。
目前担任Neural Computation (《神经计算》)期刊的副主编,Journal of Machine Learning Research (《机器学习研究》)期刊的顾问委员会成员,以及Adaptive Behavior (《自适应行为》)期刊的编委员会成员。
他是美国科学促进会的会员,IEEE(国际电子电气工程师协会)的终身会士(Life Fellow),也是神经科学学会的成员。
2004年,因强化学习领域的贡献荣获IEEE神经网络学会先锋奖,并因在强化学习理论和应用方面的开创、富有影响力的研究获得 IJCAI-17卓越研究奖;2019年获得马萨诸塞大学神经科学终身成就奖。
他在各类期刊、会议和研讨会上发表了100多篇论文,参与撰写多部图书的相关章节。
译者简介
俞凯
上海交通大学计算科学与工程系教授,思必驰公司创始人、首席科学家。清华大学自动化系本科、硕士,剑桥大学工程系博士。青年千人,国家自然科学基金委优青,上海市“东方学者”特聘教授。IEEE 高级会员,现任 IEEE Speech and Language Processing Technical Committee 委员,中国人工智能产业发展联盟学术和知识产权组组长,中国计算机学会语音对话及听觉专业组副主任。
长期从事交互式人工智能,尤其是智能语音及自然语言处理的研究和产业化工作。发表国际期刊和会议论文 150 余篇,获得Computer Speech and Language, Speech Communication 等多个国际期刊及InterSpeech等国际会议的优论文奖,所搭建的工程系统曾获美国国家标准局语音识别评测冠军,对话系统国际研究挑战赛冠军等。
获评2014“吴文俊人工智能科学技术奖”进步奖,“2016科学中国人年度人物”,2018中国计算机学会“青竹奖”。
精彩书评
We are most pleased that Professor Kai Yu has produced this Chinese translation of our textbook, which we hope will enable more Chinese students to self-study reinforcement learning and lead to the development of new ideas within China that contribute to the diversity and vigour of worldwide reinforcement learning research.
——Richard Sutton and Andrew Barto
我们非常高兴俞凯教授将我们的教材翻译成中文,希望这本教材能够帮助更多的中国学生自学强化学习,并且促进更多的新思想在中国产生,为世界范围的强化学习研究的多样性和生机活力做出贡献。
——理查德萨顿 安德鲁巴图
一代又一代的强化学习研究人员都是在萨顿和巴图的第1版书的启发下成长起来的。新老读者都将从第2版中受益:这一新版本大大扩展了覆盖的主题范围(新主题包括人工神经网络、蒙特卡洛树搜索、平均收益大化以及关于强化学习的经典应用和新应用的章节),不仅增加了内容的广度,同时作者也在尝试用更加简洁的符号理清这些繁杂主题的各个方面,从而增加讲解的深度。此外,新版本保留了解释的简洁性和直观性,使各种背景的读者都能使用本书。总之,这是一本很棒的书,我衷心推荐给那些对使用、开发或理解强化学习感兴趣的人。
——乔鲍塞派什瓦里(Csaba Szepesvari)
DeepMind研究科学家,阿尔伯塔大学计算机科学教授
本书仍然是关于强化学习的开创性教材——强化学习作为日益重要的技术,是当今许多先进的人工智能系统背后的技术基础。本书是任何对人工智能科学抱有真正兴趣的人的必读书。
——杰米斯哈萨比斯(Demis Hassabis)
DeepMind联合创始人兼首席执行官
强化学习是极具发展前景的重要机器学习范式。近年来通过与深度学习的结合,强化学习在棋类游戏、机器人控制和人机对话等领域的重大进展使得人们对它在人工智能未来发展中的作用极为关注和期待。本书是深入理解