链接: https://pan.baidu.com/s/1SHCeCctJEDtp-Xr3gqYvUA?pwd=xcw5 提取码: xcw5
出版社: 清华大学出版社
ISBN:9787302598794
版次:2
商品编码:13100153
品牌:清华大学
包装:平装
开本:16开
出版时间:2022-03-01
用纸:胶版纸
编辑推荐
《现代数据科学(R语言●第2版)》是面向本
科生的综合性数据科学教材,通过结合使用统计
和计算方式来解决现实中的数据问题。本书不
仅专注于案例或编程语法,还讲述如何利用
R/RStudio计算环境中的统计编程,从各种数据中
提取有意义的信息,进而解决重大问题。
内容简介
本书对上一版做了全面更新,与日益强大的tidyverse套包保持同步,纳入sf、purrr、tidymodels和tidytext等包中的新功能。代码的内容和格式都经过修改,以方便阅读和理解。部分
章节被拆分、重新组织和重新构思,以适应不断变化的实践环境。
作者简介
Benjamin S. Baumer是美国史密斯学院统计与数据科学专业的副教授。Benjamin 于2004年成为纽约大都会队第一位全职统计分析师,此后一直担任应用数据科学家。Benjamin曾荣获美国棒球研究学会颁发的2019年Waller教育奖和2016年突出贡献者奖,参与撰写了TheSabermetric Revolution-书。
Daniel T. Kaplan是美国玛卡莱斯特学院数学和计算机科学系的名誉教授,是多本统计建模和统计计算教科书的作者。Daniel获 得2006年玛卡莱斯特学院卓越教学奖和2017年终身成就奖。
Nicholas J. Horton是美国阿默斯特学院统计和数据科学系的教授,是ASA和AAAS的高级会员,美国国家科学院应用与理论统计委员会的联合主席,多项美国国家教学奖的获得者,一系列统计计算书籍的作者,并积极参与编写数据科学课程,帮助学生“用数据思考"。
精彩书评
“第2版还是那么棒!我讲授的R计算和数据科学课程都选用了本书;对于另外几门课程,我也极力推荐将本书用作补充资料。我还准备将本书作为R入门课程和其他统计课程的用书。学生们可在本书指导下,学会用R处理数据。”
——加州理工大学Hunter Glanz
“练习和示例都是精选的,理解起来并不难,启发性强。呈现了许多问题、实践活动和数据集,以帮助学生练习技能。”
——圣克劳德州立大学Lynn Collen
“几年前, 我将本书第1版选作中级 数据科学课程的主教材。我非常喜欢和认可本书.....我认为它的技术广度、写作风格和难度水平都有非常显著的优势,所有这些使得本书脱颖而出。我和学生们发现,tidyverse方法特别适于讲授和学习R语言,书中的代码非常完整、严谨。学生可编写他们在书中看到的所有程序,品味书中穿插的提示和技巧,并将其运用于实践中。”
——宾夕法尼亚州立大学Matthew Beckman
来自于第1版的评论:
“本书示例丰富,语言简洁有力,结构清晰,我从中深刻领悟了数据科学课程与应用统计学课程的区别。”
——美国统计学家
目录
第Ⅰ部分 数据科学简介
第1章 序言:为什么有数据科学? 2
1.1 数据科学是什么 3
1.2 案例学习:棒球资料统计分析
的演变 5
1.3 数据集 6
1.4 扩展资源 7
第2章 数据可视化 8
2.1 2012年联邦大选周期 8
2.1.1 这两组数据有区别吗? 10
2.1.2 图形变化 11
2.1.3 检查变量之间的关系 12
2.1.4 网络 14
2.2 组成数据图形 15
2.2.1 数据图形分类 15
2.2.2 颜色 17
2.2.3 剖析数据图形 19
2.3 数据图形的重要性:
挑战者号 21
2.4 创建有效的演示 25
2.5 更广阔的数据可视化世界 25
2.6 扩展资源 27
2.7 练习题 28
2.8 附加练习 29
第3章 图形语法 30
3.1 数据图形语法 30
3.1.1 画面 31
3.1.2 刻度 33
3.1.3 指南 35
3.1.4 方面 35
3.1.5 层次 36
3.2 R中的规范数据图形 38
3.2.1 单变量显示 38
3.2.2 多元显示 40
3.2.3 地图 46
3.2.4 网络 46
3.3 扩展示例:历史婴儿名字 47
3.3.1 至今仍活着的人口的
百分比 48
3.3.2 最普通的女性名字 53
3.4 扩展资源 56
3.5 练习题 56
3.6 附加练习 58
第4章 在一张表中整理数据 59
4.1 数据整理语法 59
4.1.1 select()和filter() 59
4.1.2 mutate(