全新正版图书 数据科学实战入门 使用Python和R [Data Science尚塔尔··拉罗斯清华大学出版社9787302553793人天图书专营店 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
全新正版图书 数据科学实战入门 使用Python和R [Data Science尚塔尔··拉罗斯清华大学出版社9787302553793人天图书专营店电子书下载地址
- 文件名
- [epub 下载] 全新正版图书 数据科学实战入门 使用Python和R [Data Science尚塔尔··拉罗斯清华大学出版社9787302553793人天图书专营店 epub格式电子书
- [azw3 下载] 全新正版图书 数据科学实战入门 使用Python和R [Data Science尚塔尔··拉罗斯清华大学出版社9787302553793人天图书专营店 azw3格式电子书
- [pdf 下载] 全新正版图书 数据科学实战入门 使用Python和R [Data Science尚塔尔··拉罗斯清华大学出版社9787302553793人天图书专营店 pdf格式电子书
- [txt 下载] 全新正版图书 数据科学实战入门 使用Python和R [Data Science尚塔尔··拉罗斯清华大学出版社9787302553793人天图书专营店 txt格式电子书
- [mobi 下载] 全新正版图书 数据科学实战入门 使用Python和R [Data Science尚塔尔··拉罗斯清华大学出版社9787302553793人天图书专营店 mobi格式电子书
- [word 下载] 全新正版图书 数据科学实战入门 使用Python和R [Data Science尚塔尔··拉罗斯清华大学出版社9787302553793人天图书专营店 word格式电子书
- [kindle 下载] 全新正版图书 数据科学实战入门 使用Python和R [Data Science尚塔尔··拉罗斯清华大学出版社9787302553793人天图书专营店 kindle格式电子书
寄语:
正版图书保证质量 七天无理由退货让您购物无忧
内容简介:
《数据科学实战入门 使用Python和R》一书将使你深入了解数据科学最流行的两大开源平台:Python和R。
当前数据科学非常热门。Python和R是世界更流行的两个开源数据科学工具。在本书中,你将逐步学习如何使用更先进的技术,针对现实世界的业务问题提供切实可行的解决方案。
本书为没有数据分析和编程经验的读者编写。第1章专门为初学者讲解Pyhton和R的基础知识。此后的每一章都提供了使用Python和R解决数据科学问题的分步说明和实践演练。
对于那些有数据分析经验的读者而言,他们将一站式学习如何使用Python和R进行数据科学实践。本书的主题涵盖数据准备、探索性数据分析、准备建模数据、决策树、模型评估、错误分类代价、朴素贝叶斯分类、神经网络、聚类、回归建模、降维和关联规则挖掘。此外,本书还包含一些令人兴奋的新主题,如随机森林和广义线性模型。
本书在每章的结尾提供了大量的练习,共有500多道习题。通过实践性的分析习题,读者将能轻松应对使用真实数据集解决有趣业务问题的挑战。
内容组织
《数据科学实战入门 使用Python 和R》一书基于数据科学方法论进行内容的组织。数据科学方法是一种在科学框架体系内进行数据分析的阶段性、自适应和迭代式方法。
1. 问题理解阶段。首先,需要清晰地阐明项目目标;然后将这些目标转化为一种可以用数据科学解决的问题。
2. 数据准备阶段。数据清洗/准备阶段很可能是整个数据科学处理过程中最费力气的阶段。
● 相关内容参见第3 章:“数据准备”。
3. 探索性数据分析阶段。在此阶段通过图形化探索方法获得对数据的初步认识。
● 相关内容参见第4 章:“探索性数据分析”。
4. 设置阶段。建立数据模型的性能基准,如果需要,可以对数据进行分割和平衡处理。
● 相关内容详见第5 章:“为建模数据做准备”。
5. 建模阶段。建模阶段是数据科学研究过程的核心,在此阶段应用各种先进的算法来发现隐藏在数据中的一些确实具有价值的关系。
● 相关内容参见第6 章以及第8~14 章。
6. 评估阶段。确定设计的模型是否有价值,在此阶段需要从一系列可选的模型中选择性能更佳的模型。
● 相关内容参见第7 章:“模型评估”。
7. 部署应用阶段。在此阶段需要与管理层协作来调整模型以适应实际部署。
书籍目录:
第1章 数据科学导引 1
1.1 为何学科学 1
1.2 何为数据科学 1
1.3 数据科学方 2
1.4 数据科学任务 5
1.4.1 描述 5
1.4.2 估计 6
1.4.3 分类 6
1.4.4 聚类 6
1.4.5 预测 6
1.4.6 关联 7
1.5 7
第2章 Python和R语言基础 9
2.1 下载Python 9
2.2 Python编程基础 10
2.2.1 在Python中使用注释 10
2.2.2 在Python中执行命令 11
2.2.3 在Python中导入软 11
2.2.4 将数据引入Python 12
2.2.5 在Python中保存输出 13
2.2.6 访问Python中的记录和变量 14
2.2.7 在Python中设置图形 16
2.3 下载R和RStudio 18
2.4 R语言编程基础 19
2.4.1 在R中使用注释
2.4.2 在R中执行命令
2.4.3 在R中导入软
2.4.4 将数据导入R 21
2.4.5 在R中保存输出 23
2.4.6 在R中访问记录和变量 24
2.5 26
第3章 数据准备 29
3.1 银行营销数据集 29
3.2 问题理解阶段 29
3.2.1 明确阐明项目目标 29
3.2.2 将这些目标转化为数据科学问题 30
3.3 数据准备阶段 30
3.4 添加索引字段 31
3.4.1 如何使用Python添加索引字段 31
3.4.2 如何使用R添加索引字段 32
3.5 更改误导字段值 33
3.5.1 如何使用Python更改误导字段值 33
3.5.2 如何使用R更改误导字段值 35
3.6 将分类数据重新表示为数字 36
3.6.1 如何使用Python重新表达分类字段值 37
3.6.2 如何使用R重新表达分类字段值 38
3.7 标准化数字字段 39
3.7.1 如何使用Python标准化数字字段 40
3.7.2 如何使用R标准化数字字段 40
3.8 识别异常值 40
3.8.1 如何使用Python识别异常值 41
3.8.2 如何使用R识别异常值 42
3.9 43
第4章 探索数据分析 47
4.1 EDA对比HT 47
4.2 叠加了response的条形图 47
4.2.1 如何使用Python构建叠加的条形图 49
4.2.2 如何使用R构建叠加的条形图 50
4.3 列联表 51
4.3.1 如何使用Python构建列联表 52
4.3.2 如何使用R构建列联表 53
4.4 叠加有响应的柱状图 54
4.4.1 如何使用Python构建叠加柱状图 55
4.4.2 如何使用R构建叠加柱状图 58
4.5 基于预测值的分箱 59
4.5.1 如何使用Python基于预测值执行分箱 61
4.5.2 如何使用R基于预测值执行分箱 63
4.6 64
第5章 为建模数据做准备 69
5.1 迄今完成的任务 69
5.2 数据分区 69
5.2.1 如何使用Python对数行分区 70
5.2.2 如何使用R对数行分区 71
5.3 验证数据分区 72
5.4 平衡训练数据集 73
5.4.1 如何使用Python平衡训练数据集 73
5.4.2 如何使用R平衡训练数据集 75
5.5 建立模型能基准 76
5.6 78
第6章 决策树 81
6.1 决策树简介 81
6.2 分类与回归树 83
6.2.1 如何使用Python构建CART决策树 83
6.2.2 如何使用R构建CART决策树 86
6.3 用于构建决策树的C5.0算法 88
6.3.1 如何使用Python构建C5.0决策树 89
6.3.2 如何使用R构建C5.0决策树 90
6.4 森林 91
6.4.1 如何使用Python构建森林 92
6.4.2 如何使用R构建森林 92
6.5 93
第7章 模型评估 97
7.1 模型评估简介 97
7.2 分类评价措施 97
7.3 灵敏度和特异度 99
7.4 度、召回率和Fβ分数 99
7.5 模型评估方法 100
7.6 模型评估的应用示例 100
7.7 说明不对称的错误成本 104
7.8 比较考虑和不考虑不相等错误成本的模型 106
7.9 数据驱动的错误成本 107
7.10 110
第8章 朴素贝叶斯分类 113
8.1 朴素贝叶斯简介 113
8.2 贝叶斯定理 113
8.3 大化后验假设 114
8.4 分类条件独立 114
8.5 朴素贝叶斯分类的应用 115
8.5.1 Python中的朴素贝叶斯 1
8.5.2 R中的朴素贝叶斯 123
8.6 126
第9章 神经网络 129
9.1 神经网络简介 129
9.2 神经网络结构 129
9.3 连接权重和组合函数 131
9.4 sigmoid激活函数 133
9.5 反向传播 133
9.6 神经网络模型的应用 134
9.7 解释神经网络模型中的权重 136
9.8 如何在R中使用神经网络 137
9.9 138
第10章 聚类 141
10.1 聚类的定义 141
10.2 k均值聚类算法简介 142
10.3 k均值聚类的应用 143
10.4 簇验证 144
10.5 如何使用Python执行k均值聚类 145
10.6 如何使用R执行k均值聚类 147
10.7 149
第11章 回归建模 151
11.1 估计任务 151
11.2 回归建模描述 151
11.3 多元回归建模的应用 152
11.4 如何使用Python执行多重回归建模 154
11.5 如何使用R执行多重回归建模 156
11.6 用于估计的模型评估 158
11.6.1 如何使用Pytho行估计模型评估 159
11.6.2 如何使用行估计模型评估 161
11.7 逐步回归 162
11.8 回归的基准模型 163
11.9 164
第12章 降维 169
12.1 降维的必要 169
12.2 多重共线 170
12.3 使用方差膨胀因子识别多重共线 173
12.3.1 如何使用Python识别多重共线 174
12.3.2 如何使用R识别多重共线 175
12.4 主成分分析 177
12.5 主成分分析的应用 178
12.6 我们应该提取多少分量 179
12.6.1 特征值准则 179
12.6.2 方差解释比例的准则 180
12.7 执行k = 4的PCA 180
12.8 主成分分析的验证 181
12.9 如何使用Pytho行主成分分析 182
12.10 如何使用行主成分分析 184
12.11 何时多重共线不是问题 187
12.12 187
第13章 广义线模型 191
13.1 广义线模型概述 191
13.2 线回归是一种广义线模型 192
13.3 作为广义线模型的逻辑回归 192
13.4 逻辑回归模型的应用 193
13.4.1 如何使用Python执行逻辑回归 194
13.4.2 如何使用R执行逻辑回归 195
13.5 泊松回归 196
13.6 泊松回归模型的应用 197
13.6.1 如何使用Python执行泊松回归 197
13.6.2 如何使用R执行泊松回归 199
13.7 199
第14章 关联规则 3
14.1 关联规则简介 3
14.2 关联规则挖掘的简单示例 3
14.3 支持度、信任度和提升度 4
14.4 挖掘关联规则 6
14.5 确认我们的指标 211
14.6 置信差准则 212
14.7 置信商准则 213
14.8 215
附录A 数据与可视化 219
作者介绍:
Chantal D. Larose博士是东康涅狄格州立大学(ECSU)统计学与数据科学的助理教授。她已经参与撰写了三本有关数据科学和预测性分析的著作,并在ECSU和纽约州立大学新帕尔兹分校(SUNY New Paltz)参与开发了数据科学相关程序。
Daniel T. Larose博士是中央康涅狄格州立大学数据科学和统计学的教授,数据科学项目主任。他在数据科学、数据挖掘、预测性分析和统计学方面出版了多本著作。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
编辑推荐
"内容组织《数据科学实战入门 使用Python 和R》一书基于数据科学方行内容的组织。数据科学方法是一种在科学框架体系行数据分析的阶段、自适应和迭代式方法。1. 问题理解阶段。首先,需要清晰地阐明项目目标;然后将这些目标转化为一种可以用数据科学解决的问题。2. 数据准备阶段。数据清洗/准备阶段很可能是整个数据科学处理过程中很费力气的阶段。 相关内容参见第3 章:“数据准备”。3. 探索数据分析阶段。在此阶段通过图形化探索方法获得对数据的初步认识。 相关内容参见第4 章:“探索数据分析”。4. 设置阶段。建立数据模型的能基准,如果需要,可以对数行分割和平衡处理。 相关内容详见第5 章:“为建模数据做准备”。5. 建模阶段。建模阶段是数据科学研究过程的核心,在此阶段应用各种的算法来发现隐藏在数据中的一些确实具有价值的关系。 相关内容参见第6 章以及第8~14 章。6. 评估阶段。确定设计的模型是否有价值,在此阶段需要从一系列可选的模型中选择能更佳的模型。 相关内容参见第7 章:“模型评估”。7. 部署应用阶段。在此阶段需要与管理层协作来调整模型以适应实际部署。"
书摘插图
书籍介绍
《数据科学实战入门 使用Python和R》一书将使你深入了解数据科学最流行的两大开源平台:Python和R。
当前数据科学非常热门。Python和R是世界更流行的两个开源数据科学工具。在本书中,你将逐步学习如何使用更先进的技术,针对现实世界的业务问题提供切实可行的解决方案。
本书为没有数据分析和编程经验的读者编写。第1章专门为初学者讲解Pyhton和R的基础知识。此后的每一章都提供了使用Python和R解决数据科学问题的分步说明和实践演练。
对于那些有数据分析经验的读者而言,他们将一站式学习如何使用Python和R进行数据科学实践。本书的主题涵盖数据准备、探索性数据分析、准备建模数据、决策树、模型评估、错误分类代价、朴素贝叶斯分类、神经网络、聚类、回归建模、降维和关联规则挖掘。此外,本书还包含一些令人兴奋的新主题,如随机森林和广义线性模型。
本书在每章的结尾提供了大量的练习,共有500多道习题。通过实践性的分析习题,读者将能轻松应对使用真实数据集解决有趣业务问题的挑战。
内容组织
《数据科学实战入门 使用Python 和R》一书基于数据科学方法论进行内容的组织。数据科学方法是一种在科学框架体系内进行数据分析的阶段性、自适应和迭代式方法。
1. 问题理解阶段。首先,需要清晰地阐明项目目标;然后将这些目标转化为一种可以用数据科学解决的问题。
2. 数据准备阶段。数据清洗/准备阶段很可能是整个数据科学处理过程中最费力气的阶段。
● 相关内容参见第3 章:“数据准备”。
3. 探索性数据分析阶段。在此阶段通过图形化探索方法获得对数据的初步认识。
● 相关内容参见第4 章:“探索性数据分析”。
4. 设置阶段。建立数据模型的性能基准,如果需要,可以对数据进行分割和平衡处理。
● 相关内容详见第5 章:“为建模数据做准备”。
5. 建模阶段。建模阶段是数据科学研究过程的核心,在此阶段应用各种先进的算法来发现隐藏在数据中的一些确实具有价值的关系。
● 相关内容参见第6 章以及第8~14 章。
6. 评估阶段。确定设计的模型是否有价值,在此阶段需要从一系列可选的模型中选择性能更佳的模型。
● 相关内容参见第7 章:“模型评估”。
7. 部署应用阶段。在此阶段需要与管理层协作来调整模型以适应实际部署。
网站评分
书籍多样性:7分
书籍信息完全性:7分
网站更新速度:9分
使用便利性:6分
书籍清晰度:8分
书籍格式兼容性:4分
是否包含广告:3分
加载速度:6分
安全性:6分
稳定性:4分
搜索功能:9分
下载便捷性:3分
下载点评
- 一星好评(605+)
- 体验满分(387+)
- 速度慢(344+)
- 收费(618+)
- 博大精深(314+)
- 下载速度快(268+)
- 体验还行(134+)
- 好评(441+)
- 方便(256+)
- 情节曲折(435+)
- 目录完整(424+)
- 还行吧(283+)
- pdf(493+)
下载评价
- 网友 菱***兰: ( 2025-01-03 06:45:51 )
特好。有好多书
- 网友 后***之: ( 2025-01-12 13:32:13 )
强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!
- 网友 权***波: ( 2025-01-14 13:31:46 )
收费就是好,还可以多种搜索,实在不行直接留言,24小时没发到你邮箱自动退款的!
- 网友 融***华: ( 2025-01-03 21:37:31 )
下载速度还可以
- 网友 相***儿: ( 2024-12-24 04:32:16 )
你要的这里都能找到哦!!!
- 网友 习***蓉: ( 2024-12-25 20:41:11 )
品相完美
- 网友 屠***好: ( 2025-01-14 18:26:54 )
还行吧。
- 网友 沈***松: ( 2025-01-17 11:19:01 )
挺好的,不错
- 网友 林***艳: ( 2024-12-31 07:42:35 )
很好,能找到很多平常找不到的书。
- 网友 瞿***香: ( 2025-01-07 07:49:14 )
非常好就是加载有点儿慢。
- 网友 宫***玉: ( 2025-01-03 14:55:06 )
我说完了。
- 网友 蓬***之: ( 2025-01-10 11:42:11 )
好棒good
- 网友 潘***丽: ( 2025-01-12 00:25:41 )
这里能在线转化,直接选择一款就可以了,用他这个转很方便的
- 网友 温***欣: ( 2025-01-03 05:21:13 )
可以可以可以
- 网友 苍***如: ( 2025-01-16 04:22:55 )
什么格式都有的呀。
- 网友 居***南: ( 2024-12-24 00:19:09 )
请问,能在线转换格式吗?
喜欢"全新正版图书 数据科学实战入门 使用Python和R [Data Science尚塔尔··拉罗斯清华大学出版社9787302553793人天图书专营店"的人也看了
- 建筑工程CAD案例教程 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 深海声学与探测技术 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 物理化学 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 物理化学学习指导 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 2010:太空漫游 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 流金岁月(古人的广告生活) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 巧克力和泡泡糖 大连出版社 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- Francis Newton Souza: Bridging Western and Indian Modern Art 弗兰西斯 牛顿 索萨 建立西方与印度现代艺术的桥梁 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 大湘西生态文化旅游地图集 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 9787115362025 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
书籍真实打分
故事情节:3分
人物塑造:6分
主题深度:4分
文字风格:7分
语言运用:8分
文笔流畅:7分
思想传递:5分
知识深度:8分
知识广度:7分
实用性:4分
章节划分:6分
结构布局:7分
新颖与独特:3分
情感共鸣:9分
引人入胜:4分
现实相关:9分
沉浸感:8分
事实准确性:8分
文化贡献:9分