墨海书舟 -R语言
本书资料更新时间:2025-01-20 19:58:38

R语言 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线

R语言精美图片
》R语言电子书籍版权问题 请点击这里查看《

R语言书籍详细信息

  • ISBN:9787302494324
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2018-12
  • 页数:暂无页数
  • 价格:44.10
  • 纸张:胶版纸
  • 装帧:平装-胶订
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分
  • 豆瓣短评:点击查看
  • 豆瓣讨论:点击查看
  • 豆瓣目录:点击查看
  • 读书笔记:点击查看
  • 原文摘录:点击查看
  • 更新时间:2025-01-20 19:58:38

寄语:

本书分为基础篇、应用篇和进阶篇。注重实践;注重数据变成价值;注重大数据的分析。


内容简介:

近年来,R语言可谓是数据分析的热门语言,相关的资料五花八门,让读者难以抉择。本书力求用简洁、精练,以理论与实践相结合的方式让大家快速掌握R语言。

全书共14章,第1章为绪论,从数学、统计学和逻辑学3个方面探讨了树立正确数据思维的一些原则;其余各章分为基础篇(第2~10章)、应用篇(第11、12章)和进阶篇(第13、14章)。基础篇按照数据分析过程,主要讨论了R的数据结构、数据导入/导出、数据清洗、数据变换、可视化、高级语言编程和常用建模方法。应用篇通过对2个经典案例的分析,使读者能够把学到的R基础知识应用到解决实际问题,把数据变成价值。进阶篇解决如何用R处理大数据的一些技术。

本书可用作培养应用型人才的课程教材,也可作为数据分析爱好者的参考资料。


书籍目录:

第1章  绪论

1.1  为什么学习R语言 1

1.1.1  R是什么 1

1.1.2  R语言主要优势 2

1.2  正确的数据思维观 4

1.2.1  数学思维 5

1.2.2  统计思维 5

1.2.3  逻辑思维 10

习题 12

基础篇

第2章  R语言入门

2.1  新手上路 17

2.1.1  两个例子 17

2.1.2  R是什么 19

2.2  R语言开发环境部署 19

2.2.1  安装R 19

2.2.2  安装RStudio 20

2.3  获取帮助 22

2.3.1  文档和搜索 22

2.3.2  演示 22

2.3.3  帮助函数 23

2.4  工作空间 23

2.5  脚本 24

2.6  R包 25

习题 25

第3章  数据类型

3.1  变量与常量 27

3.1.1  变量 27

3.1.2  常量 28

3.2  结构类型 28

3.2.1  向量 29

3.2.2  矩阵 31

3.2.3  数组 33

3.2.4  数据框 35

3.2.5  因子 36

3.2.6  列表 37

3.3  字符串操作 38

3.3.1  基本操作 38

3.3.2  字符串处理stringr包 39

3.4  用于数据处理和转换的常用函数 40

习题 41

第4章  数据准备

4.1  数据导入 43

4.1.1  键盘输入数据 44

4.1.2  导入文本文件 45

4.1.3  导入Excel数据 46

4.1.4  导入数据库文件 47

4.2  数据导出 48

4.2.1  导出文本文件 48

4.2.2  保存图片 49

习题 49

第5章  数据可视化

5.1  低水平绘图命令 51

5.1.1  点 51

5.1.2  线 54

5.1.3  面 56

5.2  高水平绘图命令 59

5.2.1  认识ggplot2 59

5.2.2  几何对象 59

5.2.3  映射 60

5.2.4  统计对象 62

5.2.5  标度 63

5.2.6  分面 65

5.2.7  其他修饰 67

5.3  交互式绘图命令 69

5.3.1  rCharts包 69

5.3.2  plotly包 70

5.3.3  shiny 72

习题 80

第6章  数据探索

6.1  缺失值分析 82

6.1.1  与缺失值相关的几个概念 82

6.1.2  缺失值检测 83

6.2  异常值分析 84

6.2.1  箱线图检验离群点 85

6.2.2  散点图检测离群点 86

6.2.3  LOF方法检测异常值 87

6.2.4  聚类方法检测异常值 87

6.3  不一致值分析 88

6.4  数据的统计特征分析 88

6.4.1  分布分析 88

6.4.2  对比分析 90

6.4.3  统计量分析 91

6.4.4  周期性分析 93

6.4.5  相关性分析 94

习题 97

第7章  数据变换

7.1  数据清洗 100

7.1.1  缺失数据处理 100

7.1.2  数据去重 101

7.1.3  规范化 102

7.2  数据选择 103

7.2.1  删除有75%以上相同数值的自变量 103

7.2.2  删除高相关性的自变量 104

7.2.3  重要变量的选择 105

7.2.4  数据集选择 106

7.2.5  主成分分析 106

7.2.6  因子分析 108

7.3  数据集成 109

7.3.1  通过向量化重构数据 109

7.3.2  为数据添加新变量 110

7.3.3  数据透视表 112

7.3.4  频度 117

7.3.5  数据整合 118

7.3.6  分组汇总 121

习题 124

第8章  高级编程

8.1  控制结构 126

8.1.1  选择结构程序设计 126

8.1.2  循环结构程序设计 127

8.2  用户自定义函数 128

习题 129

第9章  数据建模

9.1  Rattle包 132

9.2  聚类模型 139

9.2.1  背景 139

9.2.2  K-Means聚类 139

9.2.3  Ewkm聚类 142

9.2.4  层次聚类(Hierachical) 144

9.2.5  双向聚类(BiCluster) 146

9.3  关联分析模型 147

9.3.1  背景 147

9.3.2  基本术语 148

9.3.3  关联规则的分类 149

9.3.4  Apriori算法 150

9.3.5  实验指导 151

9.4  传统决策树模型 153

9.4.1  背景 153

9.4.2  ID3算法 155

9.4.3  C4.5算法 156

9.4.4  实验指导 156

9.5  随机森林决策树模型 159

9.5.1  背景 159

9.5.2  随机森林算法 159

9.5.3  实验指导 161

9.6  自适应选择决策树模型 164

9.6.1  背景 164

9.6.2  Boosting算法 164

9.6.3  adaboost算法 165

9.6.4  实验指导 165

9.7  SVM 169

9.7.1  背景 169

9.7.2  SVM算法 169

9.7.3  实验指导 172

9.8  线性回归模型 173

9.8.1  背景 173

9.8.2  一元线性回归方法 173

9.8.3  实验指导 175

9.9  神经网络模型 175

9.9.1  背景 175

9.9.2  人工神经网络模型 176

9.9.3  实验指导 179

习题 181

第10章  模型评估

10.1  数据集 185

10.2  混淆矩阵 186

10.2.1  二分类混淆矩阵 186

10.2.2  模型评价指标 187

10.2.3  多分类混淆矩阵 188

10.3  风险图 188

10.3.1  风险图的作用 188

10.3.2  实验指导 189

10.4  ROC曲线 191

10.4.1  什么是ROC曲线 191

10.4.2  ROC曲线作用 191

10.4.3  实验指导 191

习题 193

应用篇

第11章  影响大学平均录取分数线因素分析

11.1  背景与目标 197

11.2  数据说明 197

11.3  描述性分析 200

11.4  总结与建议 203

第12章  收视率分析

12.1  背景介绍 204

12.2  数据说明 204

12.3  描述性分析 205

12.4  总结与建议 211

进阶篇

第13章  RHadoop

13.1  认识RHadoop 215

13.1.1  为什么要让Hadoop结合R语言 215

13.1.2  Mahout与R在做数据挖掘的区别 216

13.2  RHadoop安装 216

13.2.1  依赖包安装 216

13.2.2  RHadoop的特点 219

13.3  综合练习 220

习题 225

第14章  SparkR

14.1  认识SparkR 228

14.1.1  安装SparkR 228

14.1.2  在R或Rstudio中调用SparkR 228

14.2  SparkDataFrame 229

14.3  SparkR支持的机器学习算法 230

14.4  综合练习 230

14.4.1  加载数据 230

14.4.2  SparkDataFrame基本操作 231

14.4.3  从Spark上运行SQL查询 233

14.4.4  SparkR操作hdfs上的文件 233

14.4.5  通过SparkR操作spark-sql以hive的表为对象 234

习题 234

参考文献

附录  大数据和人工智能实验环境


作者介绍:

李法平- 副教授/系统分析师,硕士,重庆电子工程职业学院软件学院移动应用开发教研室主任,主要从事高职软件类专业教学研究、教育信息化系统和企业信息化系统等应用技术研究。


出版社信息:

暂无出版社相关信息,正在全力查找中!


书籍摘录:

暂无相关书籍摘录,正在全力查找中!


在线阅读/听书/购买/PDF下载地址:

在线阅读地址:R语言在线阅读

在线听书地址:R语言在线收听

在线购买地址:R语言在线购买


原文赏析:

红绿灯游戏

当一个孩子意识到自己正在失去理智,感到压力、恐惧、焦虑、悲伤或者慌乱时,他就举红色的卡片。

其他人不能出现在他方圆2米的范围内,这个孩子想自己静一静。

当一个孩子觉得压力缓解时,举黄色的卡片。

当他觉得自己回归常态时,举绿色的卡片。

老师会带着学生进行游戏。首先,学生应该意识到情绪是自己产生的,不应把它投射到屋子里的其他人身上。他可能会和他人有所互动,但他要清楚自己的情绪不可能由他人产生,要想消除不良的情绪,也得从自身入手。接下来他开始学习自我调节。

想象一下这个游戏在气氛胶着的会议室里会多么管用。一旦人们的情绪失控、怒火喷发,会议再进行下去也没有意义了,完全是时间和精力的浪费。人们钻牛角的时候就会进入战斗状态,所有的初衷都抛到九霄云外,剩下的完全是生理战争。人们失去理智,他们的记忆力下降,因为此刻涌出的皮质醇正在杀死海马体里的神经细胞,大脑供血不足、呼吸变浅,大脑处于缺氧状态,这时候他们根本想不起解决问题,一心就想打一架。

如果此刻我们能够意识到自己的失态,举出红色卡片或者是白旗,告诉所有人说:“会议结束,我现在要发疯了,等我冷静下来再开会吧。”这样多好。要是所有人都知道自己携带着定时炸弹(坏情绪),同时知道如何平息怒火,那人类可以避免多少次战争呢?如果所有人都知道“大规模杀伤性武器”就是自己,世界一定会更和平。

这个游戏真应该介绍给各国领导。每次他们怒不可遏之时,就举起红色的卡片,这样周围的人就会退避三舍,等他自己感觉平静了,再举起绿色的卡片。不知道这样的话世界会不会再也没有战争了。


通向智慧之路崎岖难行,这使我们焦虑、愤怒、恐惧、紧张和失望。我们试图把这些问题推给大环境:气候变化、穆斯林、犹太人、银行家甚至是一届届更迭的总统和首相——人名总是在变,一个接一个,全部都遭到我们的痛恨。起初我们是拥戴他们的,最后却总是会说:“都是因为他们,才搞成现在一团糟的局面。”但是我要告诉你,归根结底,是我们投的票,是我们将他们抬上宝座的。问题的根源在于我们,用混乱的心去看世界,世界也变成一团乱麻。我们的内心炮火喧嚣,永无宁日。鲍勃·吉尔道夫[1](Bob Geldof)说:“我们就是世界。”他说这句话的目的并不是为了贬斥,但我引用这句话的目的正是如此。全是我们的错,其他东西不能改变我们的方向,只有我们自己能。很多人总是想要改变世界,却从来没有想过改变自己。


有些人认为只有上山修行才能让心安住;有些人艰苦朴素、吃素、祈祷、唱圣歌,甚至与狼共舞。其实,知足常乐就够了,在我眼中最简单的方式就是坐在路边长椅上,无忧无虑地给松鼠喂食。


这不是小概率事件,1/4的人都曾遭受抑郁的折磨。他们生活在哪儿?如果你有幸不是其中一员,那么它可能会找上你的亲戚或者朋友——每个人都认识某个抑郁的朋友。


我个人最感兴趣的是科塔德综合征(行尸综合征)。患者宣称自己已经死亡。如果扫描他们的脑部图像,就能看到致病原因。患者的感觉与大脑中控制情感的部分失去联系,他们对任何情感都没有共鸣,于是他们与现实生活相隔绝。所以这些人认为自己已经死亡。如果你用针刺破他们的皮肤,他们会惊讶地看到自己还会流血,但随即坚称死人也会流血。一百年前,这些患者会被当成疯子甚至处以火刑。


这些“普拉提太太”时常抱怨自己的丈夫忙得夜不归宿,没有人帮她照顾小孩,所以只好把孩子放在高级寄宿学校,这些学校只接受高智商儿童。我试着劝过她们(不过徒劳无功)。婚姻就是一场“公平的交易”。为了便于理解,我还为她们画过简单的分析图。我说:

“假如你的丈夫年收入超过15万英镑,再加上奖金,那么你作为他的太太,就没有一点话语权了。你就需要好好地相夫教子;在他需要性爱的时候,不管时间和地点,你都要满足他。另外,你必须保持姣好的身材和年轻的状态,直到死去的那一天。”

“假如你的丈夫年收入7.5万英镑,那你仍然需要好好地相夫教子,只不过每周你有27小时的时间可以在闺蜜面前抱怨他。如果他周末也不帮你分担家务,你有权不满足他的性要求。”

“假如你的丈夫年收入低于1万英镑,那就让相夫教子见鬼去吧。”

以上假设都建立在丈夫一人养家的前提下。反过来,如果是妻子一人养家,比方说她一年挣15万英镑(相当于男人挣了57.5万英镑),到头来做家务的还是她。从进化论的角度而言,男人没有观察细节的天性,他们根本注意不到地毯上的脚印。但是男人有一项重要技能,那就是站在大地上,望着远处的地平线,判断那里是否活动着牛羚。


其它内容:

编辑推荐

该书深入浅出地介绍 R 语言在大数据分析应用中的相关知识及编程。                                                                                                                     基础篇:讨论数据处理的R环境,包括R数据结构(数据框、列表等)、数据导入/导出、数据清洗(处理数据的缺失值、不一致、异常值)、数据变换(汇总、集成、透视表、规约等)、可视化、高级语言编程、数据分析常用建模方法和原理,涵盖了目前数据挖掘的主要算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式,利用可视化数据挖掘包Rattle进行试验指导。

应用篇:讨论2个经典的数据分析报告案例,通过案例分析使读者能够把学到的R基础知识应用到解决实际问题中,把数据变成价值。

进阶篇:解决R语言在处理大数据时性能低下的问题,讨论了两个R包:RHadoop、SparkR。                                                                                         本书注重实践;注重数据变成价值;注重大数据的分析。


前言

随着数据分析的需求不断提升,Excel渐渐无法满足价值挖掘的日常需求,需要更专业化的软件做数据分析。相应的问题就来了,统计学软件那么多,SPSS、R、Python、SAS、JMP、Matlab等,该选哪一个?目前市场上较为火热的软件是R和Python。

开源软件的R能够迅速发展,很大程度上取决于其活跃的社区和各种R包的使用。截至目前(2017年2月25日),CRAN(Comprehensive R Archive Network)上已经有10162个可以获取的R扩展包,内容涉及各行各业,可以适用于各种复杂的统计。

数据科学者的工作就是操纵数据,把原始数据加工成建模需求的形状,而R语言是帮你实现整理数据的的工具。   

该书深入浅出地介绍 R 语言在大数据分析应用中的相关知识,全书分为绪论(第1章)、基础篇、应用篇和进阶篇。基础篇(第2~10章)学习如何用 R 完成数据处理,包括数据准备、数据探索、数据变换、数据可视化和数据建模等;应用篇(第11、12章)学习如何用R完成实际的数据分析报告撰写,包括背景与目标、指标设计、描述性分析、模型分析和结论与建议;进阶篇(第13、14章)学习如何使用R提高大数据处理性能,包括RHadoop、SparkR。

绪论从数据、统计学和逻辑学3个方面探讨了树立正确的数据思维的一些原则。数据分析师的数据思维对于整体分析思路,甚至分析结果都有着关键性的作用。普通数据分析师与高级数据分析师的主要差异就是有正确的数据思维观。正确的数据思维观与数据敏感度有关,类似于情商类的看不见,摸不着的东西。简单来说,正确的数据思维观是一种通过数据手段解决问题的思维。

基础篇,讨论数据处理的R环境,包括R数据结构(数据框、列表等)、数据导入/导出、数据清洗(处理数据的缺失值、不一致、异常值)、数据变换(汇总、集成、透视表、规约等)、可视化、高级语言编程、数据分析常用建模方法和原理,涵盖了目前数据挖掘的主要算法,包括分类与预测、聚类分析、关联规则、智能推荐和时序模式,利用可视化数据挖掘包Rattle进行试验指导。

应用篇,讨论2个经典的数据分析报告案例,通过案例分析使读者能够把学到的R基础知识应用到解决实际问题中,把数据变成价值。

进阶篇,解决R语言在处理大数据时性能低下的问题,讨论了两个R包:RHadoop、SparkR。

本书特点如下:

(1)知识学习的重点是模型的运用而不是模型的原理。第9章既是R语言的重点也是难点,本书利用可视化数据挖掘包Rattle进行试验指导,简化了建模需要具备的数学基础,只要了解相应模型的函数,设置几个参数就可以轻松完成分类与预测、聚类分析、关联规则、智能推荐和时序模式等数据挖掘任务。  

(2)注重数据变成价值。数据分析师工作的重要一环就是写出有情报价值的数据分析报告。直接将分析结果罗列到PPT或Word中,不仅看上去不美观,而且也会影响报告的可读性,使一份数据分析报告成为简单的数据展示。本书通过案例探讨了写出一份具有情报价值的分析报告的技巧。

(3)关注大数据分析。R语言的缺点就是处理大数据的性能较低,无法直接处理TB以上的数据,本书进阶篇讨论的两个R包(RHadoop、SparkR)基本上可以处理任何级别的数据。

(4)向读者提供了书中所用的配套代码、数据及PPT,读者可通过上机实验,快速掌握书中所介绍的R语言的使用方法。

本书由程显毅、刘颖和朱倩负责编写。在本书编写过程中,孙丽丽、季国华、赵丽敏、杨琴和章小华等提供了许多参考资料,在此表示由衷的感谢。由于水平有限,书中可能会有不当之处,希望读者多加指教。本书的编写得到刘鹏教授和清华大学出版社王莉编辑的大力支持和悉心指导,在此深表感谢!

编  者  

2018年5月



书籍真实打分

  • 故事情节:4分

  • 人物塑造:4分

  • 主题深度:7分

  • 文字风格:3分

  • 语言运用:6分

  • 文笔流畅:8分

  • 思想传递:9分

  • 知识深度:3分

  • 知识广度:6分

  • 实用性:9分

  • 章节划分:6分

  • 结构布局:5分

  • 新颖与独特:9分

  • 情感共鸣:5分

  • 引人入胜:5分

  • 现实相关:4分

  • 沉浸感:3分

  • 事实准确性:6分

  • 文化贡献:7分


网站评分

  • 书籍多样性:3分

  • 书籍信息完全性:6分

  • 网站更新速度:3分

  • 使用便利性:4分

  • 书籍清晰度:8分

  • 书籍格式兼容性:9分

  • 是否包含广告:6分

  • 加载速度:6分

  • 安全性:3分

  • 稳定性:7分

  • 搜索功能:5分

  • 下载便捷性:8分


下载点评

  • 内容完整(239+)
  • 体验还行(583+)
  • 微信读书(114+)
  • 少量广告(249+)
  • 愉快的找书体验(190+)
  • 已买(485+)
  • 博大精深(557+)
  • 五星好评(583+)
  • 好评(602+)
  • 无多页(597+)
  • mobi(590+)

下载评价

  • 网友 马***偲: ( 2025-01-09 09:18:08 )

    好 很好 非常好 无比的好 史上最好的

  • 网友 屠***好: ( 2024-12-23 17:34:48 )

    还行吧。

  • 网友 饶***丽: ( 2025-01-01 21:50:43 )

    下载方式特简单,一直点就好了。

  • 网友 冯***卉: ( 2025-01-13 12:03:10 )

    听说内置一千多万的书籍,不知道真假的

  • 网友 方***旋: ( 2024-12-21 14:34:46 )

    真的很好,里面很多小说都能搜到,但就是收费的太多了

  • 网友 詹***萍: ( 2024-12-30 04:24:23 )

    好评的,这是自己一直选择的下载书的网站

  • 网友 相***儿: ( 2025-01-03 06:43:23 )

    你要的这里都能找到哦!!!

  • 网友 戈***玉: ( 2024-12-24 09:18:00 )

    特别棒

  • 网友 沈***松: ( 2024-12-29 14:08:53 )

    挺好的,不错

  • 网友 游***钰: ( 2025-01-12 15:32:50 )

    用了才知道好用,推荐!太好用了


随机推荐