数据分析之道
前言
内容简介
许可
建议与反馈
致谢
作者简介
1
准备工作
1.1
R 的下载和安装
1.2
RStudio 的下载和安装
1.3
配置(可选)
1.4
常见问题与方案
1.4.1
R 在 Linux 系统下的安装
1.4.2
Rtools 安装
1.4.3
RStudio Server 安装
2
基础语法
2.1
基本数据结构
2.1.1
向量
2.1.2
数组与矩阵
2.1.3
数据框
2.1.4
列表
2.2
控制结构
2.2.1
条件控制
2.2.2
循环控制
2.3
函数与函数式编程
2.3.1
创建和使用函数
2.3.2
作用域
2.3.3
任意参数
2.3.4
函数式编程
2.4
三方包的安装与加载
2.4.1
CRAN
2.4.2
Bioconductor
2.4.3
GitHub 等 Git 库
2.4.4
包使用
2.5
编程实战:ROC 曲线计算与绘制
2.5.1
背景与目标
2.5.2
代码实现
2.5.3
代码讲解
2.6
常见问题与方案
2.6.1
复数表示
2.6.2
= 与 <- 的区别
2.6.3
显式使用包函数时 :: 与 ::: 的区别
2.6.4
因子重构
2.6.5
理解 R 计算
3
数据导入
3.1
符号分隔文件
3.1.1
CSV
3.1.2
TSV 与其他 CSV 变体
3.2
Excel
3.3
JSON
3.4
R 数据文件
3.4.1
RData
3.4.2
RDS
3.5
常见问题与方案
3.5.1
通过键盘和剪贴板载入数据
3.5.2
逐行读取数据
3.5.3
读取等宽格式数据
4
数据清洗
4.1
向量
4.2
单个数据集
4.2.1
选择列
4.2.2
过滤行
4.2.3
新增列
4.2.4
聚合运算
4.2.5
分组计算
4.2.6
缺失值填充
4.3
两个数据集
4.4
多个数据集
4.5
常见问题与方案
5
数据可视化
常见问题与方案
6
统计建模
常见问题与方案
7
结果展示
7.1
图形
7.2
表格
7.2.1
Excel
7.3
RMarkdown
7.4
Shiny
7.5
常见问题与方案
7.5.1
export 包:集才华与一身
8
生物信息学应用
附录
A
速查表
A.1
数值计算函数
A.2
模型符号与函数
A.3
统计分析与检验
B
拓展阅读
B.1
生信技能树语雀知识库
B.2
图书
B.2.1
问题与方案
B.2.2
统计建模
B.2.3
核心集合
B.2.4
生物信息学
B.2.5
R
B.3
视频
B.4
公众号
B.5
其他资料
参考文献
极客R:数据分析之道
B
拓展阅读
呐,到这里本教程的内容差不多写完了。下面是一些推荐的学习资料,希望能够帮到想要进一步学习的读者。 大部分的资料是英文的,大家一定要根据自己的实际情况选择合适的资料,建立切实可行的学习计划。
B.1
生信技能树语雀知识库
生物信息入门需要了解的十个专题
生物统计从理论到实践
肿瘤外显子数据分析指南
TCGA数据分析指南
生信菜鸟团-每周文献分享
B.2
图书
B.2.1
问题与方案
Cookbook for R 中文版
B.2.2
统计建模
Data Science Live Book
Statistical Inference via Data Science - A ModernDive into R and the tidyverse
B.2.3
核心集合
R for Data Science
Anvanced R
R Packages
B.2.4
生物信息学
生物信息学生 R 入门教程
B.2.5
R
R 语言教程
统计计算
B.3
视频
生信技能树 B 站视频集
B.4
公众号
生信菜鸟团
生信技能树
biobabble
优雅R
B.5
其他资料
Jimmy - GEO 流程
Jimmy - NGS 流程