Anchoret

Choose You Own Path


  • 首页

  • 分类

  • 关于

  • 归档

  • 标签

  • 站点地图

  • 公益404

  • 搜索

创建R包学习教程

发表于 2018-01-16 | 分类于 R |

Github地址:https://github.com/ShixiangWang/learn-devel-Rpkg

内容源自《R实战》第二版,酌情删改。

写在阅读之前

如果你想要的是快速构建R包骨架,推荐阅读在巨人的肩膀前行 催化R包开发进行学习;如果你想了解更为基本的R包创建知识和过程,推荐阅读开发自己的R包sayHello、谢益辉写的编写R包章节以及本文创建包的文档和建立包章节。阅读一篇文档就想写好R包是远远不够的,还需要不断地实战和理解,才能融会贯通。不仅如此,一些函数和文档写法、技巧也是值得学习的,这正是本文的价值所在。

Let’s begin!

阅读全文 »

初识sed与awk

发表于 2017-12-25 | 分类于 Linux |

学习内容:

  • 学习sed编辑器
  • gawk编辑器入门
  • sed编辑器基础

shell脚本最常见的一个用途就是处理文本文件,但仅靠shell脚本命令来处理文本文件的内容有点勉为其难。如果我们想在shell脚本中处理任何类型的数据,需要熟悉Linux中的sed和gawk工具。这两个工具可以极大简化我们需要进行的数据处理任务。

阅读全文 »

重复计算研究的十条简单规则

发表于 2017-12-19 | 分类于 bioinformatics |

文献来源:Ten Simple Rules for Reproducible Computational Research

我们在这里提出针对计算分析研究重复性的十条简单规则。这些规则的使用可以根据自己的研究情况进行调整。

阅读全文 »

学习git

发表于 2017-12-08 | 分类于 Linux |

纯属搬砖操作,资料来源《Github入门与实战》,这本书的重要信息也就这些了,需要的时候找一找。

书上提到的一个学习网站https://learngitbranching.js.org/非常棒,线上学习。

阅读全文 »

使用shell创建文本菜单和窗口部件

发表于 2017-11-29 | 分类于 Linux |

来源: Linux命令行与shell脚本编程大全

内容:

  • 创建文本菜单
  • 创建文本窗口部件
  • 添加X Window图形

创建文本菜单

创建交互式shell脚本最常用的方法是使用菜单,它提供了各种选项帮助脚本用户了解脚本能做到的和不能做的。

shell脚本菜单的核心是case命令,该命令会根据用户在菜单上的选择来执行特定命令。

下面我们逐步了解和创建基于菜单的shell脚本的步骤。

阅读全文 »

创建和使用shell函数

发表于 2017-11-26 | 分类于 Linux |

来源: Linux命令行与shell脚本编程大全

内容

  • 基本的脚本函数
  • 返回值
  • 在函数中使用变量
  • 数组变量和函数
  • 函数递归
  • 创建库
  • 在命令行上使用函数

我们可以将shell脚本代码放进函数中封装起来,这样就能在脚本中的任何地方多次使用它了。

下面我们来逐步了解如何创建自己的shell脚本函数并在应用中使用它们。

阅读全文 »

dput函数 - 保存R的数据结构

发表于 2017-10-27 | 分类于 R |

记住这个函数!记住这个函数!记住这个函数! 重要的事情说三遍,为了让你能更清醒地记住,我再说一遍,记住这个函数!

dput是导出数据结构供重复使用的函数,这是跟别人交流或者请教问题的一个重要函数。比如你在用R分析的时候遇到问题了,有问题的是对某个列表或者数据框进行操作,该怎么让别人可以重复你的错误然后帮你找错呢?这就是这个函数存在的意义。

阅读全文 »

Bioconductor分析RNA-seq数据

发表于 2017-10-27 | 分类于 bioinformatics , R , |

参考学习《R语言与Bioconductor生物信息学应用》第六章

前言

Y叔的公众号biobabble发过一篇【听说你想学R?】,七月份发的但昨天推送了一次,所以我看到了,看到了对《R语言与Bioconductor生物信息学应用》这本书的强力吐槽,而我发的这篇笔记,连同上次发的Bioconductor分析基因芯片数据都是来自于对该书内容的提炼和学习。所以呢我觉得有必要在这里说几句。

坦白说,这本书确实有很多问题,我自己讲讲几点吧:首先,它有点过时了,公众号评论就有人说基因芯片分析过时了,我个人觉得不客观,但确实这本书有些过时,由此产生了一系列问题,特别要提到的就是代码的可重复性,我个人在运行书中一些代码时很多时候会不work,然后我会自己思考怎么让它work,实在不行就放弃;第二点,它不适合R入门的人,特别是你去看它的第一章,云里雾里,好歹我也摸了半年R了啊,好吧,我就直接跳过了;第三点,它的流程不完整,就是不是很连续的都能让你从头到尾的go through下去,自然心里会感觉不爽快。如此种种。

接着你心里已经有准备听我下面要将的“but”的跳转了,我为什么会学它并做笔记,乃至分享出来?首先,在我需要学习芯片和RNAseq分析的时候身边刚好有这本书,我也不知道是谁的,好吧,那就拿起来看看,发现正是我需要的,所以我看它,第一章看不太懂,没意思,我也不想看,直接跳过从第二章看起,到现在整本书基本看了大半,看过的代码都尝试着去运行过,确实有所收获,所以我会写前言,算是对这本书的客观评价吧;其次,我想谈谈有哪些收获,我本人可以算是有编程基础的,算不得菜鸟,但是对于基因芯片的基础也好,RNAseq乃至基因组分析流程、背景等等可以说是菜鸟的不能再菜鸟,这本书给了我对芯片数据来源、处理流程的一些基本认知,其实这在一些国内资源上是找不到的。有一点我心里非常的不服气,为什么我听说中国做生信非常厉害的人很多,找得到的中文资料却很少?为什么百度其他搜索引擎很强大,一涉及科研领域就非常之垃圾?这也是我挺佩服生信技能树或类似的这样的团队以及相关个人,当我们在喷一些书籍很垃圾,而实际它确实有很多问题的时候,我们能不能贡献自己的力量呢?几个月的学习里我深知自己才能有限,所知甚少,所以不断模仿和记录。我把这些笔记陈列出来并不是它写的有多好,多值得模仿,而是它能够给予我们新的知识,又能够在我们忘记时方便查询。学习必然是一个探寻和思索的过程,技能的掌握它不是一本书可以带给你的,特别是一本技术类书籍,它给了你一个看似可行的方案,你要实际去操作它,然后心里给予评价,在你不确定时,需要多方面整理实践不同的解决方案,然后找到自己的出路,建立自己对该某个问题处理的完整体系。

这篇笔记并不会带你真正学好RNA-seq的分析,至少我看完之后没有,但它确实可以补一些知识的模块。它不适应入门R,也不适应完全模仿做具体的分析,而是适合你在掌握R之后,你在做测序分析之前想了解的一些知识。当你知道它非你所需,你可以完全不看它。

整体而言,这本书非常短,整体评价偏差,但国内在这个方面学习恐怕没有比这好的中文书籍吧?(所以我建议多看网络资料,这也是我在交互学习的,比如生信媛公众号文章目录)我希望那些厉害的人物(教授级人物们)能够多拓展一些中文科研的视界(提升国内人员对生信的整体认知与分析能力,加速学习周期),我也会持续记录这样一些知识,与生信技能树里面的小伙伴一起从不同的研究方向,角度去拓展形形色色的基础知识与理论。我再次强调,我专注于笔记的目的除了自身学习以外,是当你在面对一些概念或者问题的疑惑时,你能键入百度搜索后快速地链接到本文,并从中找到可执行的方案或者帮助你理解,而不是完完全全整篇的通读。而当你确实是需要对所有的知识点有学习的需求时,你再选择读它,不仅仅是这一篇笔记或博文。不要浪费自己的时间,也要耐心地投入自己的时间。

阅读全文 »

Bioconductor分析基因芯片数据

发表于 2017-10-09 | 分类于 bioinformatics , R , |

参考学习《R语言与Bioconductor——生物信息学应用》第五章,根据自己学习有删改,欢迎分享。本文中有些预备知识或一些方法的原理没有提及,请自行搜索理解或者购买该书学习。

Bioconductor最初就是设计来分析基因芯片数据的,因此芯片分析整体反映了Biocondutor的设计理念和编程思想。

快速入门

通过一个例子了解如何载入芯片数据,完成预处理,最后获得基因(探针组)表达矩阵。

# install CLL package
# library(BiocInstaller)
# biocLite("CLL")

# 载入CLL包,CLL包会自动调用affy包,该包含有一系列处理函数
library(CLL)
# read example dataset,(CLL包附带的示例数据集)
data("CLLbatch")
# pre-process using RMA method
CLLrma <- rma(CLLbatch)
# read expression value after pre-processing
e <- exprs(CLLrma)
# 查看部分数据
e[1:5, 1:5]
阅读全文 »

理解差异表达与GO分析

发表于 2017-09-28 | 分类于 bioinformatics |

记录跟差异基因分析相关的几个概念,主要摘自《R与Bioconductor》一书。

阅读全文 »
1 2 … 6
诗翔

诗翔

逢君一笑,人间无此欢喜

51 日志
7 分类
RSS
GitHub 简书
Creative Commons
推荐阅读
  • 阮一峰的网络日志
  • R的极客理想系列
  • 谢益辉
  • 解螺旋的矿工
  • GuangchuangYu
  • 生信技能树
© 2017 - 2018 诗翔
由 Jekyll 强力驱动
主题 - NexT.Mist
本站访问数 人次 本站总访问量 次