生信自学之 Linux 操作入门指南
丁香园
Linux 系统是生物信息分析中必不可少的工具,它的作用就像 Windows 系统对于我们的日常工作那样:不需要深入到成为系统专家,但是基本操作必不可少。
所以对于生物信息学的新手来说,没必要把《鸟叔的 Linux 私房菜》完全学完,那些用不着的部分完全可以跳过。以下就对生信分析中的 Linux 操作做一个简单的入门指导,告诉你这条路该如何走,入门技术需要掌握哪些内容。
生信的 Linux 之路要怎么走?
生信的 Linux 之路大概分为三个阶段:1. 流畅使用;2. 脚本编程;3. 高级运维。
流畅使用是基本的入门阶段,它的目标是:能使用 Linux 系统完成大多数的计算机操作。简单点说就是要把 Linux 玩的和 Windows 一样流畅。
脚本编程应该说是生信分析中最常用的核心技能,是区别内行与外行的黄金标准。它的目标是:用 Shell 脚本,实现大多数生物信息分析软件的功能。
高级运维简单说就是生信中的系统管理员,它的目标是:整个 Linux 服务器的搭建和运行维护。
以上三个阶段,流畅使用是每个初学者必备的,脚本编程和高级运维可根据自己的喜好,偏重一方面的发展,但是两者都需要有足够的了解。
初学者用哪种 Linux 系统?
有服务器的就不用纠结了,服务商安啥就用啥吧。一切向你的师兄师姐看齐就是最好。
没有服务器的小白,在笔记本上安个 Bio-Linux 也很不错,边熟悉生信的基本操,边寻找使用服务器的机会。
Bio-Linux 由 NERC(Environmental Bioinformatics Centre)开发并维护系统。官网及相关介绍如下:http://nebc.nerc.ac.uk/tools/bio-linux.
Bio-Linux 系统提供了多种多样的安装和使用方式,为初学者和教学演示提供了极大的便利。安装方式包括作为唯一系统安装,双系统安装,Live 方式安装,虚拟机安装等。
其中唯一系统安装与我们安装 Windows 差不多,相当于给电脑完全安装了一个新系统。
双系统安装就是一台电脑同时安装两套操作系统,一般是一套 Windows 用于日常办公使用,一套 Bio-Linux 用于生信学习。
Live 方式安装是把 Bio-Linux 安装在 U 盘上,启动后作为类似 PE 的小型系统使用。优点是可以随身携带并且在任何一台电脑上体验和使用,缺点是不能保存文件,只能用于演示和体验。
虚拟机安装则是在 Windows 系统上依靠特殊软件「虚拟」安装一套其他操作系统,优点是可以随时在两种系统中切换,且不需要真的安装系统。缺点是用起来常常发生卡顿的情况,尤其是对于内存小的计算机。
我建议大家先体验一下 Live 方式,然后再进行双系统或者唯一系统进行安装使用。因为 Live 安装中制作的启动盘可以作为安装盘,随时给任何一台电脑安装 Bio-Linux 程序。Live 安装方式步骤:
1、下载 U 盘启动制作软件:universeral-USB-installer,以及 Bio-Linux 系统镜像文件(ISO)
2、安装 universeral-USB-installer,运行,同时插入一个 4G 大的 U 盘,step1 选择「try unlisted linux ISO」, step2 中选择刚刚下载的 Bio-Linux 镜像的路径,step3 中选择 U 盘的盘符,勾选格式化(format),点击开始。
3、待运行完成后,Bio-Linux 系统的启动 U 盘就做好了。
4、使用 Bio-Linux 系统的 Live 方式:将电脑设置成从 U 盘启动(如何设置请 google)。插入 Bio-Linux 的启动 U 盘,开机,电脑将自动进入 Bioi-Linux 系统中,选择「try Bio-Linux without any change to your computer」即进入 Live 方式。该方式不会对电脑做任何改动。
如果体验后想安装,可以搜索相关安装 Linux 系统的帖子参考进行,或者参考本系列之后的文章。另外建议试试虚拟机安装,多体验几种方法,就像高中学习时体会不同的解题思路一样。
学习本身就是不断折腾的过程,不折腾就没收获。Bio-Linux 系统的优点是已经安装好了生物信息分析常用的软件和包,可以跳过繁琐的软件安装过程从而专注于软件的使用和数据分析本身,适合于快速掌握「战略」能力。
初学者也可以选择 CentOS 系统,将其安装在台式或者笔记本上。CentOS 的优点在于它本身就是许多服务器的系统,因此学习 CentOS 的过程也是学习服务器系统配置的一个过程,能掌握更多具体的「战术」的东西。但是缺点就是费时间,大量软件的从头安装以及相应配置的修改都不是初学者能顺利解决的。
还有个缺点就是 CentOS 安装在笔记本上的话会需要很多额外的配置,比如显卡、网卡驱动、输入法、账户设置等等,对初学者很不友好。但是喜欢折腾的同学可以尝试一下。
Linux 系统的基本操作
安装完成后,就到了实际使用的阶段了。如果你是小白,那你肯定对 Linux 一无所知。怎么办?《鸟叔的 Linux 私房菜》太过冗长,看完一遍要好久。所以我推荐小白们直接看 Bio-Linux 自带的使用简介《Introduction to Bio-Linux》。薄薄的一本小册子,大概一天就能完全读完。
学完这本小册子就够了吗?
基本够了,生物信息里用到的 Linux 操作你已经基本掌握了,下一步你的重点就该转移到具体的数据分析流程上了。