掌握Unix与Perl:开启数据处理新征程
1. 编程转型的必要性
在当今的数据时代,科研工作产生了海量数据,动辄以 gigabytes 计。然而,很多人面对这些数据时,往往只会使用电子表格进行分析,可电子表格并非适用于所有场景。对于许多复杂的数据处理问题,编程是更高效、强大的解决方案。
编程并非天才的专属技能,普通受过教育的人也能学会。就像我们学会阅读、写作、乘法和除法一样,编程也是可以掌握的技能。学习编程是一场充满挑战但收获颇丰的旅程,它不仅能让你掌握一项新技能,还能让你从全新的视角看待数据世界。
2. 选择Unix的原因
Unix 操作系统诞生于 1969 年,至今仍广泛使用,短期内不会被淘汰。它最初没有图形用户界面(GUI),所有操作都通过键盘输入命令完成。虽然在现代看来这种方式有些古老,但键盘操作的任务更容易实现自动化,相比鼠标操作具有明显优势。
Unix 有多种变体,如 Linux,它们之间的差异不大。自 2001 年起,Apple 电脑就将 Unix 作为底层操作系统,只是被精美的 GUI 隐藏起来了。
生物学研究产生的大量原始数据通常以大型文本文件的形式存在,这些文件可能达到数 gigabytes 大小。Unix 非常适合处理这类文件,它拥有许多强大且灵活的命令,这些命令可以组合使用,发挥出远超单个命令的功能。例如,学会五个 Unix 命令,你能完成的任务远不止五项。
3. 选择 Perl 的原因
Perl 是最受欢迎的编程语言之一,在生物信息学领域有大量的追随者。虽然人们对于哪种编程语言最好存在争议,但实际上没有一种语言能适用于所有场景。Perl 能很好地