磨刀不误砍柴功——聊聊个人 IT 基础设施的完善

  经常关注俺博客的读者肯定都发觉了,最近一个月,俺发博文的频度下降了一半。害得不少读者担心,以为俺出了啥事儿。   为了避免大伙儿担心,也为了满足某些人的好奇心,跟列位看官澄清一下:近期在对自己的一些 IT 基础设施进行升级,所以占用了很多业余时间。不过俗话说得好:磨刀不误砍柴功。这些时间是值付出的。   其实俺每隔几年都要把自己的 IT 基础设施进行一次大的升级。这就如同 Google 每隔 2-3 年都要把搜索引擎的核心技术进行一次大的升级。IT 技术的发展太快了,这样做才能与时俱进,保持一个 Geek 的先进性。   俺的上一次升级是在 2010 年。时光飞逝,转眼又是三年。而且最近又发生了两件事情,促使俺决定升级一把。

  其一是 Google Reader 在7月1日被关闭

  俺一直是 Google Reader 的重度用户,过去6、7年,大部分上网时间都是在阅读 GR 上的内容。   GR 关闭之后,尝试了几个 RSS 阅读器(比如 Feedly、DiggReader)作为 GR 的替代品,都不太满意。所以最近1-2个月,俺一直在摸索,希望能找到一些新的手段,用来提升信息获取的效率。

  其二是 棱镜门丑闻

  棱镜门丑闻已经曝光3-4个月了,还一直有新的猛料出现。不得不佩服斯诺登,能搞到这么多猛料;也不得不佩服美国国安局(NSA),能够把触角伸到互联网的这么多角落。

  对于 NSA,俺倒不太担心(俺应该不是它的目标 );俺比较担心的是天朝的有关部门。有句俗话叫做:外行看热闹,内行看门道。天朝的有关部门一定会从这些曝光的材料中得到很多借鉴。不久的将来,它们也会效仿 NSA 的手法,加强对民众的信息监控。如此一来,像俺这种长期抹黑朝廷的人,风险大大滴。为了防范于未然,需要提前做好一些应对的措施。

  刚才讲的是俺本人的情况。其实捏,“完善个人的IT基础设施”对于【每个人】都是很有用滴!(所以今天才单独写一篇博文,介绍这方面的经验)   对大多数人而言,完善自己的 IT 基础设施至少有如下几个好处。
  在这个世界上,时间是相对比较公平的。每个人清醒的时间(刨掉1/3的睡眠时间),最多也不超过80年。在时间跨度有限的情况下,你能做的就是:提高时间的利用率和时间效率。   俺非常庆幸自己赶上了信息化的浪潮。在信息化时代,有两个利器:计算机和互联网。如果你善于利用这两个工具,可以极大地提升你的时间利用率和时间效率。   很多人对“安全性”一词有误解。一提到“安全”,都联想到骇客入侵。其实骇客入侵只是安全的一个方面而已。举例来说:“容灾备份”也属于“信息安全”领域。感觉很多同学都缺乏“备份”的意识。那些不做备份的同学,万一哪天硬盘坏了、移动设备丢了,你就傻逼了。   另外,隐私问题也属于“信息安全”的范畴。如今这个问题已经越来越严重(包括 国家级别的监控 和 商业公司的监控),每个人都需要面对。   总的来说,可以分为软件和硬件两方面。俺觉得软件方面是关键,有更多值得说道的地方。所以下面重点聊软件方面。   这方面主要包括:宽带接入 & 翻墙。   如今宽带接入已经非常普及了,只可惜翻墙还是不够普及。所以最近3年来,俺一直在扫盲翻墙的各种姿势。关于翻墙的话题,之前已经聊了很多(到博客右侧栏点“翻墙”标签,就可以看到所有翻墙类的博文)。所以今天就不展开了。   当然啦,宽带接入和翻墙只是最基本的两个必要条件。如果你属于“爱折腾技术”的人,还可以考虑搞一个 VPS 来玩玩。甚至还可以考虑搭建“个人云”。   目前的【桌面】操作系统,根据普及度分别是:Windows、Mac OS、Linux。三者中 Linux 最小众,但使用效率反而比 Windows 要高很多。这其实符合一个普遍规律——越牛的工具,上手的门槛越高,通常也就越【小众】。   虽然 Linux 的门槛稍高,但并不是高不可攀。如果你是 IT 技术人员,肯定要尝试一下 Linux,或许会喜欢上它;如果你完全没有技术背景,但具有很高的热情,也可以去尝试一下。   Linux 相对于 Windows 有很多优势,限于篇幅,先聊其中2点:   1. 更好的【可定制化】

  大多数 Linux 的发行版都提供软件包管理工具,你可以只安装自己需要的软件包。比如俺装的 Linux 虚拟机(用来上网的),只占用不到 1GB 硬盘。哪怕装10个虚拟机,也只有不到 10GB。还有一些迷你型的 Linux 发行版,居然只有几十MB,而且功能齐全。再来看口碑不错的 Windows 7,动不动就用掉 20GB 硬盘;即使精简版的 Win Thin PC,至少也要用掉 6GB。

  可能有的同学会说,现在硬盘很便宜,用掉一点空间无所谓。但问题不仅仅在于硬盘空间,还包括安全性的问题。Windows 系统难以定制,系统中有一大堆你根本用不到的软件模块。虽然你本人用不到,但如果出现安全漏洞,就会被入侵者利用。而 Linux 具有高度可定制化,只装极少数你用到的软件包。系统中的软件包越少,出现安全漏洞的概率就越小。   2. 更适合做【自动化】

  俺曾经写过一个系列《如何成为优秀开发人员》,里面有一篇是《正确地做事(善用自动化)》。这篇博文特别强调,要让电脑帮你做一些重复性的、枯燥的事情,以此来提升你本人的时间效率。而且很多枯燥的重复性的工作,如果让人去做,一旦时间长了,人比电脑更容易出差错。

  在【自动化】方面,Linux 比 Windows 具有明显的优势。Linux 具有更强的命令行功能和命令行的资源(比如各式各样的命令行工具),非常适合用来搞自动化。Windows 在最近几年有所改进(比如推出了 Power Shell),但是在命令行方面,与 Linux 依然有差距。   等忙完这阵,俺会抽空聊一下 Linux 相对 Windows 的其它一些优点。   说完操作系统,再来说说“操作系统虚拟化”。这玩意儿也就是通常所说的“虚拟机”。

  关于“虚拟机”这个话题,俺在去年已经写了一个《扫盲操作系统虚拟机》系列(这是少数几个已经写完的系列:)。在这个系列中,有一篇专门介绍虚拟机带来的种种好处(包括:效率方面,功能方面,安全性方面、等等)。没用过虚拟机的同学,可以先看看这篇。

  在 IT 行业中,存储设备(比如硬盘)的增长速度是超越摩尔定律的。最近两年,TB 级别(1TB=1000GB)的硬盘也不过几百块钱。你可以花很少的银子卖到足够大的硬盘。所以,至少你可以做“跨硬盘备份”。所谓的“跨硬盘备份”有两种搞法:同一台机器的不同硬盘、不同机器的不同硬盘。

  关于“跨硬盘备份”的工具,俺强烈推荐 rsync(维基百科的介绍在“这里”)。这是一款历史很悠久、成熟度很高,功能很强大的文件同步工具。限于篇幅,俺只介绍它的两个优点:

  1. 应用场合非常广   支持各种操作系统(包括 Windows、Linux、BSD、等等)

  既可以用来做本机不同目录之间的同步备份,也可以用来做跨机器的同步备份。

  2. 飞快的速度——极强的差异备份功能

  为啥 rsync 的备份速度很快,因为它支持“字节级增量备份”。关于这玩意儿,上次介绍《文件备份技巧:组合“虚拟加密盘”和“网盘”》的时候,有介绍到过。

  拿个栗子来说事儿: 你有一个虚拟机的硬盘文件,有5GB。第一次备份的时候,rsync 跟传统的 copy 没有区别——都要把整个文件原样复制过去。但是之后的第 N 次备份就有差别了。 假设一个月之后,这个虚拟机硬盘文件只有其中的 100MB 发生改变。那么 rsync 在备份的时候,只会传输发生变化的这部分内容(即使变化的内容分散在文件的不同的位置,rsync 也可以准确定位)   在大多数情况下,本地的跨硬盘备份基本够用——除非你遭遇某些小概率事件(比如:家中失火、家中失窃)。

  如果想要防范这些小概率事件,你还可以考虑“网盘备份 or 同城异地备份”。对于网盘备份,可以参考《文件备份技巧:组合“虚拟加密盘”和“网盘”》。所谓的“同城异地备份”,可能很多人没听说过。其实做法很简单:你把数据备份到一个硬盘,把硬盘放到公司的抽屉里。这样一来,即使你家遭遇失窃/失火,公司里还有一份数据。

  “同城异地备份”相比“网盘备份”的【优点】是:空间足够大(你可以买几 TB 的硬盘),备份速度足够快(硬盘传输速度比宽带还要高几个数量级)   “同城异地备份”相比“网盘备份”的【缺点】是:【无法】防范某些非常非常小概率的事件(比如:城市遭到强地震、城市遭到核打击)   另外,对安全性要求较高的同学,建议你采用加密的存储方式(俺个人长期推荐开源的 TrueCrypt/VeraCrypt 加密工具)。已经在用这类工具的同学,可以看俺写的几篇高级教程:

文件加密的扫盲介绍

TrueCrypt 使用经验》(系列)
如何用“磁盘加密”对抗警方的【取证软件】和【刑讯逼供】,兼谈数据删除技巧》   最后再来说说内容管理和知识管理——这才是俺今天想说的重点。

  前几周俺写了一篇《如何完善自己的知识结构》,里面有一节是:如何应对知识爆炸?当时俺提了几条经验,包括:

1. 你的大脑只记住核心的知识点,舍弃边缘的知识点 2. 对于边缘的知识点,可以在需要的时候临时去查(比如通过搜索引擎、维基百科、专门的文献检索工具、等等)   今天再继续补充一下——如何用“内容管理”来应对“知识爆炸”。   假如你已经有一个比较完善的内容管理系统(以下简称“知识库”),而且是高度个性化的。那么,你可以利用它来帮你存储那些边缘性的知识点,而你的头脑中只记住这些知识点的“线索”。当你需要用到这些知识点的时候,可以根据头脑中的“线索”到你的知识库中查找更具体的信息。   举个切身的例子:

  去年写《谈谈三年大饥荒[3]:关于”苏联逼债”的谎言》一文,里面有一个章节是“苏联不但没逼债,还主动给援助”。在这个章节中,俺引用了《人民日报》1961年4月10日的一段话。

  其实这段话的原文和发表日期,俺的脑子里根本就记不住(这就是所谓的“边缘知识点”)。但是俺曾经看过一篇相关报道,并且保存在知识库里面。所以俺的头脑中有一个模糊的印象,知道有这么一个讲话。到了要写这篇博文的时候,去知识库查一下,就可以查到原文和日期。然后再到 Google 搜,就可以查到很多相关的资料。   假如没有知识库,俺又记不住标题和正文,要想在 Google 里搜,只能输入几个比较模糊的关键字。这样一来,可能要在搜索结果中翻很多页才能看到自己想要的(无形中就浪费了时间)。   所以,如果你搭建了一个【高度个性化】的知识库,它起到的作用犹如你的“第二大脑”。   为啥俺反复强调【高度个性化】这个定语捏?对于个人用的知识库,个性化的程度越高,对你本人的价值也越高。道理其实很简单:你的个人的知识库,无论如何都不可能比 Google 缓存的网页更丰富。但是 Google 缓存的网页是面向【所有人】,而你自己整理的知识库是面向你个人的。所以在“针对性”和“信噪比”两方面,你的个人知识库会远远好于 Google 的搜索结果。   限于篇幅,关于“内容管理 & 知识管理”就先聊到这里。更多这方面的话题,俺会抽空写一个系列,分享俺的经验。

俺博客上,和本文相关的帖子(需翻墙)

如何完善自己的知识结构
德鲁克谈【自我管理】——<哈佛商业评论>史上最受欢迎的文章
扫盲操作系统虚拟机》(系列)
文件备份技巧:组合”虚拟加密盘”和”网盘”
TrueCrypt 使用经验》(系列)
如何挖掘网络资源》(系列)