文科学术研究常用工具软件及技巧


经过了半年多的废寝忘食,博士论文终于按期杀青,写作过程中很重要的一个感受就是“工欲善其事,必先利其器”。不知道其他同学们的情况,就我个人来 说,从很早就开始尝试着将主要的工作阵地转向电脑而非纸质材料,大量的资料和笔记都是电子版的,这不仅仅是因为电子资料便宜,可以省钱(重要的书籍我都会 去买纸质的),主要还是因为可以极大地提高效率。也会有一些朋友跟我说他们更加习惯于读纸质的书和手写笔记,我想个人习惯通过练习总是可以慢慢扭转的,而 一天读书的时间最多也就十几个小时,无容更改。人生苦短,我们大部分人都没有过目不忘之才,也早过了博闻强记的年龄,经典固然还是要努力去诵读记忆,许多 重要文本抄写之后理解和印象都会更加深刻,这我都不否认,但更多的需要阅读的书籍材料只能通过笔记的方式去记录整理,并且能够在需要的时候迅速快捷地找到 相应地笔记,相关原文的出处页码,这些时间还是应当通过一些工具软件的帮助尽可能地节省下来。

我最早做笔记是用本子做摘要,也附加自己的心 得,后来发现想找需要的材料很困难,首先,做笔记的时候只能就一本书去做,书与书的价值差别很大,有的书一本读下来也没有多少值得摘抄之处,有的书异常丰 富,一个本子都用完也未必够,这样就会造成做的笔记很难清晰地建立起一个规整易览的秩序,有的笔记本记了乱七八糟好多书,有的本子大半都是一本书,剩下的 空白部分陷入鸡肋。另一方面,写文章往往追随着问题的引领,而不可能局限于某几本书,往往翻本子找笔记的工夫还不如直接去翻原书更快。后来我改用读书卡 片,可能是我缺乏足够的分类管理家务的能力,或者是没有受过这方面的熏陶训练,具体细节就不说了,总之,最后抄了许多卡片却难以建立起清晰明了的索引。我 很佩服,也很好奇老一辈学人的卡片是如何分类管理的,但不得不承认,我的确没有这个本领。

这些失败的探索之后,我开始在电脑上开始新的数据库建立工作,具体历程就不说了,只把迄今为止的心得拿出来一项项与大家分享,文中有许多你可能早已知道,那就请忽略。文中肯定还有许多不当之处,也希望高人能够不吝指点。

 

电子资料最大的危险是因为故障而丢失,先说备份问题。

资 料库至少应该放在三个篮子里面:第一,优盘或者移动硬盘大家都知道,只要手勤一点儿就行了,值得说的一点是如果你的优盘足够大,每次备份的时候最好不要覆 盖上次的备份文件,而是让windows自动改名编号,也许有一天会用得着更早的版本的。第二,笔记本软件(后面详说)有自动云端备份能力。第三,还要再 用一个自动在云端备份文件夹的快盘软件,现在这样的软件很多,但我只推荐一个:金山快盘。因为它有一个功能是独一无二的,就是能够保存最近两个星期或者最 近二十次左右的修改记录,这意味着,你随时可以找回误删、误改的原始资料。譬如说头天晚上我一时冲动,把论文中写好的一大段删掉了,今天早晨回想起来后悔 不已,没关系,在云端可以找回你之前修改过的十几个原始版本。所以毫不夸张地说,这个功能秒杀其他一切快盘。什么流量、空间都无关紧要,我们最重要的文件 大小绝不可能超过八个G。至于快盘的使用方法很简单,装好就会用,值得一提的是要设定好自动同步的时间,我一般设为五分钟一次,你当然也可以设为只要有任 何修改就自动同步,不过一则不必要,二则可能有时候会造成文件冲突。还有,最好在关机前确定快盘已经同步完毕,否则也可能会造成冲突。

 

下一个问题是电子书的阅读。

先 说泛泛读,也就是无需作任何笔记的纯粹快速阅读,在我的专业(中国哲学)而言,正史,杂史,外国小说,古人笔记等等都算是泛读了,而且平时时间紧,多是 “三上”之时,手机算是最好的方式,因为手机最适合阅读的还是txt和chm文件,而二十四史,大部分小说都可以找到这两种格式。

然后是泛 读,这主要是涉及学术但又非特别艰深的著作随笔,以及一些要熟悉的重要文本,譬如钱穆先生的许多著作皆可入此列,学生没钱就先读电子版,不用电脑读的 话,kindle和ipad代表了现在的两大类型,对两者孰优孰劣的争执网上有许多了,我想说的是,如果读横排书,kindle6寸版足够了,而且小巧方 便便宜,但要读竖排书,ipad还是更胜一筹,原因很简单,竖排书必须要有大屏幕,不然不是字小的看不清,就是上下拖动累死,kindle9.7寸固然也 能胜任,但既然价格差不多,那还不如买个ipad,至少屏幕不容易坏。有人说ipad功能太多,容易分神,这个就属于“风动幡动还是仁者心动”的问题了。 ipad还有个好处,就是可以安装笔记软件,需要的时候还可以随时做笔记。

在电脑上读书很多人可能不适应,其实如果你努力去习惯它的话最终 会发现可以节省大量时间。我就以最主流的格式pdf为例来说明,因为其他所有格式原则上来说都可以转化为pdf,最简便的方式是虚拟打印机转化pdf,至 于其他的方式,“国学数典论坛-先利其器”版块有许多方便的小软件可以使用,大家也没必要忙着学习技术贴,需要的时候去下载下来用一次就会了。为什么要主 讲pdf呢,因为它是我现有视域内最方便ocr的格式。

所谓ocr,说简单点儿对我们读书人就是一个功能:大部分pdf电子书都是复印机或 扫描仪做出来的,它们的原始格式是类似于图片的,在读到需要摘抄的段落句子时,只能比着一个个字打出来,而ocr可以让一本扫描图像格式的电子书转化为可 以随时摘抄复制的文本格式。网上现有的ocr工具很多,我推荐的是Adobe Acrobat Pfofessional 8.0(以下简称aap,这个软件要收费,学生嘛就去下个盗版的先用着再说吧)或更高版本(据说Abbyy FineReader也很强大,但我没有仔细研究,试用过一下,感觉与app功能差别不大,既然app我感觉完全够用了,老习惯就没有必要再改了)。许多 人读电子书只用Adobe Reader,因为它是免费软件,而且占用内存很小,但我要说的是,如果你需要做笔记摘抄的话,必须用aap。因为它有许多额外的强大功能,而ocr是其 中最常用也是最犀利的一项。下面我详细讲解一下这个功能以及相关的实用小技巧。

譬如我现在打算精读《真理与方法》,我手头是有纸版的,但是 为了做笔记方便,就去新浪爱问下载这本书的pdf版,下载之后用aap打开,发现它是扫描版,许多重要段落无法直接摘抄复制,于是就在午饭前做了如下操 作:文档-ocr文本识别-使用ocr识别文本。注意弹出识别文本对话框的时候要点击编辑选项,然后分别选择:

 “简体中文”,这个选项依据你要ocr的文本内容来设定,app提供了几十种语言选项,竖排繁体的书也可以ocr。

“可搜索的图像(精确)”,这个选项是为了防止ocr之后文本大小急剧膨胀,选上之后大约比原文本体积增加百分之三十左右。

“对图像缩减像素采样”,这个选项自己斟酌,选择太高会造成文本体积的增加,太低会造成像素质量下降,影响ocr识别的正确率。

选择“所有页面”,然后点击确定之后,如果你的机器不是特别牛的话,最要就不要碰电脑了,放下鼠标去吃饭,吃完饭回来它就ocr好了(据说9.0速度提高很多,我用的还是8.0,没有做过测试),点击保存就可以了。

这个时候这本书就变成了一本双层书,也就是说,在阅读的时候你看到的还是扫描图像,但是图像下面还有一层隐形的ocr转换出的文本,现在你在阅读的时候看到那段话重要,就可以直接用鼠标复制粘贴了。比如这样:

 

但是这样粘贴出来的是许多行的文本,而不是一段,要一句句地调整格式很麻烦,这就需要用到另一个绿色小工具:文本处理器,或曰textpro。可以看到粘贴上的初始文本是这样的:

 

然后点击一下“删除段内回车”按钮就变成这样了:

 

如果要求格式比较正式,就还要再点击“半角转全角”按钮,把标点符号也转换一下,繁体字也可以直接转化为简体,还有许多其他方便快捷的功能,这里只是说说最常用的,其他的大家可以根据自己需要去研究。

此 外,还要顺便说一点电子书相比起纸质书的优点,就是它可以随时加入书签和批注,不要小瞧这个功能,如果你试过在纸质书上加书签你就会明白这是个很麻烦的工 作,假设说我现在读一本书的时候有一个始终在关心的问题域,而这本书本身也很重要并且有其自身的问题结构,那么我在读书的时候就需要同时有两套分类法。我 们从两方面来说,先说书本身的结构,你可以说书本身的结构在书的目录中已经有了,但是大部分电子书的页码和文本页码并不能严格对应,这就需要我们在读书的 时候手勤快点儿,边读边作pdf目录。这个目录应当包括目录页、版权页和章节。再说依照自己的问题域做的笔记,这就更加需要你的勤快,在读每一节的时候都 随时以更下一级分级目录的方式建立起各种关键词索引,有时候即便你自己的问题域不是很清楚,也可以在阅读的时候随手记下来。譬如说,朱伯崑先生《易学哲学 史》中每一节都非常长,涉及的问题很多,有时需要查找某个论述的时候比较困难,就可以在读的时候这样随手做好目录,等到将来有一天你在写论文的需要查找这 本书中某个问题的时候,你会非常惊喜地发现,当初自己勤快地随时动手得到了回报,自己现在几秒钟内即可定位到重要原文:

 

而 纸质书这样做就比较困难,我曾经试过用那种带黏性的小便条来做这个工作,不仅把书弄得像个疯女人,而且在找某些关键问题或者关键词的时候,纸条上的字需要 逐个辨认,在一目了然性上比起电子书差了许多。顺便说一句,如果是ocr过的电子书,还可以使用查找功能,但我一般不会对此抱太高期望,因为第一,从现有 ocr技术来说,错别字还是很多的,所以在引用文本的时候必须校对一遍,想直接查找往往徒劳无功。第二,即便精准无误,想依靠直接搜索来找到自己需要的某 页论述也是非常困难的事情。所以我还是一再强调,读书的时候手勤快一点是最重要的。

接下来再说做笔记,我曾经用过数个笔记软件,最后选定了 为知笔记,大概有如下几个原因:其一,为知笔记面向用户是知识管理类型,虽然不像笔记软件的老大——印象笔记有那么多强大多媒体功能,但是对于单纯的知识 管理完全足够了,而且界面会更加简洁。其二,为知笔记给免费用户的每月流量完全够用,即便你认为不够想升级为付费用户,一年也只需要几十块钱,我想对任何 人即便是穷学生而言这都不是一个很大的负担,除此之外,如果你邀请朋友加入的话,可以得到积分换取vip。虽然我目前还没有发现免费用户与付费用户有多大 差别,但本着支持软件的精神我还是愿意付费。而印象笔记就昂贵得多,大概一个月就要几十块钱吧。其三,也是最重要的一点,至少到目前为止,为知笔记可以无 限制地建立下级文件夹目录,而其他的笔记软件最多只能建立三级。我不知道开发笔记的软件商是怎么想的,这应当是一个非常容易调整的小程序设定,但对我而言 他非常重要。因为做笔记的时候你永远都会遇到新的难以分类的资料,或者将你现有分类更加细化的问题出现,对于平时工作日程管理之类的也许三级目录足够了, 但是对于学术资料的整理,三级目录是远远不够的。此外,为知笔记也有一些很方便的功能,比如google日历同步插件之类的,但对我而言,最主要的使用还 是做笔记。再补充一个可能对大家都已经是常识的事情,现有的笔记软件都是可以自动在线同步的,也就是说你的资料数据不仅存在你的电脑上,它也保存在云端服 务器上,所以不必担心电脑出现故障造成资料丢失。当然,有可能你操作中会有误删误改的情况发生,如果你担心这个,那么就用你的金山快盘把为知笔记的资料保 存文件夹也设定为自动同步,这样,你可以随时找回一个星期之内的资料修改记录。此外,为知笔记也具有现在所有笔记软件的一个共同特点,多平台同步功能。也 就是说你也可以随时在另一台电脑上,你的ipad上或者你的手机上调阅修改增删你的笔记资料。个人感觉为知笔记的移动客户端做的不如印象笔记好,但因为我 主要是在电脑上工作,用其他客户端一般仅止于查阅功能,譬如睡前躺在床上用手机翻一下今天的读书笔记,所以也就不求全责备了。

最后说一下用软件做笔记的一些个人心得。我们可以把要读的书按照重要级别大致分为几类:

【I】 并非你专业研究方向,也不属于重要经典,这类书只需要泛读,在阅读的大部分过程中无需做笔记,偶尔有一些要点或者触发思路闪光之处需要记录。那么第一,在 这样的闪光之处要加上目录书签(以便将来需要时可以迅速定位);第二,在你的笔记中新建一条笔记,此笔记的名字可以用书名命名,最好顺手再把此书的版权信 息放在此笔记的开端(将来如果需要写文章的时候可以直接就把注释做好)。第三,将这段话或者某句话复制下来,然后在笔记中打出“1”并加上一个你总结的简 洁关键的词或句子,然后另起一段把复制信息粘贴进来并进行简要点评记录,而且记录下原文的页码(编号和摘要是为了回头巡检的时候能够清晰迅速的找到相关问 题,页码还是为了写文章方便注释)。第四,于此同时,如果这段材料与你曾经思考过的某个重要问题相关,不要怕麻烦,找到那条笔记——如果你的分类足够清 晰,这只需要几秒钟——并且将这段信息也照样复制到那条笔记中去(我们不仅需要按照所读之书建立目录资料库,还一定要按照自己的问题域来建库,使之构成纵 横交错的网络,在这个时候你如果肯多点几下鼠标,再按一下ctrl+v,只需要几秒钟,但在将来它可能节省你大量时间甚至触发你意想不到的许多思路灵 感)。第五,当发现下一个闪光点的时候,重复第三点,并继续增加你的数字编号。

【II】重要经典著作,譬如西学中的柏拉图,亚里士多德,笛 卡尔,康德,黑格尔等等。这类书需要精读,而且往往难度非常大,需要你对其文本结构思路线索非常熟悉,而且一般来说还需要借助一些相关二手文献。此外,将 来不出意外,还会重读。对这类书除了参考第一类书步骤以外,还需要如下步骤:

第一,在阅读过程中,详细地做好章节目录,最好在每一小节下再建立子目录,以关键词或关键问题来命名。因为这样的经典信息量都非常巨大,具体到小节的标题一般不足以把握其文本。

第 二,在笔记软件中,依照原著做出一份相同的目录树结构,至少每一小节都要有自己对作品的思路梳理(愈是难的作品梳理愈是要详细,最困难和重要的作品甚至需 要每一段都做思路小结),以及原文关键句子的摘录(如果需要甚至可以是全文录入),如果可能最好再附上相关二手文献的解读。自己的总结,原文,二手文献最 好采用三种不同的字体,这在笔记软件中是很容易实现的功能,只是注意要保持统一性。

如果是中国的经典,譬如四书五经,当然最重要的是背诵, 至少熟悉原文,这个只能靠自己下功夫了。笔记软件能帮助你的是,如果你下决心在某段时间内专治一经,或某一子,我的建议是依靠笔记软件将此经分解为一个目 录树结构(十三经正义都有可复制的电子版),并且每读一句、一段或者一篇(依文本情况而定),将历代重要注疏各自的诠释方向以及它们之间的重要分歧以另一 种字体列在下面,做一个自己的集注本或曰百衲本。以后每读到相关的著述、文章或观点都可以加入此百衲本中并加入自己的点评,也许将来有一天,你会得到自己 的十三经集注。

【III】自己研究方向的专门著作。一般来说现在的研究都会以某个人或某人的某思想为基本方向(后者必定以前者为基础,所以差别并不大),我也是如此,就此谈谈心得。

这 种研究最麻烦之处在于一个人的著作往往成分非常驳杂,也许他的诗论中某一条材料与其工夫论中的某个关键问题就相关联了,又或者某一封信同时讨论好几个重要 问题,这些都难以预测并事先分类,如果著作比较少的还好说些,可以通过博闻强记以及文本的熟悉来把握,当面对那些著作浩繁的思想家,要想在写作论文过程中 随时就某个问题检索相关的论述就需要事先做好充分的准备。我们在选定某个思想家之后,一般情况会把这个思想家的所有著述都过一遍,这是最重要的阶段,不仅 因为它牵涉到我们对思想家的直观理解,也是做笔记的最重要阶段。

我的经验还是要按照纵横两个系统来做,虽然在做笔记的过程中需要每次多化几秒钟,但是将来你会发现这绝对是值得的。

纵 的来说,就是按照著作分类分章节做笔记,每本著作中每篇文章每封书信每一小节都要总结大义和关键词,分别放在一条条笔记中,如果可能,再加上适当的思路点 评(与文本初次相遇时触发的东西很重要,最好能记下来)。这些都按照著作的顺序编排目录树,由此也可见,三级目录文件是远远不够的,譬如“博士论文-王船 山-著作分类索引-易学-周易内传-六十四卦索引”这样的数级目录树。每一卦再简要引用总结船山观点。

横的来说,就是按照关键词分类做笔 记,譬如说《周易内传》“渐卦”中船山批评了顿悟以及心学,那么这则材料在刚才纵的目录下做好笔记之后,就顺手将此条复制一下,粘贴到“博士论文-王船山 -关键词-工夫论-批评心学-顿悟”的目录下,增加一个编号材料。这样将来写论文的时候,既可以从著作的内容来找寻自己想要的东西,也可以通过关键问题关 键词来检索相关材料。

顺便再说一下,做笔记的时候关键词的命名要尽量严谨、简洁、统一。因为笔记软件都有强大的检索功能,有时候哪怕你忘记了某个材料的出处,只要能记得一两个关键词,就可以检索出来。

才想起来,还有个强大的软件,大家可能都知道,就是note express,这个也是需要日积月累的资料积攒,但一来,学校图书馆有相应的讲座可以看,二来,这个我才开始慢慢学着使用,有待其他高手来指点了。

最后要说的是,这里说的都只是些经验之谈,学术资料库的建立不可能有固定的模板,也不可能一蹴而就,它需要你用数年的时间耐心地建设,调整,相互驯养,并用更多的时间精力不断地充实丰富它。反过来说,无论何时开始也绝不会晚,因为做学问,是一辈子的事情。

 

 

 

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s