不要Word,不要Latex,我们只要Markdown
Casa Nova
在软件开发中需要撰写大量的文档,这些文档对于格式有着极为严格的要求;同时,大量文档的撰写意味着需要方便快捷容易写作的文本格式。因而,各种文本格式应运而生。这些文本格式大多都是标记语言 (lightweight markup language),通常网页所用的HTML格式就是一种典型的标记语言。所谓标记语言,就是通过一定的字符来标记格式,比如标记粗体或者斜体,而计算机可以识别这些标记来显示对应的格式。当然软件开发界使用的标记语言远不止HTML或者XML这些。比如Python社区常用reStructuredText,R社区常用R Markdown。话说回來,Mac下的Pages,M$的docx也都是XML文档,只是我们在編輯的時候,不需要加入各种标记,软件本身替你增加标记了。上面提及的Latex也是标记语言,当然Latex的标记系统非常复杂,所以它并不是一门轻量化标记语言。
我们在这篇文章中会借鉴软件开发的经验,利用标记语言来撰写学术论文。在此之前,我已经陆续在几篇豆瓣日志中讨论了这一问题,
為什麼文科生也該用markdown寫作? 學術寫作tips 我的寫作workflow 使用pandoc markdown寫作後記 熟悉这些日志的朋友一定明白,我非常厌恶M$的Office系列工具以及由它们生成的各种文档,比如docx文档。当然,我也太不喜欢Latex,归罪于它那无穷无尽的\号。在这篇文章中我们会着重介绍markdown文本格式,一种轻量化的标记语言。因为Markdown自身的局限,我在论文后期改用Pandoc Markdown来写作,这一改动大大减轻了我的工作量,让我得以顺利提交论文,所以我们在文章的后面会介绍这种Markdown的变体。
两年前,我曾经受命为一个语料库项目做数据预处理。当时的构想是把本校图书馆内的电子博士论文作为源数据,将他们转换为可读格式,进一…