在大四上学期,我选择结束在微软的实习回到学校。之所以做出这个选择,有希望能静下心来积极准备英语考试、留学申请的考虑,也有对ACM队新赛季的考虑。但暗藏在我内心深处,最终促使我选择离开的原因是我对研究的迷茫。

彼时我的工作是给一个一般实体抽取系统贡献代码,在工程上轻车熟路节约的时间也使我得闲在IE领域做一些漫无目的的探索。由于组里的工作重心在工程产品方面,我一直无法在研究上得到直接有效的指导。一段时间后,我意识到是时候走出自己的舒适区,将更多的时间投入到眼前的事务上。于是我回到学校,一边广泛阅读文献、补课,一边着手进行留学申请的流程。

因为经费不宽裕和不信任中介的双重原因,我只能DIY申请,但也因此得以增长了很多见识。万事开头难,做一件事的第一步就是了解这件事本身。于是,我有事没事就打开知乎和一亩三分地等网站浏览相关信息,逐步了解各个概念,并开始选校定位。

选校的过程是最为需要经验的一个环节,人们往往无法恰当地认识自己。在这个哲学命题之外,由于美国的学校录取标准并不单一透明,这样的信息不对等使留学中介等服务商有了肥沃的生存土壤。而我只能自食其力,更多地是跟着感觉走。

选择国内的高校时,我们更依赖亲友相告和网络议论,学校自己展示的信息却颇为稀少。很多高校的网络建设十分落后,内容数年不曾更新。相比之下, 国外高校的网页包罗万象、叙述详尽,毋言教学、科研,甚至餐厅、住宿情况也一应俱全,令人眼花缭乱,接应不暇。

梅贻琦老先生有言「所谓大学者,非谓有大楼之谓也,有大师之谓也」。高校本身固然重要,研究生更应该看重的是学校的科研能力,而衡量一个学校科研能力最直接有效的方法就是衡量其师资水平。美国高校的教授往往各有个人网页,其中除了明陈出版物,有时还暗藏私货。读之不仅使人受益匪浅,更能见字如面,认识一个更立体的人。这一点对于渴望一个可以愉快共事多年的导师的博士申请人而言至关重要。

因为资金的限制,我不得已放弃了所有学费高昂的私校,偏向于考虑地点在「偏僻农村」的公校。这虽然是个无奈之举,但也为我节约了很多时间和申请费。颇为冒险的是,我思索到最后决定放弃申请所有保底校,只保留Top30以内的项目。这也使我最终申请的学校不过六所,其中实际有效的又不过四所(其中UofT的MSc项目后因校政几乎没有录取中国学生,UCI的MSCS项目录取的人数也屈指可数,属于信息不完全导致的决策失误)。

与选校齐头并进的是申请材料的准备,英语考试、文书以及推荐信缺一不可。因为申请的项目有PhD,我的文书和推荐信都是按照PhD申请的要求准备的。我向来不善考试,说来惭愧,即使考过三场托福,但到最后提交申请的时候我的成绩仍未过百。幸运的是因为较晚报名而孤注一掷的GRE,却获得了一个尚可的成绩。

12月份中旬提交申请过后,北京城已经是一片肃杀。完成了这个学期的课程后,我第一次拿到了满绩点的成绩单以及学校的fellowship(assistantship拿了好多年),感受到了这漫长冬日里少有的温暖。

春节期间随父亲访亲问友,席间父亲不无炫耀地向亲友们表示将要送我留洋。亲友们皆奉承道「以贵公子之资,必是非藤校不取」,而我只能心中苦笑。在离家前,我将心事向父亲诉明。他叹了口气劝我不要过度思虑,世间万事皆需有缘,缘分到时必能成行。

等待结果的过程是煎熬的,那段时间里时常在夜半时分醒来,在睡眼惺忪时下意识地拿起手机把邮箱和一亩三分地刷了一遍又一遍。

佳节过后,我决心不能再留在家中虚度光阴。在返校之前,我借道苏州,敲了一波沈公子的竹杠。也许是因为其名不义,这趟行程出师不利。我先是看错了去程的航班时间,在机场眼睁睁地看着自己的航班起飞,又是在上海买错了去苏州的高铁票。历经千辛万苦抵达后,正赶上一场春雨,尽为湿透。

江南之地向来与我有缘,在返程前一天,我收到了第一封录取。彼时我心花怒放,但又害怕其中有误,直到第二天确认邮件到达,才敢告知家人。

在申请的六所高校中,我收到了两所学校的录取。这样寡淡的申请结果自然无法与研究院优秀的小伙伴们相提并论,但于我已是足够。然而即使仅仅是一道两个选项的单选题,依然让我纠结。单从AI科研上来看,UMass着实比UVA高出一筹,即使在课程设置上也丰富许多。如此看来选择UMass好像顺理成章。其实不然,UMass的项目是两年制,多UVA半年,这意味着需要多付出半年的金钱和时间成本。并且UMass对于master学生没有官方的research track培养方案,学院的支持只停留于口头上,又需要与数百master学生竞争;而UVA已将我录取到research track,且有大方向上match的优秀导师。再加上感念于UVA二月份就第一个向我抛出橄榄枝,救我于水火之中的知遇之恩。加上Jefferson (opens new window)在其中注入的学术民主思想,以及其作为唯一入选联合国教科文组织世界遗产 (opens new window)高校的独特之处,符合我想到一个综合性大学濡染一些人文气息的夙愿。在一段时间的考虑之后,我接受了UVA的offer。

三月,我第二次到亚研院实习。由于这次实习的目标更专注于研究和论文上,我得以有更多时间观察和思考领域内现有的问题。在mentor的建议下,我继续开展之前在时间实体抽取上的工作,并很快发现了当前研究在该任务上的滞后,将类似任务的SOTA方法应用在其上进行的一些实验很快取得了很好的(在数据集角度上甚至完美)结果。此时工作难以再进展下去,我们只能将重心转向关于可解释性的实验性研究上。但post-hoc (opens new window)的解释性工作终究还是将模型当作一个黑盒,能让人确信的部分终究有限。最终这个工作产出了一篇short paper投稿到EMNLP,虽后来因为borderline被拒稿,但诚不宜患得患失。

这段实习不仅让我了解了完成一个完整科研项目的过程,更重要的是让我对研究的思考 (opens new window)有了更多基于实践的印证。在研究停滞的一段时间里,我曾面对巨大的压力,以及由压力带来的对行动的抗拒。这让我更深刻地理解了寻找一个自己真正热爱的问题的重要性,唯有这样才能对沿途的失败和艰辛举重若轻。

如果将解决一个问题的过程看作一个inner loop (opens new window),那在科研中人们往往花更多时间在outer loop上,即寻找定义想要解决并可以解决的问题的过程。毕业季过后,我闲在家中,又开始了在outer loop的过程。这次的选择好像更加复杂,也更加关键了。不知从何开始我对偏向application的研究带有偏见,认为这些研究急于求成,并不具有普适性。在迷茫时,我还和柏宇一场硝烟味十足的关于此命题的论战。但这一问题终归不是一个简单的问题,科研求索就是在这inner loop和outer loop之间不断徘徊,在short-term goal和long-term goal之间逐渐产生taste,缓慢前行的过程。

还记得多年以前,高一的时候,我曾经看过清华关于吴佳俊获得特奖的新闻稿 (opens new window),梦想也能为科学的大厦添砖加瓦。后来我历经迷茫,几易其志,将弯路走遍。今年六月,在准备组内的paper reading时,我突然发现所读论文 (opens new window)的作者列表中赫然就有他的名字。虽仍是难以望其项背,但我仿佛看见时间轻轻地画了一个圈,那一年的年少轻狂如今唯余侥幸,只愿能无改初心,筚路向前。