读研究生秘技七:高徒出名师
世有伯乐,然后有千里马。千里马常有,而伯乐不常有。
---韩愈《杂说四·马说》
导师有的时候就像伯乐,寻学生就像在耐心地寻找能在导师自己的研究兴趣或方向上施展才能的千里马。
怎么找呢?我这里分享一些我的经验和体会。
第一个值得优先考虑的当然是本校的本科生,毕竟远水不如近邻!
而从时间跨度来看,从大一开始寻找是一个值得考虑的选项。尤其对于青年老师来说,这是个能找到本校本专业特别优秀学生的时间节点,因为诸多原因,多数资深教授鲜有机会、也没有时间去接触大一的新生。
如何接触呢,当班导师是一种办法。计算机学科有个ACM竞赛,组织编程和有比赛经验的学生参赛,这也是接触、了解和选拔学生的机会之一。我想其它学科也应该有类似的。另一种更自然的方式是承担本科生课,如基础课程。
我曾经有过讲授大学物理课的经历。因为学院搬迁校区,导致原来物理系的老师们不愿意跨校区来上课,只好内部挖潜。作为当时的青椒,我也只能硬着头皮接下了组织交待的任务,虽然大学毕业后我有近16年没碰过物理了。为了防止露馅,在备课期间我甚至连广义相对论都自学掉了。这状况总让我想起了某天我大学同学在市里图书馆自习,偶遇电视台来采访的情景:记者问之在看什么书,答“广义相对论”。我妈从电视上看到告诉我时,我想当时的记者应该和我一样感受到了强烈的震撼。而现在为了上好大学物理,我把自己也震撼了。更刺激地是,我在课堂上甚至讲过一次黑洞白洞的物理学原理,我估计台下的学生们和台上的我一样,其实都是一头雾水。不过这段经历也给我带来意外的收获,重新打造了甚至拓展了我的物理基础,还有就是遇到了一个好学生。
教大一物理课的期间,一位坐前排的男学生吸引了我的注意力。他特别爱课堂上问问题,角度也很新颖,幸好我是按大于百分之一百二十来准备备课内容的,勉强能够应付他的问题。不过我对他提问的方式非常有印象,觉得有可能适合做研究。教了一段时间课后,我便试探性地问他有没有兴趣参加我研究小组的讨论班。
他来了,不过最开始我们也只是一如平常地听报告,偶尔他也提提问题、做个报告。到学期快结束时,他过来找了我,希望能切入实际课题。当时我正想着和北京大学的袁晓茹老师如何把机器学习和可视化有机结合起来,恰好袁老师办了一期可视化的暑期培训班,我便派他学习去了。开学回来时,他在讨论班给大家回顾了培训班的内容,有个点我觉得很有意思,就是如何将三维的数据通过二维的方式渲染出来。因为我们小组研究的一个方向,步态识别在当时要么依靠视频数据即三维数据来完成的,要么通过平均获得二维图像来实现。前者耗时长精度高,后者可实时但精度低一些,那么可视化领域的这项技术能否挪过来,在二维模板上保持住三维的时间信息呢?
我只是把这个初步且不成熟的想法分享给他。而后他很快就把这个想法细节化,并实现了。需要注意的是,不要小看这个实现,说起来简单,里面经历了多少的尝试、失败只有个中人的他才能体会。经过CVPR的拒稿,然后再根据意见修改,初步的工作发表在ECCV2010上,而完整的工作则发表在2012年的IEEE Transactions on Pattern Recognition and Machine Intelligence(简称IEEE TPAMI)上,一个曾经被计算机学科认为,发表一篇就可以吹一辈子牛的期刊上。几个评审都给予了高度的评价,指出这一工作的思路以前没见过,属于原创性很高的成果。这项工作后来被大坂大学一个专做步态识别的小组,在他们发布的新步态数据集进行了第三方测试,被认为是当时的前六个state-of-the-art算法之一,排名第三。而我学生在TPAMI发表其工作时,那年他才大三刚结束,他叫王晨。考虑到这类期刊投稿、审稿到接收的时间一般在一至两年,本科生能在此期刊上发表,绝对是非常罕见的。
这是第一种寻找学生的办法。不管学生是否以后跟你读研,通过本科期间进入实验室、参与讨论班和课题的方式,学生都能尽早获得科学的、系统的从事科学研究的能力。从培养学生的角度来看,这也是值得的。当然,这种方式的不足在于,与研究生相比,本科生的课业压力相对较大,很多情况下,有可能导师花了时间来指导,但不一定能达到期望的目标。
第二种方式则是到研究生选拔时间再选择。这里有三次能找到好学生的时间节点。
第一次,是在暑假左右的夏令营:好一些的学校,会邀请可能来本校读研以及拟本校直研的学生参加夏令营,让这些学生了解相关专业和细分了方向的实验室及老师情况,以便于选拔优秀研究生。对导师来说,则可以利用实验室介绍和交流环节来吸引与自己研究方向、兴趣一致的学生。
对学生来说,在基于我上一篇讲的寻师技巧的前提下,不妨在此期间开始写信联系导师。不过在邮件联系导师时,务必注意基本的礼貌。如写信的格式,不要英雄不留名字,让老师们看完信也不知道是谁写的;也最好只写给一位老师的,千万不要傻乎乎地群发找导师邮件。那样的话回信的责任心会被平均到低于阈值,然后会没有一个老师回信。也请耐心等老师的回复,不要过于着急去问一位老师;也尽量不要用一看就没有诚意的统一模板来写联系信。
第二次,是9月份的推免,这一次将从全国的推免生中筛选符合本校本学科发展的学生,以及对第一次安排还不太满意的进行再次筛选。与第一次只是意向性的双向承诺相比,这一次将最终确定推免生是否来本学院就读研究生。从统计意义来讲,这两次的学生综合能力要相对好一些,因为这些学生都是学院或系根据报名学生的简历及在校期间的GPA(俗称绩点)做了初筛的。简历和绩点能从多个侧面反映学生的能力,包括成绩的稳定性,在某些课程的学习能力、如人工智能专业喜爱看到的数学课高分,以及相应的科研经历,如是否做过某些课题、是否参加过ACM竞赛、数模竞赛,有无企业相关实习经验等。
在这两次选学生的环节,导师也需要谨慎。比如由于夏令营并非一家开设,有些学生可能同时申请了多家,因此,他们也在做多项选择,尤其是简历一看就比较优秀的学生,很有可能最终会选择排名更靠前的学校来读书。又比如学生可能也会在专业硕士和科学硕士之间、收费与不收费、有无住宿、学校推荐的研究方向等多因素上进行考虑。在这些情况下,导师和学生事实上都不得不找对自己有利的平衡点,确保名额和机会都不被浪费掉。
第三次,除去这两次机会,还有一次通过全国研究生统考来获得读研资格的机会。一般来说,笔试的内容包括英语、政治和专业课。根据分数分布和拟录取人数比例来划定研究生面试线。然而,需要指出的是,专业课的成绩事实上不太能反映考生的科研能力,尤其是真正读研后,研究生的方向非常细化,往往与专业课基础知识是否扎实没有绝对的关联性。所以,单凭这个分数来筛选的话,有可能挑到高分低科研能力的学生。
作为对比,国外在筛选研究生的笔试环节时,较少采用这样一种能依赖记忆力和刷题方式获得高分的方式。以美国为例,其研究生入学考试,一般是要求GRE分数。该分数体现了学生的英文阅读能力和词汇量、数学基础以及英文文章写作能力。这些能力都能更好地帮助评判考生的科研能力。
既然已经按分数筛选了能进入面试的学生,那如何进一步去选择呢?理论上,面试的老师们需要从1)基础、综合能力、兴趣爱好、应变能力、心理素质等方面进行全面的评估,2)同时也应该考核学生在具体研究方向上的科研能力,因为每个人的天赋是不同的,以理工科来说,有些人动手能力强,有些人数学基础好,有些人编程能力强,诸如此类。
但由于面试规则的限制,面试老师又是来自学院的不同方向,有可能无法判断学生的具体科研能力,也难以根据可能相吻合的导师的研究方向来针对性的提问了。另外,因为多数情况下,每个考生的面试时间只有十五分钟,也极有可能因为第一印象形成的锚定效应导致对学生的错误判断,导致面试成绩好但实际科研能力一般的被选择进来。
要避免这一问题,一方面需要面试的老师们有丰富的经验和责任心,另一方面可能需要在录取后进行进一步的筛选和评估。我个人的建议是,不妨请自己小组的研究生和老师一起进行一轮评估,因为他们对研究方向的认识比面试组的导师们更具体,在技术细节上更容易判断学生是否有真材实料,在基础上也更清楚学生的功底。
这样的面试,从理论上来讲,应该先于研究生面试前进行,不管是博士还是硕士,才真正从学生和导师双向公平的角度来择优选择学生,且有机会选择到一些分数不太高,但确实有研究天赋的学生,尤其是那些严重偏科的。毕竟到了研究生阶段,我们更应看重的是科研能力,而非死记硬背的本事。
我这里有个研究生就比较有这样的代表性。他叫田宇坤,他的英语连大学英语六级都没过,不过我一开始就没注意到这个问题。来我这后,主要从事人群计数的研究。在提出一个新的算法并做完实验后,他将论文草稿发给我。当我在电脑上打开论文,才发现他的论文比天书还难看懂,不仅低级错误一大箩,甚至study的复数形式都写成studys,而且语言中也分析不出什么清晰的逻辑,以致于花了很长时间才从一片迷茫中走出来。我甚至有一段时间曾在我的学生群吐槽,说没过大学六级的学生以后一律不要。
不过抱怨归抱怨,论文还是得认真改的,毕竟帮学生走完一套完整的研究生流程,论文写作指导是必需的。修改了多少遍不太记得了,学生自己在改的过程中优化了多少次算法也记不得了,我只记得今年10月22日,码农节的前两天,这篇论文经过二审后正式被CCF A类期刊IEEEE Transactions on Image Processing全文接收。
这件事,也让我在反思,也许我们在选拔人才的时候,没必要要求他有太全面的科研素质,创新能力才是学生最需要体现出来的,不足之处可以通过研究生期间的学习和导师有经验的指导来弥补。
这大概是我觉得可以寻找好学生的一些经验和体会。从我个人来讲,当老师最有成就感的事就是培养一批优秀的毕业生。而寻找到好的学生,那就有了更多在其研究方向上超越导师的可能性,就可以事半功倍,而导师也会因学生的成就顺便“沾沾光”,即所谓的“高徒出名师”。
如果学生选好了,可以说高徒出名师的条件就具备了,那怎么养成呢?下回分解!
张军平
2019年11月4日
参考文献:
1.Chen Wang, Junping Zhang, Liang Wang, Jian Pu, Xiaoru Yuan.Human Identification Using Temporal Information Preserving Gait Template.IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 34, no. 11, pp. 2164-2176, 2012.
2.Yukun Tian, Yiming Lei, Junping Zhang, James Z. Wang. PaDNet: Pan-Density Crowd Counting.IEEE Transactions on Image Processing, accepted, 2019.