转载自 | AI科技评论作者 | 陈彩娴隔着13个小时的时差,坐落于美国东南部的亚特兰大应已接近深夜,我们的访谈也接近尾声。谈起当年的文理分科考试,杨笛一调皮又自信地说起自己文理都是第一名的辉煌成绩,与通话前半个小时回忆初入ACM班的“无所适从”俨然鲜明的对比。来自陕西省兴平市西郊高级中学的杨笛一,在2009年高考中以优异的成绩考入上海交通大学,并在俞勇老师的演讲感染下加入了聚集各路竞赛大神的ACM班。本科期间便已发表4篇顶会论文,一作2篇,获得2012年谷歌Anita Borg 计算机学科女性奖学金、2013年上海交大致远杰出学生奖学金。再后来,杨笛一从上海交大毕业后,又赴卡内基梅隆大学语言技术研究所攻读硕士、博士,28岁成为佐治亚理工学院学院的助理教授。近日,杨笛一更是以在NLP领域的卓越成就,入选2020年“福布斯30位30岁以下科学精英榜”(Forbes 30 Under 30 list in Science)。但事实上,杨笛一的科研之路并非如上述计算机罗列成就信息般的冰冷、平面,仿佛没有经历过挫折。相反,杨笛一作为一位“梦想的攀岩者”,在攀登的过程中,也曾受过惨淡成绩的打击、优秀同龄的碾压,自信荡然无存,一度想过放弃。相比之下,杨笛一也是幸运的,因为在她的成长路上,她遇到很多帮助她的人,比如ACM班的导师俞勇,陈天奇、张伟楠、陆秋霞等学长学姐,以及CMU的博士生导师Robert Kraut、Eduard Hovy等人。因此,如今已为人师的杨笛一常常将“带好学生”视为自己的一大责任,希望能够将从以前导师身上学到的可贵品质传承给自己的学生。 1
图注:从左到右,Eduard Hovy、杨笛一、Robert Kraut从在学长学姐的帮助下摸索科研的小白,到如今立志将Social NLP发展为一门有影响力的学科,杨笛一的蜕变,不仅是源于在ACM班的early success,还源于其在CMU所接受的语言知识训练,及两位博导的鞭策。“如果我现在身上有一点点ambitious(有野心)的特质,那么一定是受Eduard Hovy的影响。”杨笛一说道。在LTI做科研期间,Eduard经常对杨笛一说一句话:“Think big and Think deep.”(想得宏大,想得深刻。)当杨笛一向他请教问题时,Eduard常常引导她从整个研究领域去思考当下正在进行的小研究。比如,杨笛一与Eduard讨论一个令她困惑许久的小问题时,Eduard会建议她往后退一步,从远大的视野去看问题,去思考这个问题在整个研究领域中所处的位置,以及这个问题背后最大的问题是什么。再比如,杨笛一从事的研究比较新,Eduard常鼓励她树立影响整个学科的意识。不仅是完成眼前的学业任务,而是思考建立学科的最基本问题:“你愿意怎么样去影响它,又应该怎么样去影响它?如果让你建立一个新的学科,你应该怎么做?”另一位导师Robert Kraut对杨笛一的塑造,不仅体验在鼓励她用自己的研究推动领域的发展,还体现在他对科研的兴趣与执着。杨笛一不掩崇拜地谈起,Robert是一位真正的的学者,如今已经退休,七十多岁的高龄,但还坚持自己写代码,写一作论文,自己跑实验:“他真的很热爱做研究,同时又十分严谨,就事论事。”作为学生,杨笛一在与他合作的过程中,有时候做研究只满足于一个结果,而Robert则会提出五六种可能,指出这个结果不适合哪些场景,鞭策学生从多方面去思考当前的问题有哪些不足。此外,Robert会注重引导她去关注其他学科(如心理学与认知学)的研究,有意识地激发她将自己的研究与其他学科的知识相结合。读博期间,杨笛一与两位导师合作完成一篇工作“Who did what: editor role identification in Wikipedia”,获得ICWSM 2016的最佳论文提名。
论文链接:https://www.cc.gatech.edu/~dyang888/docs/icwsm2016.pdf在这项研究中,杨笛一等人通过分析英语版维基百科的编辑内容,以识别编辑人员所扮演的角色,并研究每个角色如何影响文章质量,从而帮助研究人员与社区管理人员更好建立一个健康、繁荣的社区。其中,Robert从搜索的角度给建议,使用LDA方法研究搜索主体的角色,最终确定存在社交网络家、事实核查员、权威专家、文字编辑、维基“地精”、反破坏者、事实更新人员与维基百科工作人员等八种角色,且大多数编辑人员一般扮演其中1-3个角色;而Eduard则从语言建模的角度给建议,提出要将行为分类与多角色的假设在模型中体现出来。杨笛一在读博期间的另一项重要研究是结合NLP与推荐系统去识别癌症病人与医生之间的交流。团队与美国癌症协会(American Cancer Society)合作,从大规模对话中识别出病人的疾病症状、需求,从而将病人与医生匹配。基于协会所提供的真实数据进行分析,在ACS的网络平台上搭建推荐系统,将寻求不同类别帮助的病人与不同的志愿者相匹配。目前,已有超过一万个病人使用该系统。同样地,Eduard从语言的角度指导,而Robert从用户的角度出发,研究病人需要的帮助,比如癌症化疗带来的脱发、情感需求等。在两位导师的指导下,杨笛一对交叉学科的研究有了更深刻的理解:模型不仅要具备信息查询与匹配的功能,还要以鼓励的方式去真诚地传达情感支持。攻读博士后期,杨笛一也曾在斯坦福大学的NLP Group做了半年访问博士生,师从麦肯·阿瑟天才奖获得者Dan Jurafsky。Dan是她的博士论文委员会的委员之一,也是影响杨笛一最深的导师之一。“CMU位于匹兹堡,学术重镇;斯坦福位于硅谷,受硅谷的文化影响比较多。”这两所顶级高校的学习经历,加之后来在Google AI的博士后经历,都令杨笛一的科研能力有了质一般的提升。如今,杨笛一专注于Social NLP研究,不只是局限于发表论文、完成一个小的项目,而是看得更高、更远,希望将这个研究方向发扬光大。4
女性也可以做科研
2019年8月起,杨笛一加入佐治亚理工学院担任助理教授,隶属于机器学习中心(Machine Learning Center),成为社会与语言技术实验室(Social and Language Technologies Lab,SALT)的负责人。SALT主要研究Social NLP,将语言学、社会科学与机器学习相结合,研究语言的本身内容及其在不同社交场景下的作用。无论是推荐系统还是NLP,杨笛一始终感兴趣的研究方向都是人机交互,以人为中心,构建社会感知的智能系统,以支持人与人之间、人与计算机之间的交流和互动。尽管在自己的研究领域上小有建树,但走上教师岗位后,杨笛一发现,她的经历并不能够代表大多数女性科研人员,同时也会心有疑惑:“为什么没有那么多女生读博?”她曾获得许多荣誉,有些是面向所有群体,比如读博期间连续三年获得Facebook博士生奖研金、斯坦福EECS新星奖等,但也有一些荣誉是专门针对女性的,比如谷歌Anita Borg 计算机学科女性奖学金、当选“2019年人工智能领域30位最具影响力女性研究员”等。