NLP(自然语言处理)界有哪些神级人物?

包括基本生平、主要理论贡献、主要作品、八卦新闻~
可以的话请理一下这些大神的师承关系~
喵~
收藏者
0
被浏览
121

5 个回答

D东 LV

发表于 2025-4-9 12:22:19

好像没有人提 Chris Dyer 。自然语言处理界不太清楚,机器翻译界那完全是。。
翻译之神说,Percy Liang 写的 Brown Clustering 还不够快。于是 cdyer 用 C++ 又重新实现了一遍。
翻译之神说,词要对齐。于是 cdyer 写了 fast_align。
翻译之神说,MERT 太难懂。于是 cdyer 用凸包半环证明了一遍。
翻译之神说,中文要分词。于是 cdyer 写了 zhseg。
翻译之神说,要有 decoder。于是 cdyer 写了 cdec。
翻译之神说,要有(灵活的)神经网络训练框架。于是 cdyer 写了 cnn (现在的 dynet)。

tccrock LV

发表于 2025-4-9 12:36:37

我来换个画风。
nlp不一定要跟fancy的模型/architecture/神经网络扯上关系。
基础理论研究也是很重要的,以及拓展nlp的应用和对其他领域的影响。
我要说的是,女性科学家:Julia Hirschberg.
据wiki上写,她今年入选美国国家工程院院士。目前职位是哥大cs chair(这中文应该咋翻译?系头?)。而且她还是"among the first to combine Natural Language Processing (NLP) approaches to discourse and dialogue with speech research."
方向更偏computational linguistics/ pragmatics. 她的contribution主要在研究语言现象(code switching, hedge and cues, deception, multi-linguistics, prosody, etc.),很多工作都是基于搭建corpus,纯pragmatic研究而非dl/ml模型。她也是最早开始关注discourse 和speech analysis的那批学者。如果有同学做对话要投interspeech,应该很熟悉她的名字。
她在国内影响力没有其他人那么大的原因,我猜是因为语言现象的差异。很少听说国内有人关注pragmatics,或者用中文来做pragmatics.

NLP(自然语言处理)界有哪些神级人物?-1.jpg

我觉得相较于其他nlp的大牛们,Julia的影响在于让nlp的研究cover更多语言现象,使natural language understanding可以在真正“linguistic”意义上被计算。(感觉这是个病句....我已经不会写中文了... :/ )
对于某一种语言现象,提出猜想并且用cs的方法而非语言学理论来验证/建模,再观察结果并且应用到nlp其他方面,这就是Julia大部分的研究内容。
最早接触她时我还没进nlp, 在跟商学院的教授一起做项目。很多商院discourse analysis的研究都会看Julia的paper。除了商院,education, language study,neuroscience, cognitive science, etc都会在Julia的paper里找灵感和新方法。
看了上面的答案,如果说所有大牛都有什么共同点的话,应该是非常静心于自己的领域吧。
老板跟她关系超好,今年请她来给talk,开心!! 马上要见到真人了!!!!


NLP(自然语言处理)界有哪些神级人物?-2.jpg

Reference:
wiki page: Julia Hirschberg
google scholar: https://scholar.google.com/citations?hl=zh-CN&user=Qrd7FCoAAAAJ&view_op=list_works

sjorz LV

发表于 2025-4-9 12:49:52

Michael Collins
出生英国的绅♂士一枚。前些年从MIT到窝校来。虽然我不是学这个方向的。。不过大多学生都觉得他课也讲得很好。他的NLP课和Shree Nayar的CV课每学期都是被各种迅速报满。。还有很多人来audit
这是Coursera上面他的NLP课:
Coursera - Free Online Courses From Top Universities
现在他homepage上也有lecture notes了。
感觉本科生去找他套磁做research还是蛮不容易的,因为他实在太忙了,一般要持之以恒地骚扰他,表现出诚意,然后向他证明你的实力。如果说进到他组里去的话他还是比较nice。
以下摘自wikipedia:
Michael J. Collins (born 4 March 1970) is a researcher in the field of computational linguistics.
His research interests are in natural language processing as well as machine learning and he has made important contributions in statistical parsing and in statistical machine learning. One notable contribution is a state-of-the-art parser for the Penn Wall Street Journal corpus.
His research covers a wide range of topics such as parse re-ranking, tree kernels, semi-supervised learning, machine translation and exponentiated gradient algorithms with a general focus on discriminative models and structured prediction.
Collins worked as a researcher at AT&T Labs between January 1999 and November 2002, and later held the positions of assistant and associate professor at M.I.T. Since January 2011, he has been a professor at Columbia University.

时空猫的问答盒 LV

发表于 2025-4-9 13:00:11

首先想到的不应该是Michael Collins吗……
Michael Collins (Columbia), Jason Eisner (JHU), David Yarowsky (JHU)三位师兄弟(David > Michael > Jason)均师承于Upenn的Mitchell Marcus教授,也就是著名的Penn Treebank的作者。这三位是NLP界公认的大神,研究领域各有侧重。collins/eisner对NLP结构学习领域贡献极大,yarowsky早年研究词义消歧,是著名的yarowsky algorithm的作者,后来做了很多跨语言学习的开创性工作。
Michael Collins的学生中著名的有Terry Koo (Google), Percy Liang (Stanford), Luke Zettlemoyer (UW);Jason Eisner的得意弟子当首推Noah Smith (CMU->UW);David Yarowsky似乎没有什么特别杰出的学生。
Stanford NLP掌门Chris Manning,以《统计自然语言处理基础》一书以及Stanford NLP (toolkit) 而闻名。Dan Jurafsky,著有《语音与语言处理》一书,具有深厚的语言学背景。稍微提一下Manning的学生Richard Socher,近几年声名鹊起,在dl4nlp领域风头一时无两,属年轻一代翘楚。
UCBerkeley的Dan Klein,早些年在无指导学习领域建树颇多。Percy Liang也是他的学生。
UIUC的Dan Roth,Chengxiang Zhai (偏IR);MIT的Regina Barzilay;哦,当然还有Brown大学的Eugene Charniak大神(Charniak parser),Brown大学也可算是没落的贵族了,和UPenn有点儿相似。
欧洲方面,Joakim Nivre (Uppsala University),代表工作是基于转移的依存句法分析。Philipp Koehn,著名机器翻译开源系统Moses作者,14年加入JHU。
当然,在工业界也是NLP群星璀璨。Google有Fernando Pereira坐镇,此外还有Ryan McDonald,Slav Petrov等句法分析领域绕不开的名字;而最近Michael Collins也加入了Google;IBM则有Kenneth Church;提一嘴Tomas Mikolov (Facebook)吧,word2vec作者,虽然他严格意义上并不属于NLP核心圈子,但是不得不说,近两年acl/emnlp近半数文章都给他贡献了citation,能做到这种程度的人极少。
以上我提到的人都是对NLP领域有重要基础性贡献并经过时间考验的(citation超过或者接近1W),除了以上提到的,还有很多非常优秀的学者,比如Kevin Knight,Daniel Marcu, Mark Johnson,Eduard Hovy,Chris Callison-Burch,年轻一代的David Chiang,Hal Daume III等。
暂时想到的就这些人,水平有限,抛砖引玉。相对而言,虽然华人学者近几年在ACL/EMNLP等顶级会议上占据越来越重要的地位,但是对NLP领域具有重要基础性贡献的学者相对还是很少的。

dyanother LV

发表于 2025-4-9 13:11:26

谢邀。远的不太清楚,倒是知道这么几位:
Christopher Manning, Stanford NLP
他的学生:
Dan Klein's Home Page
然后这位的学生:
Percy Liang

然后Stanford另一位NLP大神:
Dan Jurafsky
这位在JHU的“亲戚”(误:两位都是俄罗斯/苏联后裔,据说俄语的last name几乎是一样的,现在的不同拼写多半是当年是美国边境官员的杰作):
David Yarowsky
(很巧两位都是语言学的大拿)
另一位JHU公认的大神:
Jason Eisner
另一位叫Dan的大神:
Dan Roth - Main Page

很早很早就开始研究parsing并一战成名的Michael Collins大神,是Percy Liang的另一位师父:
Michael Collins
(有空接着更……)

您需要登录后才可以回帖 登录 | 立即注册