国内有哪些自然语言处理的牛人或团队?

国内有哪些自然语言处理的牛人或团队?
收藏者
0
被浏览
106

5 个回答

limao100 LV

发表于 2025-4-9 12:29:57

鉴于图中内容缺少相当一批资深的教授和研究员(例如整个做少数民族语言的老师都没有列入,有相当一批很少曝光的老师也没能捕捉到),本图仅供八卦参考,不具有任何代表意义。
如有额外信息,欢迎批评指正留言,定期更正。
更新(19.7.4)
------------------7 . 4----------------------
画了一张国内NLP师承关系图,包括我知道的从80年代到现在比较活跃的人。限于学识有限,难免错误百出,还望各路大神帮忙指正哈!
更新(19.7.2)
--------------------7.2----------------------

国内有哪些自然语言处理的牛人或团队?-1.jpg

黄色代表较为年轻正当好年华的老师,随着颜色从红色,到粉红,到绿色,到蓝色,年龄依次增大。(或者师承上依次向上)
大字体的代表各高校或单位nlp的创始人,中间“二刘”属于中国nlp开山鼻祖的人物。
实线箭头代表师承关系。虚线只代表有关系,可能只是一个单位,可能有过合作,也可能是担任兼职博导(例如王海峰担任哈工大SCIR实验室的兼职博导,周明兼职赵铁军实验室的博导)

D东 LV

发表于 2025-4-9 12:43:50

看了一圈没发现有张老师,还是出来给我低调的(前)老板涨涨人气吧。
亲身推荐西湖大学张岳(Yue Zhang)老师,脾气好人品棒性格赞idea强顶会论文多,人非常nice。
先说老板:张老师金光闪闪的简历一直让我羡慕不已,清华计算机本科->牛津CS PHD->剑桥博后,博后结束后加入新加坡SUTD做AP,去年转去西湖大学做副教授。 在SUTD期间和Lu Wei 老师两个人把SUTD的NLP方向顶会论文排名提升到了世界前十  [1],在某几年的nlp顶会论文发表数排名世界前三。各种NLP顶会的area chair 几乎做了个遍。因此我从一开始就觉得要抱紧老板的大粗腿(逃...)。
再说我:作为一个跨专业读博的学生,我几年前刚加入张老师在新加坡的组里的时候几乎没有编程背景[2],毫无Linux使用经验。 当时的我有多么坑,可以看我的这个悲情的故事[3]。 然而老板并没有给我太多压力或者嫌弃我(或者我没有察觉到...),依然耐心地让我慢慢摸索尝试建立信心[4]。最终在张老师的耐心指导下,我的工作慢慢步入正轨,最终顺利毕业啦。感谢老板!
--------------------------密---封---线---内---不---要---答---题---------------------------
以下介绍仅限于我在张老师新加坡组里的体验...懒得整理想到啥就写啥...以后或许有更新或许没有...
张老师为人非常和善nice, 和学生基本是以朋友相待。组里经常会有聚餐,然后老板就喜欢吃饭的时候和大家讲笑话(虽然我一直觉得他的笑话太冷了...[5])。 组里并没有规定的工作时间,这非常合我这种自由散漫的人的胃口。博士最后两年我基本上都是睡到自然醒,然后十一点左右穿个大拖鞋去办公室干活。不过这种自由的环境下的产出也非常高,绝大都数学生/访问学生/博后/RA在张老师的指导下都会有顶会论文。有一段时间张老师每周都要开一次组会,希望大家可以志愿做个报告分享最近看了的论文,然而由于志愿做报告的人不多,组会变成了他给我们上nlp的基础课。。。每次和老板讨论论文时都惊讶于他超强的记忆力,随口就是“xxx在x年x会议x论文里讨论了xxxxx“, 每次都不带重样的,简直就是行走的Endnote。张老师的学术直觉非常好idea非常多,他会非常支持我自己尝试各种我的不靠谱的idea[6]。老板极度热爱打羽毛球,而且喜欢和打得好的人一起打, 我曾经一度怀疑我能在组里待着是因为我的羽毛球打得比他好[7]可以陪他练球哈哈。
毕业已经有大半年了,现在还时常怀念在新加坡那蓝天白云阳光沙滩的四年自由时光还有SUTDNLP group的氛围。
PS: 我来美国之前去了一趟西湖大学拜访了老板,他在西湖大学的团队已经很壮大了,学术氛围非常浓厚。有意的同学可以尝试申请下。

mssafia LV

发表于 2025-4-9 12:54:30

欢迎关注我们!

复旦大学自然语言处理实验室开源工具
https://github.com/fastnlp/fastNLP

陈宸 LV

发表于 2025-4-9 13:09:20

国内自然语言处理学者众多,很难一一枚举。我就只罗列清华大学计算机系的相关老师,方便大家了解。都是我随便写的,没有字斟句酌,排名也不分先后,如有疏漏和错误多请指出,不要见怪。:)
孙茂松老师:早年以中文分词研究成果闻名,计算机系人智所自然语言处理课题组(THUNLP)的学术带头人,曾任国内自然语言处理唯一的一级学会、中国中文信息学会副理事长。研究兴趣比较广泛,涵盖中文信息处理、社会计算、信息检索等。最近孙老师带队研制的“九歌”自动作诗系统登上了央视的《机智过人》节目,在几个挑战环节战胜了人类,社会影响很大。
马少平老师:计算机系人智所信息检索课题组(THUIR)的学术带头人,同时是中国人工智能学会副理事长、中国中文信息学会副理事长。研究兴趣偏重搜索引擎,为本科生上《人工智能导论》必修课,深受欢迎。
朱小燕老师:计算机系智能技术与系统国家重点实验室(即人智所)主任,信息获取课题组的学术带头人,研究兴趣偏重问答系统、情感分析、文档摘要等。
李涓子老师:计算机系软件所知识工程课题组的学术带头人,研究兴趣偏重知识图谱与知识工程。研制推出的XLORE是国内屈指可数的大规模知识图谱。
王建勇老师:计算机系软件所教授,IEEE Fellow,研究兴趣偏重数据挖掘与知识工程,是非常纯粹的学者,近年来涉猎一些实体链接、关系抽取等文本挖掘工作。
唐杰老师:数据挖掘领域的青年学者,主要研究社会网络分析、社会计算和数据挖掘,也会做一些自然语言处理研究。他主持研制的Aminer学术搜索网站影响巨大。
刘洋老师:自然语言处理领域的青年学者,主要研究统计机器翻译。我有幸跟刘洋老师一个办公室,非常佩服他的学术品味、工作态度和为人。他最近与搜狗联合研制的搜狗翻译效果非常好。
张敏老师:信息检索领域的青年学者,主要研究推荐系统与情感分析。是信息检索与数据挖掘的著名会议WSDM 2017的PC主席。
刘奕群老师:信息检索领域的青年学者,主要研究搜索引擎用户的行为建模,近年来用眼动手段开展研究工作,得到较多的学术关注。是信息检索顶级会议SIGIR 2018的PC主席。
黄民烈老师:自然语言处理领域的青年学者,过去主要研究情感分析、文档摘要,近年来开始在智能问答和人机对话发力。
朱军老师:机器学习领域的青年学者,主要研究统计机器学习,也会在自然语言处理和知识获取等方面做一些研究,例如比较有名的StatSnowball,MedLDA等。
贾珈老师:多媒体处理领域的青年学者,早期研究语音,现在偏重社会媒体的多媒体处理,进行情感计算等研究,研制了很多很有意思的应用(如衣服搭配推荐等)。
喻纯老师:人机交互领域的青年学者,研究面向文本输入等方面的交互设计,例如如何设计更便捷的输入法等。从我们自然语言处理领域来看创意很有意思、脑洞很大,例如在VR中通过头的摆动输入文本。
刘知远老师(也就是我):早年研究关键词抽取和社会标签推荐,现在偏重知识图谱、表示学习和社会计算。
值得一提的是,从去年开始我们系开始实施人事制度改革,采取国际的Tenure Track(教学研究系列)制度,进入该系列的老师均有招收博士生的资格,极大的提高了青年教师的生产力。因此,以上绝大部分老师均有招生资格,欢迎对这些方向感兴趣的同学联系他们。
如果有还想了解的信息,可以评论告诉我,我尽量提供或转告相关老师。:)

limao100 LV

发表于 2025-4-9 13:20:57

说下我大概了解的情况。
学校(排名不分先后):
哈工大社会计算与信息检索实验室:刘挺老师坐镇,教师包括:秦兵、张宇、车万翔、赵妍妍、刘铭、张伟男、丁效等老师,实验室共7个组,另外王海峰老师也是实验室兼职博导。
哈工大智能技术与自然语言处理实验室:王晓龙老师坐镇,教师包括刘秉权、刘远超   、孙承杰等老师
哈工大机器智能与翻译研究室:赵铁军老师坐镇,教师包括杨沐昀、郑德权、徐冰老师等,另外周明老师是实验室兼职博导。
哈工大深圳智能计算研究中心:王晓龙老师坐镇,包括陈清才、汤步洲、徐睿峰、刘滨等老师,实力很强。
哈工大深圳人类语言技术组:徐睿峰老师坐镇,情感原因发现做的比较好。
哈工大另外做NLP的老师包括:关毅、王轩等。
清华大学自然语言处理与社会人文计算实验室:孙茂松老师坐镇,包括刘洋、刘知远等老师。论文发的非常多。
清华大学交互式人工智能(CoAI)课题组:朱小燕老师坐镇,包括黄民烈等老师。Dialogue System做的非常好,论文非常多。
清华大学智能技术与系统国家重点实验室信息检索课题组:马少平老师坐镇,包括张敏、刘奕群等老师。信息检索做的非常好,论文非常多,前段时间刚拿了CIKM唯一的最佳论文(因为一作是学生,跟最佳学生论文合二为一了)。
清华大学另外做NLP的老师还有李涓子、唐杰、朱军等老师,李老师知识图谱做得好,唐老师数据挖掘(尤其是学者画像)做得好,朱老师偏向机器学习和贝叶斯等做的很好。
北京大学计算语言学教育部重点实验室:教师包括:王厚峰、万小军、常宝宝、李素建、孙栩、严睿、穗志方、吴云芳等(包含其他实验室的老师)。万老师、李老师、常老师等发论文很多。
北京大学语言计算与互联网挖掘研究组:万小军老师、孙薇薇老师。万老师主要做自动摘要、文本生成、情感分析与计算等,论文非常多。
中科院NLP组主要集中在自动化所模式识别国家重点实验室下属的中文信息处理研究组,另外计算所有刘群老师组和软件所也有孙乐老师做。具体老师包括刘群、宗成庆、赵军、孙乐、王斌、徐君、张家俊、刘康、韩先培、何世柱等老师。论文非常多。
复旦大学自然语言处理组:黄萱菁、邱锡鹏等老师,发论文很多。
复旦大学知识工场:肖仰华老师知识图谱做的非常好,论文发的很多。
苏州大学自然语言处理组:做机器翻译、情感分析、信息抽取等,论文发的很多。教师包括张民、周国栋、姚建民、李正华、熊得意、李军辉、洪宇、陈文亮等老师。其中张老师、姚老师、李老师都是哈工大毕业的,张老师也是哈工大的兼职博导,论文很多。
东北大学自然语言处理实验室:机器翻译做的非常好,还成立了自己的公司,对外合作很多。姚天顺老师是创始人,朱靖波老师坐镇,教师包括肖桐、任飞亮、张春良等老师。
浙江大学:陈华钧、赵洲等老师,陈老师知识图谱做的很厉害。
中国人民大学:文继荣、赵鑫、徐君、窦志成等老师。文老师现在是院长,之前在MSRA,信息检索非常厉害。
上海交大:赵海老师,主要做机器翻译、句法分析等。
东南大学:漆桂林老师,知识图谱做的很厉害。
大连理工信息检索实验室:林鸿飞老师坐镇,包括杨志豪、王健、张绍武、孙媛媛、张冬瑜、杨亮等老师。主要做信息检索,隐喻、幽默等语料库做的非常好。
西湖大学:张岳老师,之前在新加坡,论文发的非常非常非常多,剑桥2016年统计的全世界发论文的数量好像排第二。
南京大学自然语言处理研究组:包括陈家俊、戴新宇、黄书剑等老师。
天津大学:张鹏老老师,信息检索做的很好。
北京理工大学:黄河燕老师、张华平老师。黄老师是北京理工大学计算机学院院长,主要研究机器翻译,担任好几个副理事长,享受国务院特殊津贴。中科院的自然语言处理工具包就是张老师做的,另外跟刘群老师合作发了不少论文,我之前工作时实习生开发的NER就是借鉴的他的层叠马尔可夫模型而二次开发和优化的。
武汉大学语言与信息研究中心:姬东鸿等老师。
厦门大学智能科学与技术系自然语言处理实验室:包括史晓东等老师,主要做机器翻译、知识图谱、信息抽取等。
山东大学:聂礼强老师,信息检索做的非常好,论文很多。之前在新加坡,新加坡发SIGIR太多了。。。
南开大学:杨征路老师,主要做信息检索。
北京邮电大学:王小捷老师。
北京语言大学:于东老师,主要做机器翻译、人机对话等。
华东师范大学:吴苑斌老师,记得应该是复旦大学黄萱菁老师的学生。
山西大学:李茹老师,山西大学计算机学院副院长。
郑州大学自然语言处理实验室:实验室网页最近打不开了。
黑龙江大学:付国宏、张梅山等老师。

<hr/>以下是港澳台地区的高校(排名不分先后):
台湾大学自然语言处理实验室:主要研究方向包括知识图谱、机器翻译、问答、自动摘要、信息检索等,论文非常多。
香港科技大学人类语言技术中心:论文非常多,牛人也不少。
香港中文大学文本挖掘组:主要研究方向包括文本挖掘和信息检索。
澳门大学自然语言处理与中葡翻译实验室:主要做机器翻译,做的非常好,论文也非常多。
香港理工大学社会媒体挖掘组:主要研究方向包括社会影响力建模、社会媒体分析、观点摘要、观点追踪、跨语言情感分析等,这个实验室对外合作很多,比如北大李素建老师、MSRA的韦福如老师等。
<hr/>国内工业界(排名不分先后):
百度王海峰老师以及带领的自然语言处理部+百度研究院做NLP的一些组,内部NLPC平台集成了几十个NLP算子,一些算子每天调用量都能上亿次(不要问我为啥知道这么详细,因为15-16年我参与开发过2个算子,被加到开发者组了,经常有群邮件告知各算子的调用情况),几乎涵盖所有的NLP任务,部分技术在百度AI开放平台-全球领先的人工智能服务平台-百度AI开放平台开放API,少量技术在github开源代码;
MSRA周明老师带领的NLC组,组内论文发的非常多,尤其是几个高级研究员、主管研究员;
哈工大和科大讯飞联合实验室:实验室主任是刘挺老师,阅读理解做的非常好;
华为诺亚方舟的刘群老师以及带领的团队;
小米:王斌老师坐镇,王老师翻译的书相信大部分人都看过吧。
今日头条的李航老师;
阿里巴巴、腾讯NLP做的也不少,只是个人感觉都是很多团队在做,比较分散,没有集中到一起。如果有人总结比较好的话,欢迎告知。
其他很多创业公司也有大牛坐镇,只是太多、太分散了,不再赘述,感兴趣的可以私聊。
以上就是我这些年的总结,毕竟精力有限,难免挂一漏万。谢谢!

您需要登录后才可以回帖 登录 | 立即注册