選單

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

楊淨 豐色 發自 凹非寺

量子位 | 公眾號 QbitAI

清華姚班大神

陳丹琦

,剛剛有了最新榮譽。

斯隆研究獎得主

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

斯隆研究獎,素來有

“諾獎風向標”

的稱號。

獲得這個獎項的研究者,將得到為期兩年

75000

美元的獎金。

此前,與陳丹琦同為姚班畢業生的鬲融、馬騰宇,都曾因獲此獎項而引發關注。

說回到

陳丹琦

本人,正是計算機科學領域近來最受關注的華人青年學者之一。

她是08級清華姚班校友,也是資訊學競賽圈內頗具傳奇色彩的一位女選手——

CDQ分治演算法

就是以她的名字命名。2008年,她代表中國隊斬獲一枚IOI金牌。

而她那篇長達 156 頁的博士畢業論文《Neural Reading Comprehension and Beyond》,更是一度火爆出圈。

不光獲得當年斯坦福最佳博士論文獎,還成為了斯坦福大學近十年來最熱門畢業論文之一。

現在,她已前往普林斯頓大學從頭搭建NLP小組,成為該校計算機系的助理教授。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

從零搭建NLP小組

此次獲獎的原因,正是基於陳丹琦在NLP領域的成就與潛力。

目前研究方向主要聚焦在兩方面。

一個是開發基本的方法來學習語言和知識表徵,以及它們之間的相互作用。尤其是兩個問題:對人類知識(比如陳述性、常識性)如何從文字中獲得,以及智慧系統如何表示、檢索、推理、使用這些知識。

另一個是建立實用的系統,包括問題問答、資訊提取和對話代理,尤其是如何將這些方法推廣到現實場景中去。

她的小組成員中,有一位也是清華畢業生,2019年清華特獎得主

高天宇

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

最新一篇研究,他也參與其中。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

這篇研究提出了一種全新評估機制——基於預測歷史的問題重寫機制,該機制可以跟人類的判斷形成更好的關聯,讓對話問答

(CQA)

效果更好。

來到普林斯頓大學之前,她曾是斯坦福大學的博士研究生,師從NLP大神

Christopher Manning。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

這可是位泰斗級別的人物,他是斯坦福NLP小組的創始人。

他寫的書籍《Foundations of Statistical Natural Language Processing》(統計自然語言處理)和《Introduction to Information Retrieval》(資訊檢索導論),幾乎是每個NLPer的必讀入門書。

在Manning教授的指導和學習下,2014年她發表了一篇《A Fast and Accurate Dependency Parser using Neural Networks》,可以說是深度學習依存分析方法的

“開山之作”

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

他們的方法在保持精度的前提下,直接將解析速度提高了 60 倍。

而她在學術界的影響力還在繼續,最典型的就是在博士畢業之際寫的那篇156頁論文,上線僅四天就獲得上千訪問量。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

這篇論文主要聚焦於神經閱讀理解,簡言之,就是構建於深度神經網路之上的閱讀理解模型。包含了闡述原理構建模型、以及結合現有成果構建實際應用場景兩個部分。

去斯坦福拜入NLP泰斗門下,之後再去普林斯頓搭建NLP小組,回想這兩段經歷,陳丹琦曾這樣解釋她做出選擇的原因。

陳丹琦告訴叉院學姐公眾號:

我選斯坦福的時候其實不太知道自己要做什麼,是後來選了research group才定的方向。

去普林斯頓是因為我認為對我來說這是個機會,一個成長和承擔的機會。

因為普林之前沒有NLP,能在這邊能建立一個自己的group。

演算法以她的名字命名

每次提到清華姚班,一定都少不了陳丹琦的名字。

事實上回顧她的整段經歷,如今的成就少不了她自身的努力和周遭的支援。

她出生於湖南長沙,高中就讀於長沙市雅禮中學。

這所學校是資訊學奧林匹克競賽強校,歷史上一共9名學生獲得過IOI

(國際資訊學奧林匹克競賽)

金牌,比以“資訊學競賽第一校”著稱的紹興一中還要多一名。

而陳丹琦就是在2008年——高三的時候拿下了第20屆IOI金牌,也成為了湖南省首位金牌女選手。

並以此保送到清華姚班,與馬騰宇、餘佳俊等成了同學。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

據雅禮中學報道,陳丹琦的父親

陳擎

是國防科技大學數學系的副教授。

他在陳丹琦很小的時候就發現女兒對數字很敏感,且做題速度、思考問題的全面性都比同齡孩子厲害。

於是,父親就對她進行了有意識的培養:她從三年級就開始練奧數,初一參加全國數學聯賽就獲得了湖南賽區二等獎,初三獲得了特等獎,並開始接觸資訊學。

奧賽圈耳熟能詳聞的

“CDQ分治演算法”

就是這位學霸在集訓期間提出來的,並以她的名字命名。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

還有著名的

插頭DP

,也是她在集訓隊時的成果。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

基於這個工具,她還發表了篇論文《基於連通性狀態壓縮的動態規劃問題》。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

據當時報道,在學習之餘,她也很會放鬆自己,最愛看《名偵探柯南》,還練得了一手好行書。

也正是在這一段奧賽征程中,她遇到了自己未來的丈夫——

俞華程

。還在博士畢業論文中狠狠秀了一波恩愛。

(手動狗頭)

嗯,就是下圖最右邊這位帥小夥。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

陳丹琦在致謝部分表示,她從15歲(上高一時)就認識了他,從高中的競賽到清華的本科四年,再到一起去斯坦福讀計算機博士,最後在博士畢業前四個月結婚,俞華程一直都是他最好的朋友、最敬佩的人。

而俞華程本人,也很厲害,他在斯坦福大學讀博期間,因為發表多篇重要論文而

提前2年畢了業

,隨後在哈佛大學做博士後研究,主要關於理論計算機,最後也成為了普林斯頓大學的助理教授。

除了這些經歷之外,陳丹琦還不止一次呼籲女性也要更多參與到理工、計算機學科建設當中來。

她曾在“叉院學姐”採訪中表示:

不要刻意強調女生不擅長學工科、計算機這個事情。

男女之間的GAP會越來越不存在。

計算機領域還有多位華人獲獎

本次斯隆獎一共有118名來自化學、數學、物理、計算機等領域的科學家獲得。

其中,計算機領域一共頒給了20名全球科學家,其中包括5位華人,而華人獲獎者中,

最多的是來自清華的校友

,除了陳丹琦還有:

07級清華電子工程系本科、現CMU助理教授

方飛

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

她博士畢業於美國南加州大學,主要研究方向為博弈論和機器學習。

03級清華自動化專業本科、控制科學與工程專業碩士畢業生、現UCLA助理教授

顧全全

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

他的研究方向為統計機器學習,重點是開發和分析用於機器學習的非凸最佳化演算法,ICML 2021年他有8篇論文都被接收。

還有兩位華人獲獎者為:

港科大校友宋舒然,現哥倫比亞大學助理教授,主要研究計算機視覺與機器人技術。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

以及現UIUC教授Li Bo,她的研究方向為機器學習及其安全、隱私和博弈論。

與去年得主馬騰宇是同班同學,博士畢業論文是近十年最熱之一

而在計算機科學方向之外,本次斯隆獎有6名華人學者獲數學獎,其中2名來自北大數院,另有3名獲物理獎。

參考連結:

[1]https://sloan。org/fellowships/2022-Fellows

[2]https://antkillerfarm。github。io/dl/2018/01/17/Deep_Learning_31。html#%E6%A6%82%E5%86%B5

[3]https://stacks。stanford。edu/file/druid:gd576xb1833/thesis-augmented。pdf

[4]https://www。emnlp2014。org/papers/pdf/EMNLP2014082。pdf

https://arxiv。org/abs/2112。08812