楊淨 豐色 發自 凹非寺
量子位 | 公眾號 QbitAI
清華姚班大神
陳丹琦
,剛剛有了最新榮譽。
斯隆研究獎得主
。
斯隆研究獎,素來有
“諾獎風向標”
的稱號。
獲得這個獎項的研究者,將得到為期兩年
75000
美元的獎金。
此前,與陳丹琦同為姚班畢業生的鬲融、馬騰宇,都曾因獲此獎項而引發關注。
說回到
陳丹琦
本人,正是計算機科學領域近來最受關注的華人青年學者之一。
她是08級清華姚班校友,也是資訊學競賽圈內頗具傳奇色彩的一位女選手——
CDQ分治演算法
就是以她的名字命名。2008年,她代表中國隊斬獲一枚IOI金牌。
而她那篇長達 156 頁的博士畢業論文《Neural Reading Comprehension and Beyond》,更是一度火爆出圈。
不光獲得當年斯坦福最佳博士論文獎,還成為了斯坦福大學近十年來最熱門畢業論文之一。
現在,她已前往普林斯頓大學從頭搭建NLP小組,成為該校計算機系的助理教授。
從零搭建NLP小組
此次獲獎的原因,正是基於陳丹琦在NLP領域的成就與潛力。
目前研究方向主要聚焦在兩方面。
一個是開發基本的方法來學習語言和知識表徵,以及它們之間的相互作用。尤其是兩個問題:對人類知識(比如陳述性、常識性)如何從文字中獲得,以及智慧系統如何表示、檢索、推理、使用這些知識。
另一個是建立實用的系統,包括問題問答、資訊提取和對話代理,尤其是如何將這些方法推廣到現實場景中去。
她的小組成員中,有一位也是清華畢業生,2019年清華特獎得主
高天宇
。
最新一篇研究,他也參與其中。
這篇研究提出了一種全新評估機制——基於預測歷史的問題重寫機制,該機制可以跟人類的判斷形成更好的關聯,讓對話問答
(CQA)
效果更好。
來到普林斯頓大學之前,她曾是斯坦福大學的博士研究生,師從NLP大神
Christopher Manning。
這可是位泰斗級別的人物,他是斯坦福NLP小組的創始人。
他寫的書籍《Foundations of Statistical Natural Language Processing》(統計自然語言處理)和《Introduction to Information Retrieval》(資訊檢索導論),幾乎是每個NLPer的必讀入門書。
在Manning教授的指導和學習下,2014年她發表了一篇《A Fast and Accurate Dependency Parser using Neural Networks》,可以說是深度學習依存分析方法的
“開山之作”
。
他們的方法在保持精度的前提下,直接將解析速度提高了 60 倍。
而她在學術界的影響力還在繼續,最典型的就是在博士畢業之際寫的那篇156頁論文,上線僅四天就獲得上千訪問量。
這篇論文主要聚焦於神經閱讀理解,簡言之,就是構建於深度神經網路之上的閱讀理解模型。包含了闡述原理構建模型、以及結合現有成果構建實際應用場景兩個部分。
去斯坦福拜入NLP泰斗門下,之後再去普林斯頓搭建NLP小組,回想這兩段經歷,陳丹琦曾這樣解釋她做出選擇的原因。
陳丹琦告訴叉院學姐公眾號:
我選斯坦福的時候其實不太知道自己要做什麼,是後來選了research group才定的方向。
去普林斯頓是因為我認為對我來說這是個機會,一個成長和承擔的機會。
因為普林之前沒有NLP,能在這邊能建立一個自己的group。
演算法以她的名字命名
每次提到清華姚班,一定都少不了陳丹琦的名字。
事實上回顧她的整段經歷,如今的成就少不了她自身的努力和周遭的支援。
她出生於湖南長沙,高中就讀於長沙市雅禮中學。
這所學校是資訊學奧林匹克競賽強校,歷史上一共9名學生獲得過IOI
(國際資訊學奧林匹克競賽)
金牌,比以“資訊學競賽第一校”著稱的紹興一中還要多一名。
而陳丹琦就是在2008年——高三的時候拿下了第20屆IOI金牌,也成為了湖南省首位金牌女選手。
並以此保送到清華姚班,與馬騰宇、餘佳俊等成了同學。
據雅禮中學報道,陳丹琦的父親
陳擎
是國防科技大學數學系的副教授。
他在陳丹琦很小的時候就發現女兒對數字很敏感,且做題速度、思考問題的全面性都比同齡孩子厲害。
於是,父親就對她進行了有意識的培養:她從三年級就開始練奧數,初一參加全國數學聯賽就獲得了湖南賽區二等獎,初三獲得了特等獎,並開始接觸資訊學。
奧賽圈耳熟能詳聞的
“CDQ分治演算法”
就是這位學霸在集訓期間提出來的,並以她的名字命名。
還有著名的
插頭DP
,也是她在集訓隊時的成果。
基於這個工具,她還發表了篇論文《基於連通性狀態壓縮的動態規劃問題》。
據當時報道,在學習之餘,她也很會放鬆自己,最愛看《名偵探柯南》,還練得了一手好行書。
也正是在這一段奧賽征程中,她遇到了自己未來的丈夫——
俞華程
。還在博士畢業論文中狠狠秀了一波恩愛。
(手動狗頭)
嗯,就是下圖最右邊這位帥小夥。
陳丹琦在致謝部分表示,她從15歲(上高一時)就認識了他,從高中的競賽到清華的本科四年,再到一起去斯坦福讀計算機博士,最後在博士畢業前四個月結婚,俞華程一直都是他最好的朋友、最敬佩的人。
而俞華程本人,也很厲害,他在斯坦福大學讀博期間,因為發表多篇重要論文而
提前2年畢了業
,隨後在哈佛大學做博士後研究,主要關於理論計算機,最後也成為了普林斯頓大學的助理教授。
除了這些經歷之外,陳丹琦還不止一次呼籲女性也要更多參與到理工、計算機學科建設當中來。
她曾在“叉院學姐”採訪中表示:
不要刻意強調女生不擅長學工科、計算機這個事情。
男女之間的GAP會越來越不存在。
計算機領域還有多位華人獲獎
本次斯隆獎一共有118名來自化學、數學、物理、計算機等領域的科學家獲得。
其中,計算機領域一共頒給了20名全球科學家,其中包括5位華人,而華人獲獎者中,
最多的是來自清華的校友
,除了陳丹琦還有:
07級清華電子工程系本科、現CMU助理教授
方飛
。
她博士畢業於美國南加州大學,主要研究方向為博弈論和機器學習。
03級清華自動化專業本科、控制科學與工程專業碩士畢業生、現UCLA助理教授
顧全全
。
他的研究方向為統計機器學習,重點是開發和分析用於機器學習的非凸最佳化演算法,ICML 2021年他有8篇論文都被接收。
還有兩位華人獲獎者為:
港科大校友宋舒然,現哥倫比亞大學助理教授,主要研究計算機視覺與機器人技術。
以及現UIUC教授Li Bo,她的研究方向為機器學習及其安全、隱私和博弈論。
而在計算機科學方向之外,本次斯隆獎有6名華人學者獲數學獎,其中2名來自北大數院,另有3名獲物理獎。
參考連結:
[1]https://sloan。org/fellowships/2022-Fellows
[2]https://antkillerfarm。github。io/dl/2018/01/17/Deep_Learning_31。html#%E6%A6%82%E5%86%B5
[3]https://stacks。stanford。edu/file/druid:gd576xb1833/thesis-augmented。pdf
[4]https://www。emnlp2014。org/papers/pdf/EMNLP2014082。pdf
https://arxiv。org/abs/2112。08812