選單

90後博導研發石墨烯人工喉,可將聾啞人聲音“翻譯”成規律聲音

是什麼讓這位 90 後清華學霸,放棄華為工程師的高薪工作,轉而來到高校做老師?

雖然大廠高薪有時不免和 996 掛鉤,但在每年動輒上千萬畢業生就業壓力之下,能進大廠的註定是 “少數派”。可陶璐琪偏不,他渴望的 “少數派” 是做科研,也正是在華為的經歷,堅定了他做學術的決心。

90後博導研發石墨烯人工喉,可將聾啞人聲音“翻譯”成規律聲音

圖 | 陶璐琪(來源:受訪者)

在華為時他主要做麥克風和聽筒等手機音訊器件,假如一款手機因為聽筒收到 2%-3% 的投訴,華為會讓供應商送來一批聽筒,陶璐琪要做的是,透過 X 射線解剖這些耳機,並用顯微鏡找出問題。工作並非沒有價值,但卻讓他覺得略顯機械化。

當時,重慶大學電氣學院新成立了協同創新中心,他師兄是裡面的執行主任,並且當時重慶大學也有一個 “百人計劃”,最終陶璐琪從深圳轉到西南,藉此機會申請到重慶大學特聘研究員的崗位。

華為的待遇雖然比目前在高校的待遇更優厚,但他還是更喜歡做探索性研究。自由的科研空間,是重慶大學對他的 “致命” 吸引力。

90後博導研發石墨烯人工喉,可將聾啞人聲音“翻譯”成規律聲音

圖 | 正在做實驗的陶璐琪(來源:受訪者)

“狗說的你能聽懂麼?”

事實上,做科研的滿足感要從陶璐琪在清華讀直博說起。

有一次,他給師弟師妹介紹小組代表性工作,提到了他的師兄田禾研發的石墨烯狗耳機,他說這款耳機能把人類指令傳遞給小狗,小狗聽到指令後能做出站起或坐下的動作。

這時,一位師弟問他:“那狗說的你能聽懂麼?”

這個問題讓他陷入了思考,不管談話物件是動物還是人類,只要 TA 用的語言不是自己的母語,我們就根本聽不懂。

同樣,聾啞人雖然也能發出“嗯嗯啊啊”的聲音,但畢竟不是一種可以被解析的“語言”,那麼能否做一個翻譯器,去翻譯聾啞人發出的聲音呢?

而石墨烯人工喉的想法,也正始於這次意外談話之中,後來人工喉也成為他在清華期間的代表作。

當時在清華大學微電子所教授任天令的帶領下,陶璐琪擔任一作的論文《具有聲音感知能力的智慧石墨烯人工喉》(An Intelligent Artificial Throat with Sound-Sensing Ability Based on Laser Induced Graphene)發表在《自然 - 通訊》上,這也是他在清華讀書期間發表的 11 篇一作論文中最出色的論文之一。

90後博導研發石墨烯人工喉,可將聾啞人聲音“翻譯”成規律聲音

圖 | 相關論文(來源:受訪者)

在用鐳射製備石墨烯的過程中,他們發現

石墨烯具備良好的聲學效能,給其加上訊號後,它就能像揚聲器一樣發出聲音。

比如,把一首歌的訊號轉成電訊號,施加給石墨烯之後它就能播放音樂。後來在調節石墨烯的製備厚度時發現,當厚度特別薄的時候,隨便有點風吹草動,石墨烯的電學訊號就會受到影響,這看起來這是一種干擾,但透過給石墨烯施加不同的力,會產生有規律的電學訊號。

90後博導研發石墨烯人工喉,可將聾啞人聲音“翻譯”成規律聲音

圖 | 人工喉示意圖(來源:受訪者)

當把很薄的石墨烯薄膜放在喉嚨上,薄膜就能檢測喉嚨處微弱的震動,且能把這種震動對應成各種聲音。基於這一特性,他們提出了石墨烯人工喉概念,併成功製備出相關實驗室產品。

關於其中原理,他最近對媒體表示:“聾啞人士雖然不能說話,但是喉嚨可以震動,把這個(石墨烯材質的黑色薄片)放在喉嚨外部,我們可以檢測喉嚨的震動。震動檢測出來以後,第二步就是識別不同的震動,再把它轉換成一種聾啞人士的‘語言編碼’。”

聾啞人的 “嗯啊” 聲可轉變為規律性聲音

製備中,他們選擇了一個低成本的行動式鐳射平臺,並採取鐳射直接書寫技術。其中,把 PI(Polyimide Film,聚醯亞胺薄膜)膜位於 450nm 的鐳射器下,透過鐳射器的直射轉換成鐳射誘導的石墨烯。

比如,把清華大學的標誌和一個 6 釐米 x4 釐米的矩形輸入到計算機控制軟體中,就可在 PI 膜上產生相同的圖案。基於此,陶璐琪用一個簡單矩形鐳射誘導的石墨烯作為人工喉。

90後博導研發石墨烯人工喉,可將聾啞人聲音“翻譯”成規律聲音

圖 | 人工喉製備(來源:受訪者)

聲音收發一體化,是石墨烯人工喉的最大特點,它不僅能接收聲音,還能發射聲音。人工喉主要包含發聲器件和收聲器件,收聲時利用石墨烯的壓阻效應,發聲則基於石墨烯的熱聲效應,如此便實現了單器件的聲音收發同體。

具體來說,當利用訊號發生器在石墨烯上施加交流電壓時,週期性的焦耳熱會導致空氣膨脹,從而產生聲波;當對石墨烯施加低的恆壓直流偏置時,喉繩的振動會導致石墨烯電阻發生變化,進而產生電流的波動。因此,

人工喉可以同時作為聲源和探測器來工作。

此外,人工喉內部擁有對壓力非常敏感的多孔結構,因此能感知喉嚨發聲時的微弱振動,聾啞人發出的特殊聲音也因此可被識別。它能發出 100Hz-40kHz 的寬頻譜聲音,可將聾啞人的聲音轉換為強度可控的規律性聲音,進而讓聾啞人 “開口說話”。

具體來講,當人工喉在檢測喉嚨震動的時候,它會聽到聾啞人喉嚨處發出的 “嗯嗯啊啊” 的聲音,

透過將這些聲音和預先錄製好的語言庫建立一一對映關係,就可以將聾啞人喉嚨的無規則振動、轉變成預先錄製的語言,比如 “今天天氣不錯” 等等。

圖 | 對揚聲器對不同聲音的響應(來源:受訪者)

與傳統的聲學換能器相比,人工喉的工作機理主要是利用熱聲效應和壓阻效應。當作為聲源工作時,人工喉可以產生頻率從 100Hz 到 40kHz 的寬頻聲音;當作為聲音檢測器工作時,人工喉可對不同型別的聲音和喉部振動模式表現出獨特的響應,它還能識別咳嗽、哼哼和尖叫等其他動作導致的微弱喉嚨振動。

這是因為,咳嗽、哼聲或尖叫會引起喉帶的振動,這些聲音被人工喉檢測到以後,也會相應地產生可控的聲音。因此,人工喉可實現從無意義的聲音、到可控的和預先設計的聲音的轉換。

大多數啞巴的人天生就是聾人,他們雖然不會說話,但是喉帶可以振動,並能以自己的方式發出聲音,但這對正常人來說這是毫無意義的。

而人工喉可將無意義的噪聲,轉化為可控和可理解的聲音訊號。

測試中,志願者需要首先接受培訓,當他們產生特定的咳嗽、哼哼或尖叫時,可以先用手勢語言告訴他們相應的意思。然後,志願者可透過一定時間的重複訓練來適應聲音強度,這一培訓過程和將指紋匯入 iPhone 的過程很相似。

可以聽聲音的人工喉

除了作為聲音探測器可以發聲之外,人工喉在檢測聲音時也有良好的響應,研究中陶璐琪將 25mm 的 PI - 鐳射誘導的石墨烯用兩個卡子獨立固定,並把揚聲器放在位於距離人工喉部 3 釐米的地方,對鞭炮聲、牛叫聲、鋼琴聲、直升機聲音、鳥叫聲和鼓聲進行了音訊測試。

測試發現,不同單詞的波曲線具有明顯不同的特徵,這有助於區分不同的單詞。此外,不同人發音的同一單詞的波曲線具有相似、但不相同的特徵,因此這可能是透過語音識別進行身份認證的關鍵因素。

90後博導研發石墨烯人工喉,可將聾啞人聲音“翻譯”成規律聲音

圖 | 人工喉相關示意圖(來源:受訪者)

但即便如此,人工喉距離應用也還需要努力,因為聾啞人並不知道怎麼把喉嚨振動和特定語言聯絡起來、才能對應出相應資訊,這需要一個漫長的學習過程,反而不如手語這樣已經成熟的語言系統。

不過,這也是陶璐琪繼續搞學術的動力。當初為了研究人工喉,他一年做了 50 組實驗、閱讀了 1200 篇文獻,即便如此實驗進展依然很艱難。

做人工喉要求環境非常安靜,而他當時所在的實驗樓下面是清華微納加工平臺,裡面發出的排風噪聲讓他根本無法做實驗。

他說:“好比身邊站著一群大媽在跳廣場舞,還放著鳳凰傳奇的音樂,(對於做實驗的)殺傷性比當時流行的勒索病毒厲害多了。”為此,他隔一兩天就拉著 60 斤重的裝置,跑到十幾公里外的北京 798 藝術區的一間消音室做實驗,一做就是大半年。

最近,陶璐琪獲評為重慶市 “青年拔尖” 人才,這是他進入 30 歲以後的一大殊榮。這位出生于山東威海的 90 後科學家,本科就讀於省內,博士北上就讀清華。

而當老師做科研,也給了他更多的責任,他會要求學生和他一樣健身,每週健身打卡三次堅持滿一年的學生,陶璐琪會給其報銷健身卡費用。

90後博導研發石墨烯人工喉,可將聾啞人聲音“翻譯”成規律聲音

圖 | 陶璐琪(來源:受訪者)

談及未來,他表示將加強與醫療機構的合作,探索感測器在醫療健康中的應用,響應國家 “健康中國 2030” 戰略的要求,推動科研成果從基礎研究向實踐應用的轉化。

不少看過他的此前報道的讀者,都成了他的“顏粉”,但其已經成家,不過他說歡迎報考重慶大學的碩士或博士。

-End-