選單

達摩院“聽悟”進階版亮相雲棲大會,支援中英文自由說

“你只需專注會議,其餘一切交給聽悟。”11月4日,2022杭州雲棲大會,阿里巴巴達摩院研發的智慧產品“聽悟”進階版亮相大會現場。僅需一臺個人電腦,觀眾和媒體記者們即可體驗全面整合達摩院語音語言智慧的最新AI助理,感受會議場景的前沿AI實踐。

這款“AI神器”在雲棲大會上引起廣泛關注,它不僅“聽得準”,而且“悟性高”,可為體驗者實時轉寫會議、秒速生成會議紀要、自動區分不同說話人、生成影片字幕,並具備會議實時翻譯、問答自動提取等高階能力,在企業會議、金融盡調、媒體訪談、教育培訓等泛會議場景有廣泛應用前景。

達摩院“聽悟”進階版亮相雲棲大會,支援中英文自由說

【“聽悟”使用介面展示】

相比去年雲棲大會發布的版本,“聽悟”今年在技術和產品功能上進行了全方位升級,新增三大核心AI能力:中英文自由說,採用內嵌多語種專家模組的“混合專家系統”,無需手動切換語種即可準確識別中英大篇幅混說的場景;會議實時翻譯,邊說邊翻譯,無需等待,讓跨國溝通更加高效順暢;QA問答對抽取,結合說話人特徵、多階段訓練技術,自動提取問題,讓訪談整理更輕鬆。

達摩院“聽悟”進階版亮相雲棲大會,支援中英文自由說

【“聽悟”進階版可實現問答抽取,人物及對話為示例】

同時,針對會議行業夥伴及企業使用者的多樣化需求,“聽悟”釋出了PaaS產品形態,以簡單易呼叫的介面方式開放核心能力,並提供多種前沿創新演算法,從而滿足企業在音影片會議、培訓直播、招聘面試、智慧客服等多種細分場景的不同需求。

達摩院“聽悟”進階版亮相雲棲大會,支援中英文自由說

【“聽悟”在招聘細分場景中的應用】

阿里巴巴達摩院語音實驗室負責人鄢志傑表示,“過去十年‘人-機’交流是語音AI解鎖的核心場景,更復雜的‘人-人’交流是下一個高地,未來聽悟將在‘人-人’交流場景繼續深入探索,提供安全、保真、精準的AI識別、分析與理解能力,並基於內容為企業提供多種智慧辦公服務,讓AI真正為人所用,替人分擔,協助處理重複繁瑣的工作事務。”

開啟App看更多精彩內容