選單

中科院軟體所在開源社群群智挖掘研究中取得進展

IT之家 10 月 24 日訊息,據中國科學院官網,近日,中國科學院軟體研究所網際網路軟體技術實驗室在開源社群群智挖掘研究中取得進展。

中科院軟體所在開源社群群智挖掘研究中取得進展

Gitter、Slack 等開源社群實時聊天平臺是目前開發者協作的主要溝通工具,在軟體開發和維護的過程中被廣泛使用。

社群聊天中包含了大量有價值的問題-解決方案資訊,這些資訊能夠有效地提高軟體質量和生產力。比如,開發者可以將專案開發過程中存在的安裝、編譯等問題推送到平臺上,經由其他開發者的回覆以解決這些問題。但由於社群群體聊天的對話存在耦合性和複雜性,現有方法難以對其挖掘和提取。

該研究面向開源社群中的開發者,針對開發者實時聊天內容中大量有價值的“問題-解決方案”資訊,提出了一種多層次模型 —— 面向群智的問題及解決方案自動提取技術(ISPY),有效構建了“問題-解決方案”(Issue-Solution)知識庫,實現了當前“問題-解決方案”資訊提取效能最優,在促進開源社群知識共享、提升問題解決效率等方面具有重要意義。

據介紹,研究團隊在 8 個開源社群的 4944 條聊天資料上測試 ISPY 模型的準確率、召回率以及調和平均值。

IT之家瞭解到,研究團隊還利用 ISPY 模型實現了在 StackOverflow 平臺上自動問答,以 6/26 的最佳答案、19/26 的候選答案被該平臺採納,進一步證明了該模型的有效性和實用性。