中文版English返回舊版

當前位置: 首頁 >> 學院新聞 >> 學院新聞 >> 正文

學院研究團隊在大數據挖掘研究中取得突破性進展

作者:金博 來源:188bet投注网站 時間:2021-04-16

近期,國際數據挖掘領域旗艦期刊IEEE Transactions on Knowledge and Data Engineering(TKDE)連續收錄了3篇我校188bet投注网站 /計算機輔助設計國家地方聯合工程實驗室金博教授團隊學術論文,3篇論文在基於時間序列的預測與分析領域取得突破性進展,論文通訊作者為金博教授。TKDE是中國計算機學會推薦的A類期刊,主要刊登計算機科學、人工智能、電子工程、計算機工程等領域在知識與數據工程方向的學術論文。

論文一:Diagnostic Sparse Connectivity Networks with Regularization Template (使用正則化模板來提取稀疏連通網絡)

該篇論文主要研究的是提取動態係統(序列數據)的特征間相關性,並形成稀疏連通網絡。該篇論文創新性的提出了一種共享自適應正則項(shared adaptive regularization,SAR)以及其對應的學習框架來提取動態係統的稀疏連通網絡。與傳統的LASSO方法不同,SAR在其基礎上可以同時考慮到所有的動態係統的共同性質,並將其映射到一個共享的稀疏正則模板中。該模板可以很好的還原出數據本身的連通性,讓每個動態係統更好的獲取自己的連通網絡;也會讓訓練並行的進行,大幅度提高計算速度。同時SAR又引入了一種半監督的鏈接約束技術,可以讓生成的連通網絡解釋性更強。該算法在模擬數據取得了相當好的效果。該研究將該算法提取出的稀疏連通網絡作為數據的特征進行後續的分類任務,在真實世界的數據集上有著很高的準確率以及較高的計算效率。在帕金森病的診斷任務中,該論文可以達到94%的準確率,並在模擬診療的過程中,表現出了良好的實用性。該研究提取出的稀疏連通網絡以及共享模板有著良好的解釋性,為數據特征間的內在關係分析(例如探索正常人與患病人的區別)提供了一個新的解決方案。

論文二:Prediction of Treatment Medicines with Dual Adaptive Sequential Networks(基於雙自適應序列學習網絡的治療用藥預測方法)

本研究是基於臨床醫療電子病曆數據提出的輔助用藥決策算法。預測治療藥物是許多智能醫療係統的關鍵任務。預測治療藥物可以幫助醫生為患者做出更佳的處方決策。但為了充分挖掘電子病曆數據的隱含價值信息,需要考慮數據本身的複雜性如:(1)多源異質性;(2)時間序列的複雜相關性(3)序列相互關聯性的動態特性。為了解決數據本身上述特性所帶來的挑戰,本文提出了雙自適應序列學習網絡模型用以提前預測下一階段的治療用藥。該模型主要由三部分組成。首先,使用分解的自適應長短項記憶網絡捕捉多個異質序列內部以及序列間的關聯性;然後,采用一種基於注意力的元學習網絡為分解的自適應長短項記憶網絡提供學習到的動態權重參數,以通過該網絡可為其產生多種相互關聯性。最後,引入基於注意力的融合網絡來融合曆史信息並將異質數據的表示嵌入融合到一起,以預測治療用藥。與現有的方法相比,本文所提出的端到端預測模型可以達到相對較好的預測性能,同時可為臨床治療用藥提供用藥決策支持。

論文三:CFFNN: Cross Feature Fusion Neural Network for Collaborative Filtering(協同過濾的交錯特征融合網絡)

該篇論文提出了一種用於融合用戶特征和項目特征的基於協同過濾的交叉特征融合神經網絡框架(CFFNN)。在這個框架中,該論文首先設計了一個包含多個MLP(多層感知機)模塊的特征提取層,以恰當的方式來提取用戶和項目特征。然後,利用交叉特征融合網絡將用戶特征和項目特征進行融合,並構建了一個自注意力網絡來確定用戶對項目的偏好。最後,將融合後得到的特征棧輸入到預測網絡中生成推薦。據我們所知,這是首次研究用戶特征和項目特征融合的工作,為基於神經網絡的協同過濾的未來發展開辟了新的研究可能性。在未來,團隊希望將模型擴展到基於內容的推薦場景。在這種場景中,可以考慮不同類型的用戶和項目特征之間的聯係,而不僅僅是嵌入層上提取到的信息。

以上工作得到了國家科技部重點研發計劃項目、國家自然科學基金麵上項目等的大力支持。

上一條:緬懷英烈學黨史,學院黨委組織黨員師生瞻仰關向應紀念館 下一條:188bet亚洲体育 創新論壇第一期成功舉辦