热播热播剧免费播放入口频道,japanese色国产在线看视频_蓝光免费播放

當前位置: 首頁 -> 綜合新聞 -> 理工要聞 -> 正文
理工要聞
我校多項最新研究成果被計算機視覺頂級會議CVPR 2025錄用
2025-03-06

國際計算機視覺與模式識別會議(CVPR 2025)即將于2025年6月11日至15日在美國田納西州納什維爾召開,該會議是由電氣電子工程師學會(IEEE)舉辦的計算機視覺和模式識別領域的頂級會議,屬于中國計算機學會(CCF)推薦的A類國際學術會議,在Google Scholar指標榜單中位列全球學術出版物第二,僅次于Nature。本年度召開的CVPR 2025共收到13008篇有效投稿,其中2878篇被接收,錄取率為22.1%。在近期公布的CVPR 2025的錄取結果中,我校計算機科學與工程學院師生多項最新研究成果入選,相關簡要介紹如下:


《Customized Condition Controllable Generation for Video Soundtrack》論文由學院亓帆副教授以及所指導的2023級碩士研究生馬錕生撰寫。該研究針對視頻配樂生成領域中音樂和音效問題展開深入研究,提出了一種創新的頻譜散度掩碼注意力和引導噪聲優化的視頻配樂擴散模型框架。該框架融合對比視覺—聲音—音樂預訓練、頻譜散度掩碼注意力機制以及評分引導噪聲迭代優化三大核心模塊,有效地將音樂和音效這兩種生成條件的模態信息映射到統一的特征空間。通過這一機制,模型在保持音效與音樂獨特特性的同時,顯著增強了對復雜音頻動態的捕捉能力。此外,即便在視頻配樂優化條件與視頻信息未經復雜學習訓練的情況下,該方法仍能為音樂創作者提供高度可定制的控制能力,使配樂生成過程更加靈活高效。



《Language Guided Concept Bottleneck Models for Interpretable Continual Learning》論文由學院余璐副教授以及所指導的2023級碩士研究生韓昊宇撰寫。持續學習(Continual Learning)的目標是使學習系統能夠不斷獲取新知識,同時不遺忘先前學習的信息。持續面臨的挑戰在于緩解災難性遺忘(catastrophic forgetting)的同時保持跨任務的可解釋性。現有的大多數持續方法主要側重于保留已學知識以提高模型性能。然而,隨著新信息的引入,學習過程的可解釋性對于理解不斷演化的決策機制至關重要,但這一方向卻鮮少被探索。本研究提出了一種新穎框架,通過整合語言引導的概念瓶頸模型(Concept Bottleneck Models, CBMs)來同時應對這兩大挑戰。利用概念瓶頸層(Concept Bottleneck Layer),與CLIP模型對齊語義一致性,從而學習人類可理解且能跨任務泛化的概念。通過聚焦于可解釋的概念,不僅增強了模型隨時間推移保留知識的能力,還提供了透明的決策洞察。在多個數據集上驗證了方法的有效性,其中在ImageNet子集上的最終平均準確率超越現有最優方法達3.06%。此外,通過概念可視化展示模型預測依據,進一步推動了可解釋持續學習的理解。



《SCSegamba: Lightweight Structure-Aware Vision Mamba for Crack Segmentation in Structures》論文由學院石凡教授和程徐教授所指導的2023級碩士研究生劉輝撰寫,通訊作者為賈晨博士后。該研究提出了一種面向邊緣設備優化的輕量化結構感知視覺Mamba網絡SCSegamba,通過動態特征建模機制與極簡高效的設計實現了復雜場景下的高精度裂縫分割。其核心創新在于首先基于低秩分解與動態門控機制設計了輕量級門控瓶頸卷積,相比于標準卷積,低秩分解使得網絡的參數規模和GFLOPs分別降低了64.60%和71.63%,在大幅減少計算需求的同時保持了裂縫形態特征提取能力;結構感知狀態空間模塊利用創新性的多路徑結構感知掃描策略感知裂縫像素之間的拓撲結構鄰接關系,提高了特征圖的語義連續性,相比于傳統的平行掃描策略,在F1和mIoU上分別提高了1.19%和0.84%;此外,輕量級的多尺度特征分割頭能夠以極低的0.01M參數規模和0.42GFLOPs的計算需求生成有效抑制背景噪聲的高質量分割圖。該網絡模型總體僅具有2.80M參數規模與18.16GFLOPs,特別是與基于輕量Transformer的方法相比,參數規模減少了52.54%。在包含低對比度、多光照條件和復雜背景噪聲等挑戰性場景的結構裂縫檢測數據集上,該網絡的F1分數和mIoU指標分別達到了0.8390和0.8479,與次好的方法相比分別提高了2.22%和1.74%,展現出最優性能表現,為邊緣計算設備上的實時結構裂縫檢測提供了可行的輕量化解決方案。



學校始終堅持以國家戰略需求為導向,以智能技術創新為驅動,持續深耕人工智能和計算機視覺等前沿領域。此次多項成果入選CVPR 2025,標志著學校在人工智能、計算機視覺及交叉領域的研究取得新的突破。