近日,一年一度的計(jì)算機(jī)視覺學(xué)術(shù)盛宴CVPR(IEEE Conference on Computer Vision and Pattern Recognition)剛剛落下帷幕。在本屆CVPR大會中,為了促進(jìn)機(jī)器學(xué)習(xí)與計(jì)算機(jī)視覺技術(shù)在圖像和視頻壓縮領(lǐng)域的發(fā)展,由Google、Apple、Netflix等公司聯(lián)合舉辦的第五屆CVPR-CLIC2022(The 5th Workshop and Challenge on Learned Image Compression)競賽吸引了全球大量的隊(duì)伍參與,其中也包括阿里巴巴、字節(jié)跳動、商湯等在業(yè)內(nèi)處于領(lǐng)先地位的科技公司及清華、北大、中科大等頂尖高校。
在歷經(jīng)兩個多月的激烈角逐后,通信工程學(xué)院何剛老師帶領(lǐng)團(tuán)隊(duì)Kingslayer(團(tuán)隊(duì)成員:王勇、徐莉、張文莉)和北京快手科技有限公司合作在圖像質(zhì)量感知賽道(Perceptual Quality Track)中獲得全球第三(季軍),高校排名第二的優(yōu)異成績。何剛老師是通信工程學(xué)院圖像傳輸與處理研究所(圖像所)骨干成員,圖像所隸屬于ISN國家重點(diǎn)實(shí)驗(yàn)室,負(fù)責(zé)人為李云松教授。
團(tuán)隊(duì)在CVPR-CLIC2022競賽全球第三的獲獎證書
團(tuán)隊(duì)發(fā)表于CVPR2022 Workshop的FFDN質(zhì)量評價論文相關(guān)信息
當(dāng)今圖像與視頻成為人們獲取信息的最主要方式,然而圖像視頻從采集、壓縮、存儲到傳輸,都可能發(fā)生失真,從而導(dǎo)致接收到的視覺信息丟失,因此評價圖像視頻的質(zhì)量好壞對圖像恢復(fù)、圖像檢索、圖像質(zhì)量監(jiān)控系統(tǒng)等各個方面有著重要的作用及廣泛的應(yīng)用。同時,構(gòu)建更加準(zhǔn)確高效的客觀質(zhì)量評價模型代替較為費(fèi)時費(fèi)力的主觀質(zhì)量評價已成為研究與發(fā)展的趨勢。在今年舉辦的CVPR-CLIC2022圖像壓縮競賽中,圖像質(zhì)量感知賽道旨在讓參賽選手設(shè)計(jì)更加準(zhǔn)確高效的有參考質(zhì)量評價模型(FR-IQA)來對壓縮受損的圖像進(jìn)行客觀質(zhì)量評價。但由于圖像壓縮受損的多種算法未知,且大多數(shù)不同失真圖與參考圖十分相似導(dǎo)致差異化不明顯,甚至包含很多人眼主觀難以給出評價的失真圖像。因此對搭建有參考質(zhì)量評價模型提出較高的挑戰(zhàn)難度。
針對這一具有挑戰(zhàn)的任務(wù),何剛老師帶領(lǐng)團(tuán)隊(duì)Kingslayer設(shè)計(jì)了一個聚焦特征差異化網(wǎng)絡(luò)的質(zhì)量評價模型(Focused Feature Differentiation Network for Image Quality Assessment,F(xiàn)FDN),模型針對失真圖與參考圖相似導(dǎo)致差異化不明顯的情況使用通道注意力聚焦失真圖與參考圖的差異化特征圖。同時,使用多尺度特征融合,在不同感受野下進(jìn)行特征融合,使聚焦后的差異化特征得到最大化利用。此外,針對單一評價指標(biāo)在質(zhì)量評價中存在的部分局限性,使用多評價指標(biāo)融合的方式來提升評價效果。最終在比賽測試集上準(zhǔn)確率為79.6%,獲得了第三名的優(yōu)異成績,且前三名差距較小,準(zhǔn)確率均高于79%,大幅超出第四名。在其他評價指標(biāo)ELO SRCC和ELO PLCC上得分分別為0.95和0.96,均位于第三名。ELO SRCC和ELO PLCC指標(biāo)用于反映模型打分與人類主觀打分的相近程度,從指標(biāo)結(jié)果來看,F(xiàn)FDN質(zhì)量評價模型很大程度上接近人眼主觀評價水平。
提出的FFDN質(zhì)量評價網(wǎng)絡(luò)的模型結(jié)構(gòu)圖
中國汽車工業(yè)協(xié)會吁車企避免以低于成本價傾銷商品
比亞迪近期大幅下調(diào)多款智能駕駛車型售價,引發(fā)市場對新一輪價格...(806 )人閱讀時間:2025-05-31第一期“人工智能與機(jī)器人產(chǎn)業(yè)創(chuàng)新發(fā)展專題研討會”成功召開,共
近日,第一期“人工智能與機(jī)器人產(chǎn)業(yè)創(chuàng)新發(fā)展專題研討會”在東方...(693 )人閱讀時間:2025-05-30DeepSeek發(fā)布新版R1 能力接近美國頂尖模型
人工智能起步公司深度求索(DeepSeek)發(fā)布其熱門推理模...(1002 )人閱讀時間:2025-05-30特斯拉股東集體喊話馬斯克
據(jù)報道,5月28日,一群長期投資特斯拉的養(yǎng)老基金股東聯(lián)名致信...(603 )人閱讀時間:2025-05-30新一代神威超級計(jì)算機(jī)上首次實(shí)現(xiàn)全球公里尺度大氣物理-化學(xué)全耦
世界首富馬斯克重新回到7x24小時工作的狀態(tài)
李想:正開發(fā)汽車輪椅套件產(chǎn)品
特斯拉重啟中國零部件進(jìn)口