香港中文大學(xué)湯曉鷗:CVPR2023年最佳論文獎(jiǎng),全部由中國(guó)學(xué)者完成 世界實(shí)時(shí)
2023-07-06 15:00:33    網(wǎng)易科技報(bào)道


(相關(guān)資料圖)

7月6日消息,2023世界人工智能大會(huì)開(kāi)幕式上,香港中文大學(xué)湯曉鷗教授回顧了在大模型中,中國(guó)學(xué)者所做的原創(chuàng)的貢獻(xiàn)。

例如,他的學(xué)生王曉剛2011-13年在CVPR和ICG兩個(gè)視覺(jué)最重要的會(huì)議上,全球共有29篇文章做深度學(xué)習(xí),其中有14篇出自他們實(shí)驗(yàn)室。當(dāng)時(shí),團(tuán)隊(duì)的18項(xiàng)工作在全世界第一次將深度學(xué)習(xí)用到視覺(jué)問(wèn)題上,包括人臉識(shí)別、人臉檢測(cè)、人臉重建、物體檢測(cè)、人體姿態(tài)等計(jì)算機(jī)視覺(jué)最核心的問(wèn)題。

此外,湯曉鷗談到,2009年學(xué)生何愷明博士曾在碩士期間取得了CVPR最佳論文,這是CVPR25年歷史上從亞洲出來(lái)的第一篇最佳論文。此后,何愷明在微軟和Facebook工作后,還解決的深度網(wǎng)絡(luò)梯度傳遞的問(wèn)題,獲得了2016年的最佳論文。在此基礎(chǔ)上,人們可以有效的訓(xùn)練超過(guò)百層的深度學(xué)習(xí),在大模型時(shí)代,以Transformer為核心的大模型,包括GPT系列,普遍采用了這個(gè)結(jié)構(gòu)。

湯曉鷗表示,兩周前,我們自動(dòng)駕駛大模型從9155篇文章中脫穎而出,獲得了CVPR2023年的最佳論文獎(jiǎng)。根據(jù)谷歌學(xué)術(shù)統(tǒng)計(jì),這是改革開(kāi)放40多年來(lái)第一篇全部由中國(guó)學(xué)者完成的國(guó)際計(jì)算機(jī)視覺(jué)三大頂級(jí)論壇最佳論文。(湯姆)

關(guān)鍵詞: