報(bào)告題目:視覺Transformer模型結(jié)構(gòu)設(shè)計(jì)及其應(yīng)用
報(bào) 告 人: 張敬 副教授
報(bào)告時(shí)間:2024年01月11日(周四)10:00-11:00
報(bào)告地點(diǎn):逸夫樓445A(線上)
研究生院 電氣與控制工程學(xué)院
2024年1月10日
報(bào)告人簡介:
張敬,博士,2015年畢業(yè)于中國科學(xué)技術(shù)大學(xué)自動(dòng)化系,目前在悉尼大學(xué)計(jì)算機(jī)系從事博士后研究,主要從事計(jì)算機(jī)視覺與深度學(xué)習(xí)等人工智能領(lǐng)域的相關(guān)科學(xué)研究工作,在 CCF A類國際會(huì)議/期刊以及IEEE 匯刊等國際著名期刊已發(fā)表學(xué)術(shù)論文90余篇,谷歌學(xué)術(shù)引用6200余次。長期擔(dān)任著名國際學(xué)術(shù)期刊和會(huì)議審稿人、程序委員會(huì)委員、高級(jí)程序委員會(huì)委員及領(lǐng)域主席。2023年晉升為美國電氣和電子工程師協(xié)會(huì)(IEEE)高級(jí)會(huì)員。提出的ViTAE Transformer可廣泛應(yīng)用于圖像分類、目標(biāo)檢測、語義分割、視頻實(shí)例分割、圖像摳圖、目標(biāo)跟蹤、文字檢測和識(shí)別、遙感圖像分析等多個(gè)領(lǐng)域,取得了非常有競爭力的結(jié)果,相關(guān)GitHub倉庫關(guān)注量超過5000。該模型在相關(guān)比賽或者公開數(shù)據(jù)集多次名列第一,受到廣泛關(guān)注。