123,123,123

基于多模態(tài)大模型的智能理解與內(nèi)容生成

來源：發(fā)布時間：2022.12.23

【講座題目】基于多模態(tài)大模型的智能理解與內(nèi)容生成

【時間】2022年12月24日上午：9:10-10:00

【地點】保定校區(qū) 計算機系自動化系騰訊會議：841-767-337

【主講人】王金橋，研究員/博士生導(dǎo)師，中科院自動化所

【主講人簡介】

王金橋，中國科學(xué)院自動化研究所紫東太初多模態(tài)中心常務(wù)副主任，研究員，博導(dǎo)，武漢人工智能研究院院長，中國科學(xué)院大學(xué)人工智能學(xué)院崗位教授，多模態(tài)人工智能產(chǎn)業(yè)聯(lián)盟秘書長，主要從事多模態(tài)大模型、視頻分析與檢索、大規(guī)模目標(biāo)識別等方面的研究。共發(fā)表包括IEEE國際權(quán)威期刊和頂級會議論文300余篇，國際期刊50余篇，國際會議220余篇。完成國家標(biāo)準(zhǔn)提案3項，發(fā)明專利36項，10項國際視覺算法競賽冠軍，北京市科技進步一等獎，吳文俊人工智能科技進步二等獎，中國發(fā)明創(chuàng)新銀獎。

【報告內(nèi)容簡介】

自從GPT/Bert模型提出以來，基于自監(jiān)督學(xué)習(xí)的預(yù)訓(xùn)練模型迎來了爆發(fā)式發(fā)展。當(dāng)前包含文本、語音、圖像、視頻等多種模態(tài)數(shù)據(jù)的信息在不斷融合，預(yù)訓(xùn)練模型正由單模態(tài)邁向多模態(tài)自監(jiān)督學(xué)習(xí)，我們通過跨模態(tài)多任務(wù)自監(jiān)督學(xué)習(xí)融合文本、語音、圖像、視頻海量弱相關(guān)的多模態(tài)數(shù)據(jù)，開拓性地實現(xiàn)了圖像、文字、語音和視頻等不同模態(tài)數(shù)據(jù)之間的統(tǒng)一表示和互相生成，基于國產(chǎn)化基礎(chǔ)軟硬件平臺打造了紫東太初大模型開放服務(wù)平臺，既可以實現(xiàn)一站式低代碼的模型微調(diào)和模型部署，支持跨模態(tài)理解和跨模態(tài)生成，在智慧文旅、智慧城市、智能制造和智慧醫(yī)療等多個領(lǐng)域?qū)崿F(xiàn)了落地應(yīng)用。

基于多模態(tài)大模型的智能理解與內(nèi)容生成

最新動態(tài)