首頁
黨政
- 黨網 · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
- 經濟 · 科技
- 社會 · 法治
- 文旅 · 體育
- 健康 · 生活
- 國際
- 軍事
- 港澳
- 台灣
- 教育
- 科普
觀點
互動
可視化
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陝
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
民文
English
合作網站
人工智能
人民網客戶端
網站無障礙
舉報
登錄

退出

人民網>>教育

北京智源研究院發布原生多模態世界模型Emu3

2024年10月24日08:35 | 來源：人民網－人民日報海外版

小字號

　　本報電（記者劉峣）近日，北京智源人工智能研究院正式發布原生多模態世界模型Emu3。該模型實現了視頻、圖像、文本三種模態的統一理解與生成，成功驗証了基於下一個token（詞元）預測的多模態技術范式，釋放其在大規模訓練和推理上的潛力。

　　據了解Emu3隻基於下一個token預測，無需擴散模型或組合式方法，把圖像、文本和視頻編碼為一個離散空間，在多模態混合序列上從頭開始聯合訓練一個Transformer。

　　智源研究院院長王仲遠表示，Emu3為構建多模態通用人工智能提供了廣闊的技術前景，有機會將基礎設施建設收斂到一條技術路線上，為大規模多模態訓練和推理提供基礎。未來，多模態世界模型將促進機器人大腦、自動駕駛、多模態對話和推理等場景應用。

(責編：李昉、郝孟佳)

分享讓更多人看到

客戶端下載

熱門排行

人民日報社概況| 關於人民網| 報社招聘| 招聘英才| 廣告服務| 合作加盟| 供稿服務| 數據服務| 網站聲明| 網站律師| 信息保護| 聯系我們

人民日報違法和不良信息舉報電話：010-65363263 舉報郵箱：jubao@people.cn

人民網服務郵箱：kf@people.cn 違法和不良信息舉報電話：010-65363636 舉報郵箱：rmwjubao@people.cn

互聯網新聞信息服務許可証10120170001 | 增值電信業務經營許可証B1-20060139 | 廣播電視節目制作經營許可証（廣媒）字第172號 | 京ICP備12004265號-13

信息網絡傳播視聽節目許可証0104065 | 網絡文化經營許可証京網文[2023]4961-141號 | 網絡出版服務許可証（京）字121號 | 京ICP証000006號 | 京公網安備11000002000008號

人民網股份有限公司版權所有，未經書面授權禁止使用
Copyright © 1997-2024 by www.people.com.cn. all rights reserved

評論
分享
關注
微信微博快手
第一時間為您推送權威資訊

報道全球傳播中國

關注人民網，傳播正能量

返回頂部