久草视频2-久草视-久草社区视频-久草色在线-久草色视频-久草软件

昆侖萬維正式開源Matrix

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

5月13日,昆侖萬維正式開源(17B+)Matrix-Game大模型,即Matrix-Zero世界模型中的可交互視頻生成大模型。Matrix-Game是Matrix系列在交互式世界生成方向的正式落地, 也是工業界首個開源的10B+空間智能大模型 ,它是一個面向 游戲 世界建模的交互式世界基礎模型,專為開放式環境中的高質量生成與精確控制而設計

空間智能作為AI時代的重要前沿技術,正在重塑我們與虛擬世界的交互方式。通過融合視頻生成、三維建模與交互控制等核心技術,空間智能不僅支持更加自然、直觀、沉浸的體驗,也在具身智能、影視制作、游戲開發等領域展現出巨大潛力。

昆侖萬維長期關注空間智能的新進展,經過不懈的技術研發,今天正式開源Matrix-Game,不僅刷新了交互式世界生成的技術上限,也為構建通用虛擬世界基座樹立了全新標桿。

Matrix-Game聚焦于視頻生成與用戶交互的深度融合,讓用戶可以通過簡單直觀的指令,自由探索、操控、甚至創造出細節豐富、物理規則合理的虛擬世界。

Matrix-Game由以下三大核心部分構成:

1.? Matrix-Game-MC數據集 :自主構建的大規模交互世界數據集,包含兩類數據:一是大規模無標簽的Minecraft游戲視頻,二是帶有鍵盤與鼠標控制信號的 Minecraft 與 Unreal 可控視頻數據,具備精細的動作注釋。該數據集支持對復雜環境動態與交互模式的高效建模與學習。

2.? Matrix-Game主模型 :基于先進擴散模型技術開發的圖像到世界生成框架,能夠根據用戶輸入(鍵盤指令、鼠標移動等)生成連貫、可控的互動視頻,兼顧視覺質量、時序一致性與物理合理性。

3.? GameWorld Score評測體系 :提出統一的游戲交互世界評估標準,從視頻的視覺質量、時序質量、動作可控性與物理規則理解四個維度,全面量化模型性能,填補了該領域缺乏系統性評測基準的空白。

通過兩階段訓練策略(無標簽數據預訓練 + 標注數據可控訓練),參數規模達 17B 的 Matrix-Game 世界基座模型在空間理解、用戶指令響應以及物理交互建模等方面取得了顯著提升。具備以下模型優勢:

細粒度用戶交互控制 :支持前進、跳躍、攻擊、視角移動等細節操作,根據用戶輸入響應,操作體驗準確自然。

高保真視覺與物理一致性 :生成結果在保持視覺連貫的同時,遵循自然物理規律,如重力、碰撞等,顯著提升沉浸感。

多場景泛化能力 :具備對多種 Minecraft 游戲場景的泛化能力,涵蓋不同地形、天氣和生物群系,并具備向非 Minecraft 游戲環境泛化的潛力。

系統化評估體系 :提出統一的 GameWorld Score 標準,為交互世界模型的客觀評估與持續優化提供有力支撐。

與知名 創業 公司 Decart 開源方案 Oasis 和微軟開源模型 MineWorld 對比,Matrix-Game 在 Minecraft 世界生成任務的各項指標上實現了全面超越,尤其在交互可控性和物理一致性理解方面表現尤為出色。此外,得益于 Unreal 數據的融入,Matrix-Game 在泛化到更廣泛的通用游戲場景方面展現出明顯優勢。

昆侖萬維正式開源Matrix

來源:Matrix-Game技術報告

Matrix-Game能夠在不同Minecraft場景下(如森林、沙灘、沙漠、冰川、河流、平原等)實現可控生成,包括基礎運動、復合運動、視角運動等。例如,在一個沙漠場景中,Matrix-Game 能夠根據用戶輸入的任意控制指令(如鍵盤的 W/A/S/D 方向鍵、Space 鍵用于跳躍、Attack 鍵用于攻擊,以及鼠標用于視角移動),生成對應的游戲世界視頻,支持角色的前后左右移動、跳躍、攻擊以及視角變換等動態行為。

在此基礎上,Matrix-Game 支持自回歸式的長視頻生成,不僅能實現動作與視角之間的絲滑銜接,還在時間一致性與環境適應性方面表現出色,為開發沉浸式長時體驗、創意內容生成及游戲設計等應用奠定了堅實的模型基礎。

不僅如此,在非Minecraft場景泛化上,Matrix-Game表現得也非常出色。

接下來,我們來看看Matrix-Game是如何達到這樣的效果的。

01

數據構建:大規模高質量Matrix-Game-MC數據集

為構建能夠理解物理規則并具備交互生成能力的世界基礎模型,Matrix-Game 自主構建了大規模 Matrix-Game-MC 數據集,涵蓋從無標簽預訓練數據到精細標注的可控視頻的完整流程,兼顧數據規模與質量。

無標簽預訓練數據集采用三階段過濾機制從6000小時的MineDojo數據中過濾出近千小時高質量數據: (1) 畫質與美學過濾;(2) 非游戲內容剔除;(3) 動態與視角穩定性過濾。

昆侖萬維正式開源Matrix

有標簽數據采用兩種策略混合生成數千小時的可控監督數據:

探索代理 (Exploration Agent):借助 VPT agent 在 MineRL 環境中進行自動探索,生成大規模、高質量的 Minecraft 視頻數據,數據中包含精確的鍵盤與鼠標控制信號,支持可控性學習。

程序化模擬 (Unreal Procedural Simulation):基于 Unreal Engine 手動構建結構清晰、標簽精確的模擬交互場景,提供位置信息、動作標簽(離散與連續)、以及環境反饋信號(如方塊是否成功破壞),生成高精度、無噪聲的可控標注數據,助力高保真動作-響應建模。

02

模型架構:Matrix-Game從圖像出發構建可控交互世界

Matrix-Game是以圖像為輸入的交互式世界生成基礎模型,整體架構圍繞以下幾個核心設計:

圖像到世界建模 (Image-to-World Modeling)

強調空間智能能力 :不依賴語言提示,僅基于視覺信號建模空間幾何、物體運動及其物理交互;

輸入形式 :以單張參考圖像作為生成交互式視頻的起點;

交互可控生成 :融合用戶動作輸入(如鍵盤、鼠標),通過類似 Flux 與 HunyuanVideo 的多模態擴散模型直接生成虛擬游戲世界的視頻內容。

昆侖萬維正式開源Matrix

自回歸式視頻生成 (Autoregressive?Diffusion Generation)

支持自回歸方式擴展生成長度,可持續生成高一致性長視頻內容;

每次以前一視頻片段的最后 k=5幀作為運動上下文,逐段遞進生成,確保時間上的連貫性;

為緩解時序漂移和誤差累積,訓練中以一定概率針對參考圖像與運動上下文引入隨機擾動、隨機刪除,以及Classifier-free guidance策略。

可控交互設計 (Injecting Actions for Controllability)

鍵盤動作(如上下左右、跳躍、攻擊)以離散token表達,視角移動動作(如鼠標pitch角度)則以連續token表達;

采用GameFactory的控制模塊,并融入多模態Diffusion Transformer架構;

使用 Classifier-free guidance策略提升對控制信號的魯棒響應能力。

03

評測體系與模型性能:提出統一基準 GameWorld Score,重塑交互式世界生成標桿

為了系統性評估和比較交互式世界生成模型的性能,Matrix-Game提出了一套專為 Minecraft 世界建模設計的 統一評測框架 ?——? GameWorld Score 。該評測體系彌補了現有基準在交互性、物理一致性等維度的缺失,首次實現了對 感知質量 + 控制能力 + 物理合理性 的全方位衡量。

GameWorld Score 包含四大核心評估維度:

視覺質量(Visual Quality): 評估每一幀圖像的清晰度、結構一致性與真實感。依據人類視覺系統(HVS)標準衡量每一幀圖像生成效果。

時序質量(Temporal Quality): 衡量模型生成視頻的動態連貫性,包括運動連續性、節奏平滑性與時間穩定性。

交互可控性(Action Controllability): 評估生成結果是否準確響應用戶輸入的控制信號,涵蓋離散控制(如前進、跳躍)和連續控制(如視角轉換)。

物理規則理解(Physical Rule Understanding): 測試生成視頻是否遵循物理常識與空間一致性。

在GameWorld Score評測系統中,Matrix-Game在視覺質量、時間一致性、動作可控性與物理規則理解四大維度上均取得領先成績,全面超越現有開源基線模型 Oasis 與 MineWorld。

在雙盲人評實驗中,用戶更傾向于選擇 Matrix-Game生成的視頻:

96.3% 總體偏好率 ,生成效果更真實、連貫、可信;

93.76% 動作控制偏好 ,準確響應鍵盤與鼠標指令;

98.23% 視覺質量得分 ,單幀畫面更清晰美觀;

89.56% 時間一致性得分 ,動態流暢,無閃爍跳變。

在控制性能上,Matrix-Game可實現:“運動”“攻擊”等動作高達 90%+ 準確率;細粒度視角控制下依然保持高精度響應。

在 8 大典型 Minecraft 場景中全面領先,展現出 卓越的環境適應性與泛化能力 ,可廣泛應用于復雜動態的虛擬世界交互任務。

Matrix-Game用事實證明,它不僅能“看得清”,更能“動得準、控得穩”,是當前工業界最強的交互式世界生成基座模型之一。

04

昆侖萬維引領交互式世界生成新紀元

Matrix-Game作為空間智能領域交互式世界生成的重要里程碑,將潛在為多個領域帶來革命性影響:

虛擬游戲世界快速搭建 :借助模型的可控生成能力,可低成本、高效率地創建多樣化、結構合理的游戲地圖與交互環境,顯著提升關卡設計與任務構建的自由度。

影視與元宇宙內容生產 :支持高保真、物理一致的動態場景合成,為沉浸式體驗開發與創意內容生成提供通用世界建模基礎。

具身智能體訓練與數據生成 :盡管當前模型未直接用于具身智能,Matrix-Game 具備生成大規模交互視頻的能力,具備擴展至具身智能體訓練與評估的潛力,可為智能體創建多樣復雜的虛擬環境,輔助其任務執行與推理能力的提升。

Matrix-Game讓世界不再只是被觀看,而是被探索、被操控、被創造。昆侖萬維正站在空間智能時代的新起點,邀請每一位探索者一起,用指尖繪制屬于自己的無限虛擬世界。

未來,昆侖萬維將持續投入前沿技術與基礎模型研發,并且堅定開源SOTA級別模型回歸社區。我們相信,Matrix系列世界模型將對公司AI短劇生產和編輯以及AI游戲生產等業務進一步賦能,為用戶和開發者帶來新的平臺和工具。

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 国产91第一页| 欧美vpswindowssex 欧美va在线高清 | 国产在线激情视频 | 国产免费午夜 | 久久精品视在线观看2 | 欧美老妪| 青柠影院在线观看免费完整版1 | 91茄子| 日日干夜夜拍 | 美女毛片视频 | 香蕉在线精品一区二区 | 污网站免费观看在线高清 | 亚洲日韩中文字幕一区 | 亚洲一区二区三区深夜天堂 | 天天操天天草 | 日韩一区二区三区四区不卡 | 精品国产福利在线观看一区 | 久久婷婷五月综合色丁香 | 色花堂国产精品首页第一页 | 免费看又黄又爽又猛的视频软件- | 青草视频免费 | avidolz中文版| 国产亚洲综合久久 | 欧美free激情野战hd | 精品国产综合 | 欧美一区二区三区免费看 | 日本一道本中文字幕 | 日本-区二区三区免费精品 日本破处 | 小仙夜晚慰自催眠mp3护士篇 | 九九久久国产 | 精品一区二区三区五区六区七区 | 久青草国产在线观看视频 | 高跟丝袜麻麻求我调教 | 国产精品久久久久久久免费大片 | 午夜十八岁禁 | 深夜影院深a久久 | 1717she精品视频在线观看 | 国产在线影院 | 国产精品毛片无码 | 无码AV免费精品一区二区三区 | 91女神在线观看 |