DoNews10月13日消息,據IT之家援引倫敦《金融時報》報道,埃隆?馬斯克旗下 xAI 公司正加緊構建其“世界模型”,與 Meta 和谷歌等對手一同角逐下一代 AI 系統。這些系統能夠實現對物理環境的自主導航與設計。
世界模型是一種生成式 AI 模型,能夠理解現實世界的動態特征,包括物理屬性和空間特性。這類模型利用文字、圖像、視頻以及動作在內的輸入數據來生成影片。
據稱,xAI 已經從英偉達挖來了專家,研發這類新一代 AI 模型。這些模型通過學習視頻以及來自機器人的數據,理解現實世界。世界模型有望將 AI 的能力提升到超越大語言模型的水平。目前,大模型主要接受文本訓練,是 ChatGPT 以及 xAI 自家 Grok 等熱門 AI 工具的技術基礎。
兩位知情人士稱,該公司正在研發世界模型,計劃將其應用于游戲領域,用于生成可交互的 3D 環境。其中一位知情人士補充說,這類模型未來也可能應用于機器人 AI 系統。
xAI 已從英偉達聘請了兩位具備世界模型研發經驗的 AI 研究員:澤尚?帕特爾 (Zeeshan Patel) 與何宜暉。憑借能夠創建并運行模擬環境的 Omniverse 平臺,英偉達始終在該技術領域保持領先地位。
一些科技公司對世界模型寄予厚望,認為它或許能將 AI 應用從軟件和計算機拓展到實體產品,例如人形機器人。上個月,英偉達對《金融時報》表示,世界模型的潛在市場規模可能接近當前全球經濟總量。
馬斯克在 X 上發帖稱,xAI 計劃在明年年底前推出“一款由 AI 生成的優秀游戲”,重申了他在去年設定的目標。
周二,xAI 推出了最新的圖像和視頻生成模型,并表示該模型進行了“重大升級”,并且免費向用戶開放使用。
當前,OpenAI 旗下 Sora 等視頻生成模型,主要通過從訓練數據中學習到的模式進行預測,從而逐幀生成視頻圖像。但是世界模型則會向前邁進一大步,因為它能實時理解物理世界的因果關系,掌握物體在不同環境中的實時互動機制。
然而,世界模型仍面臨巨大的技術挑戰。要找到足夠的數據來模擬現實世界并訓練這些模型,已被證明既困難又成本昂貴。
《博德之門 3》開發商拉瑞安工作室的發行主管邁克爾?道斯 (Michael Douse) 本周在 X 上直言,AI 無法解決游戲行業面臨的“重大問題”,即“領導力與遠見的缺失”。
他補充說,游戲行業并不需要“更多由算法生成、經心理學訓練的玩法循環,而是需要更多能夠讓玩家投入或愿意投入其中的世界呈現方式”。
截至發稿,xAI 及帕特爾、何宜暉尚未就此置評。