新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業(yè)內首次實現多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業(yè)用戶可在千帆平臺享受高性能視頻生成服務。
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創(chuàng)多模態(tài)潛在空間規(guī)劃技術bd tile(Latent Multi-ModalPlanner), 能夠自主協(xié)調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節(jié)與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環(huán)境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業(yè)70%。
業(yè)內人士認為,bd tile除了質量提升,百度蒸汽機2.0也帶來了創(chuàng)作成本大幅下降。知名視效指導姚騏在此次發(fā)布會現場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 21踩: 91292
bd tile
人參與 | 時間:2025-09-24 01:50:56
評論專區(qū)
相關文章
- 半坡手工編織包女新款真皮專柜同款單肩包小眾質感百搭斜挎豆腐包
- 星紀魅族萬志強:放棄不是體面,戰(zhàn)斗到底才是魅族,將回歸魅族、聚焦產品
- CHARLES&KEITH小CK2
- 東風猛士M817正式開售:華為乾崑技術全棧加持,售價31.99萬
- 小米發(fā)布澎湃OS 3 Beta推送計劃
- 夸克宣布覆蓋超七成大學生,AI滲透率超80%
- 李彥宏談AI大模型發(fā)展:已接近應用爆發(fā)臨界點
- 小鵬與大眾汽車集團簽訂電子電氣架構技術擴大合作協(xié)議,純電車型之外還將部署到燃油和插混車型
- 小米第二季度營收1160億元 經調整凈利潤108億元
- 阿里發(fā)布Agentic Coding平臺Qoder,可實現AI自主研發(fā)