新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業(yè)內(nèi)首次實現(xiàn)多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業(yè)用戶可在千帆平臺享受高性能視頻生成服務。
據(jù)介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創(chuàng)多模態(tài)潛在空間規(guī)劃技術keobongdanet(Latent Multi-ModalPlanner), 能夠自主協(xié)調(diào)多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現(xiàn)中文語音細節(jié)與情感表達。在效果上能夠實現(xiàn)電影級高清視頻畫面、逼真環(huán)境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經(jīng)在百度搜索、營銷等多個場景落地應用,且定價低至行業(yè)70%。
keobongdanet業(yè)內(nèi)人士認為,除了質(zhì)量提升,百度蒸汽機2.0也帶來了創(chuàng)作成本大幅下降。知名視效指導姚騏在此次發(fā)布會現(xiàn)場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經(jīng)APP
責任編輯:何俊熹
頂: 4踩: 59
keobongdanet
人參與 | 時間:2025-09-25 13:21:58
評論專區(qū)
相關文章
- 航旅縱橫推出精準延誤險被吐槽像賭博,公司尚無回應
- 小鵬匯天飛行汽車啟動招商
- 3年投入200億,華為北汽達成享界品牌深化合作,余承東:明天享界S9T發(fā)布,一定不負期待
- Pandamomo 大熊貓?zhí)岽瓌?chuàng)卡通可愛環(huán)保帆布單肩包休閑包奇果五歲
- 星紀魅族萬志強:22是魅族史上打磨時間最久的一臺手機,數(shù)字系列不再區(qū)分Pro版與標準版
- 小米發(fā)布澎湃OS 3 Beta推送計劃
- 泡泡瑪特迷你版Labubu開售秒光,二手交易平臺價格已翻倍
- 大容量汽車鑰匙包男士腰掛真牛皮女卡包拉鏈多功能收納零錢鎖匙扣
- 掃描全能王“翻頁自動拍”功能上線,拍攝準確率達97%
- 愛詩科技宣布獲6000萬美元B輪融資,阿里巴巴領投