新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業(yè)內首次實現多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業(yè)用戶可在千帆平臺享受高性能視頻生成服務。
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創(chuàng)多模態(tài)潛在空間規(guī)劃技術xoso6644(Latent Multi-ModalPlanner), 能夠自主協(xié)調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節(jié)與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環(huán)境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業(yè)70%。
xoso6644業(yè)內人士認為,除了質量提升,百度蒸汽機2.0也帶來了創(chuàng)作成本大幅下降。知名視效指導姚騏在此次發(fā)布會現場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 773踩: 97931
xoso6644
人參與 | 時間:2025-09-17 09:51:55
評論專區(qū)
相關文章
- 獨家上線陳奕迅巡演紀錄片 B站音樂視頻播放量突破608億
- iPhone 17新品將在美團閃購同步首發(fā)開售
- 華為新款三折疊Mate XTs將首次通過美團閃購同步開售
- 嘉楠科技公布8月運營數據:月度比特幣產量環(huán)比增長10%,比特幣儲備達1547枚
- 油畫風卡通卡包女小巧多卡位大容量防消磁防盜刷駕駛證一體零錢包
- 3年投入200億,華為北汽達成享界品牌深化合作,余承東:明天享界S9T發(fā)布,一定不負期待
- 嵐圖汽車CEO盧放談IPO:體現出東風的支持和市場的信心,但不能沾沾自喜繼續(xù)穩(wěn)扎穩(wěn)打
- 全新嵐圖知音上市:全系標配華為乾崑智駕ADS 4與鴻蒙座艙5,售價20.29萬元起
- 西貝致歉:將盡可能把中央廚房前置加工工藝調整到門店現場加工
- 瑞銀:英偉達季報發(fā)布后 大型科技股仍具吸引力