來源:科技日報
2025-06-18 19:19:06
科技日報記者 都芃
6月17日,在百度AI Day開放日上,百度官宣發(fā)布業(yè)界首個超級頭部主播羅永浩數(shù)字人,并發(fā)布了高說服力數(shù)字人在體驗、內(nèi)容、視覺、效果的四大突破。
百度副總裁、電商總經(jīng)理平曉黎表示,今年4月百度發(fā)布的高說服力數(shù)字人讓數(shù)字人進入3.0時代。新一代高說服力數(shù)字人已成為像真人一樣,形神音容高度協(xié)調(diào)、會思考決策、能協(xié)作完成特定任務(wù)的超級智能體。百度此次發(fā)布的羅永浩數(shù)字人已達(dá)到媲美超級頭部主播的體感效果。此前,羅永浩數(shù)字人直播首秀創(chuàng)下超1300萬人次觀看、GMV(商品交易總額)突破5500萬元的行業(yè)新紀(jì)錄,部分核心品類帶貨量反超真人直播。
百度集團副總裁吳甜系統(tǒng)性地介紹了多模協(xié)同數(shù)字人技術(shù)。該技術(shù)基于文心大模型4.5 Turbo實現(xiàn)了融合多模規(guī)劃與深度思考的劇本生成,由劇本驅(qū)動數(shù)字人多模協(xié)同,實現(xiàn)動態(tài)決策的實時交互,使數(shù)字人的“神、形、音、容、話”達(dá)到高度統(tǒng)一。最終呈現(xiàn)出一個具備高表現(xiàn)力、內(nèi)容吸引人、人-物-場可自由交互的超擬真數(shù)字人。
劇本生成技術(shù)包含臺詞生成、多模驅(qū)動和動態(tài)交互三部分。以羅永浩數(shù)字人劇本為例,基于文心大模型4.5 Turbo生成的劇本,充分展現(xiàn)了主播的個人特色,具備典型的“羅氏幽默”風(fēng)格,并能夠?qū)崿F(xiàn)雙人主播的內(nèi)容協(xié)同,實現(xiàn)豐富的動態(tài)實時互動。通過文本自控的語音合成大模型,數(shù)字人可以實現(xiàn)高復(fù)原的語音合成能力,再結(jié)合直播臺詞及發(fā)音特征,合成風(fēng)格恰當(dāng)、自然流暢的聲音。
為解決羅永浩數(shù)字人直播雙人聲音配合難點,百度采用對話上下文編碼器,將對話歷史和當(dāng)前對話進行語音合成的統(tǒng)一推理計算,最終實現(xiàn)流暢自然的雙人對話效果。在數(shù)字人形象生成以及驅(qū)動方面,通過結(jié)合多模態(tài)視頻理解、跨模態(tài)信號生成、視頻生成等技術(shù),數(shù)字人克服了高可控交互,高精度、長時間一致性保持等難點,實現(xiàn)了高一致性超擬真長視頻生成。
吳甜表示,百度在今年4月發(fā)布了最新的大模型文心4.5 Turbo和文心X1 Turbo,羅永浩數(shù)字人是基于文心大模型的最佳實踐。百度在大模型技術(shù)的持續(xù)探索和創(chuàng)新,將為用戶帶來更優(yōu)質(zhì)的體驗、為行業(yè)帶來更具創(chuàng)新力的業(yè)務(wù)模式。
此外,百度電商還推出兩大計劃。夢蝶計劃將通過流量扶持,超頭主播數(shù)字人打造、預(yù)算扶持,實現(xiàn)百度優(yōu)選超頭主播的數(shù)量倍增;繁星計劃則將再次追加10萬個慧播星數(shù)字人,投入1億元數(shù)字人消費補貼、千萬級別的運營扶持,幫助更多的普通人、中小企業(yè)開啟數(shù)字人直播。
(百度供圖)
想爆料?請登錄《陽光連線》( https://minsheng.iqilu.com/)、撥打新聞熱線0531-66661234或96678,或登錄齊魯網(wǎng)官方微博(@齊魯網(wǎng))提供新聞線索。齊魯網(wǎng)廣告熱線0531-81695052,誠邀合作伙伴。