成全免费高清完整版,国产网友自拍,欧美日韩无砖专区一中文字,日韩精品 有码 无码 国产

全部

EMO來了!一段音頻就能驅(qū)動照片唱歌

來源:閃電新聞

作者:孔冠軍

2024-04-26 22:18:04

齊魯網(wǎng)·閃電新聞4月26日訊 把一段音頻、一張照片輸入AI模型,就能讓圖中人物開口唱歌說話,讓奧黛麗赫本唱《上春山》、陶俑仕女說英文RAP、愛因斯坦說中文段子。不久前,這款名為EMO的模型因為阿里通義實(shí)驗室的一篇論文火遍海內(nèi)外,模型的產(chǎn)品化進(jìn)程也廣受關(guān)注。4月25日,EMO終于上線通義APP,開放給所有用戶免費(fèi)使用。

 打開通義APP,進(jìn)入“全民舞臺”頻道,就可來到EMO產(chǎn)品頁面“全民唱演”。在歌曲、熱梗、表情包中任選一款模板,上傳肖像照片,EMO隨即就能合成視頻。

通義APP首批上線了80多個EMO模板,包括熱門歌曲《上春山》《野狼disco》等,網(wǎng)絡(luò)熱梗“缽缽雞”“回手掏”等。目前通義APP暫不開放用戶自定義音頻,用戶只能選擇APP預(yù)置的音頻來生成視頻。

 EMO是通義實(shí)驗室研發(fā)的AI模型,其背后的肖像說話(Talking Head)技術(shù)是當(dāng)前大熱的AIGC領(lǐng)域。EMO之前的Talking Head技術(shù)都需針對人臉、人頭或者身體部分做3D建模,通義實(shí)驗室在業(yè)界率先提出了弱控制設(shè)計,無需建模就可驅(qū)動肖像開口說話,不僅降低視頻生成成本,還大幅提升了視頻生成質(zhì)量。EMO學(xué)習(xí)并編碼了人類表達(dá)情緒的能力,能將音頻內(nèi)容和人物的表情、嘴型匹配,還能把音頻的語氣特征和情緒色彩反映到人物微表情上。

2月底,通義實(shí)驗室公布相關(guān)論文,EMO隨之成為繼SORA之后最受關(guān)注的AI模型之一。現(xiàn)在,通義APP讓所有人都可免費(fèi)體驗前沿模型的創(chuàng)造力。未來,EMO技術(shù)有望應(yīng)用于數(shù)字人、數(shù)字教育、影視制作、虛擬陪伴、電商直播等場景。

 通義APP近期爆款頻出,現(xiàn)象級應(yīng)用“全民舞王”曾在社交平臺掀起“兵馬俑跳科目三”“金毛跳舞”的熱潮,全民舞王背后的模型Animate Anyone也出自通義實(shí)驗室。近期,通義APP還陸續(xù)推出了超長文檔解析、AI編碼助手、AI會議助手等免費(fèi)實(shí)用功能。通義大模型正在成為越來越多用戶的超級AI助手。

閃電新聞記者 孔冠軍  報道

[責(zé)任編輯:孔冠軍 張衍峰 李娜 郭常宏]

想爆料?請登錄《陽光連線》( https://minsheng.iqilu.com/)、撥打新聞熱線0531-66661234或96678,或登錄齊魯網(wǎng)官方微博(@齊魯網(wǎng))提供新聞線索。齊魯網(wǎng)廣告熱線0531-81695052,誠邀合作伙伴。

版權(quán)所有: 齊魯網(wǎng) All Rights Reserved
魯ICP備09062847號-1 網(wǎng)上傳播視聽節(jié)目許可證1503009 互聯(lián)網(wǎng)新聞信息服務(wù)許可證37120170002
通訊地址:山東省濟(jì)南市經(jīng)十路18567號  郵編:250062
技術(shù)支持:山東廣電信通網(wǎng)絡(luò)運(yùn)營有限公司