上周我不是寫了一篇海螺新上線的AI聲音克隆嗎,那篇文章數(shù)據(jù)蠻不錯,有很多人轉(zhuǎn)發(fā)和評論。但是吧,我沒想到的一點是,居然有N多人問我的一個問題是:
因為那篇文章中,我為了讓大家有一個更直觀的視覺化的感受,所以把所有的生成的語音,都變成了一段AI視頻,這樣大家的觀感可能會更好。
讓我沒想到的是,不僅語音大家很關(guān)心,這個對口型的視覺化的過程,大家也關(guān)心。。。所以,今天,我也就寫一篇文章,正好跟大家說一下口型驅(qū)動的做法,統(tǒng)一解決一下困惑,讓人人,都能做出一些有趣的創(chuàng)作。網(wǎng)址在此:https://jimeng.jianying.com/ai-tool/home即夢我已經(jīng)安利過N次了,國慶期間寫過他們的智能畫布,上上周寫過他們的v2.1新模型一鍵生成海報,這次又是它。而我們要做的,就是準備一張照片和一段語音,就能用這段語音,驅(qū)動這張照片,開口說話。
比如,現(xiàn)在我想做一個帥哥用坤哥聲音模仿《大話西游》里面那個經(jīng)典的片段。然后,跟上周的教程一樣,我們用海螺Audio跑一段坤哥的聲音克隆,然后,讓他來念出那一段經(jīng)典臺詞:“曾經(jīng)有一份真摯的感情擺在我的面前,我沒有珍惜,等我失去的時候才追悔莫及。如果上天能給我再來一次的機會,我會對那個女孩說三個字:我愛你!如果非要在這份愛上加一個期限,我希望!是一萬年!”曾經(jīng)...,數(shù)字生命卡茲克,19秒
再把我們的帥哥的圖片,上傳到角色那,音頻上傳到語音那。當然如果你不想用克隆的聲音,當然也可以用即夢自己的文本朗讀,它里面默認給你塞了N多音色,你可以選用,可惜就是沒有AI聲音克隆,所以如果對創(chuàng)作有需求的話,我覺得還是可以用海螺跑完,再扔到即夢里。最重要的一點是,在最后的生成效果上,一定要選生動。標準是只動嘴不動頭,看起來就非常不自然,而生動模式是真的嘴、眼睛、頭都在自然的運動,真實也自然很多。
唯一目前最大的缺陷就是,你不管上傳什么比例的角色,都會給你自動裁成1:1的,無法調(diào)整,在一個群里看到他們說這塊在改了,12月可能會上,我也還在等。一切就緒之后,直接點擊生成視頻,開跑,積分消耗的不多,基本就是1s1積分。每天登錄幾乎都會送60~100的積分。而這整套,真的也就幾分鐘,就完事了。也真的,有手就行。
而且其實不止是真人,一些2D、3D的動漫人物,也可以用語音驅(qū)動讓照片說話。
比如我自己,錄一首奇奇怪怪的《兩只老虎》,讓馬斯克唱出來。你看,我把照片喂進去,配音扔進去,輕輕一點生成,幾分鐘搞定,甚至簡單到無聊。我還記得第一次看到照片說話的作品的時候,是2023年初,汗青的AI.Talk,年輕的喬布斯和已在太空漫游的年老的馬斯克的對話。坦率的講,這個作品,給我的震撼是相當大的,這是可能只有在AI時代,才會出現(xiàn)的一種作品形式。讓不可能再出現(xiàn)的人,讓不可能的時空,交織在一起。
后面,我自己也會去模仿汗青,做類似形式的作品。不過不像汗青那種非常深度、有哲理性的表達,而是更偏整活為主。
比如今年蘋果發(fā)布會和華為發(fā)布會在同一天召開硬碰硬,蘋果又非常拉胯,我就做了一個相同的形式,來去吐槽蘋果。當時我只有一個想法,如果喬布斯還在,當他看到如今的蘋果,他會說些什么?得益于AI,我們可以只花幾個小時的時間,一切都能,躍然紙上。
你甚至不用想太多,只需要動動手,分分鐘,就造一個世界。就像小時候,我們經(jīng)常在老家的樹林里,偷偷摸摸撿起一根枯樹枝,用它來在地上畫畫,用它來一場小孩子之間的決斗游戲,用它,來肆意的發(fā)揮我們的想象力。而現(xiàn)在,你手上的AI,就是新的枯樹枝。當你也想去試試,AI Talk的形式,來做一點自己的小作品的時候。
閱讀原文:原文鏈接
該文章在 2025/1/2 12:16:41 編輯過