第113頁
書迷正在閱讀:嫡枝為上、浪漫愛情、穿書后我成了錦鯉影帝、宮廷生存紀(jì)事、[HP]藍(lán)魂、何以聲聲慢、小桃的春天、豪門嬌妻、愛與死(西幻)、毀了他
付費(fèi)音頻是新熱點(diǎn),行業(yè)拓荒者數(shù)不勝數(shù),且已經(jīng)有了珠穆朗瑪那種成功的企業(yè),沒錢就沒法高速鋪開業(yè)務(wù),就搶不過別人,就注定失敗。 完了,一切都完了。 窗外華燈初上,邵逸明的臉反射在玻璃上,長達(dá)一個(gè)小時(shí)的時(shí)間,他腦中一片混亂。 一個(gè)小時(shí)后,他突然想:為什么? 為什么會被那么多家風(fēng)投連續(xù)放鴿子?難道是背后有人在搞他? 還未來得及仔細(xì)思考,員工電話打進(jìn)來,大呼小叫地跟他說:“邵哥!你看到了嗎!變天了!怎么辦!我們怎么辦??!” “怎么回事?”邵逸明這會兒異常冷靜,嘴里回答著電話,腦海里還在想,誰會費(fèi)這么大力氣給他使絆子。 “快去看看新聞啊邵哥?。?!都一下午了難道你還不知道嗎?。?!” 邵逸明飛快掛掉電話打開新聞網(wǎng)站,一個(gè)不容忽視的大頭條掛在那里。 “回聲科技今日震撼發(fā)布,劃時(shí)代語音合成技術(shù),我國人工智能已領(lǐng)先世界!” 他呆了一瞬,才打開新聞,拉下去細(xì)看。 整篇新聞的口吻帶有一種明明很激動(dòng)卻強(qiáng)自抑制的感覺,這小編也真是厲害,用特別理性客觀的文字把回聲從上到下夸了一個(gè)遍,還不著痕跡地介紹了新軟件的各種功能。 軟件的名字很普通,就叫回聲配音,和之前一模一樣。 只不過之前的回聲配音是個(gè)網(wǎng)頁程序,這回有了客戶端。 “基于這種劃時(shí)代語音合成技術(shù),回聲科技目前僅發(fā)布‘回聲配音’一項(xiàng)產(chǎn)品,僅僅是這一款軟件,已經(jīng)展現(xiàn)出令人震驚的功能效果。這一技術(shù)的后續(xù)開發(fā)非常值得期待?!?/br> 邵逸明看完軟件,強(qiáng)壓著內(nèi)心的驚疑不定,去應(yīng)用商店下載了手機(jī)app。 移動(dòng)端的app設(shè)計(jì)非常簡單,就是輸入一段文字轉(zhuǎn)換成語音,帶有簡單的參數(shù)調(diào)試功能。 AI配音對硬件的要求相當(dāng)高,手機(jī)端不能一次轉(zhuǎn)換太多內(nèi)容,一次輸入僅限五十字。 邵逸明第一時(shí)間想到那個(gè)剛剛通過海選的動(dòng)畫劇本,隨意從劇本中拉出一句詞輸入進(jìn)去。 文字輸入完畢,蹦出挑選音色的選項(xiàng),預(yù)置音色有最基本的童音、少年、青年、中年、老年,每一樣都分男女。 點(diǎn)擊某個(gè)音色,就直接輸出聲音。 僅僅是一句簡短的對話,邵逸明點(diǎn)開每一個(gè)音色來回聽了三遍,越聽越覺得難以置信。 是語音合成,真正的語音合成。 和軟件唱歌不一樣,語音合成不是簡單的聲音排列組合,還需要自然語言處理,識別文字語義等等?,F(xiàn)在,程序識別出了某句話的語義,根據(jù)語義配置了合理的起伏、韻律和聲調(diào),然后播放出來。 逼真程度之高,就像是有一個(gè)真人在手機(jī)里說話一樣! 程序的表達(dá)不一定最動(dòng)聽,但絕對是符合語境的,讓人找不出違和感。 換句話說,軟件不具有頂尖配音演員的實(shí)力,但是卻具有普通配音演員的能力。 邵逸明強(qiáng)自鎮(zhèn)定,安慰自己說:平平無奇,沒有靈魂。別怕別怕。 機(jī)器終歸是機(jī)器,就算能配音,也只是套路化模仿人的語氣,配不出有力量的情感表達(dá)。就像是演技拙劣的演員非要去演戲 他隨便選了一個(gè)音色,點(diǎn)擊確認(rèn),來到了下一個(gè)頁面——情感選擇。 下面有四個(gè)滑條,分別是喜悅、激動(dòng)、憤怒、恐懼。 邵逸明滑動(dòng)這四個(gè)滑條的時(shí)候,感覺異常不真實(shí),就好像在滑動(dòng)圖片的RBG滑條一樣。 滑動(dòng)之后,實(shí)時(shí)生成的語音果然出現(xiàn)了微妙的語氣變化。 這一頁下面還有一樣小字:“登陸電腦客戶端,調(diào)節(jié)更多情感維度,還可以自行設(shè)計(jì)維度模型,保存參數(shù)建立情感濾鏡?!?/br> 邵逸明猶豫了一下,沒有理會,點(diǎn)擊確定來到下一個(gè)頁面。 這一步的名字叫“音頻液化”,選擇一個(gè)參數(shù),在屏幕上生成一條曲線,手指涂抹就可以改變曲線的形狀,縱軸是該項(xiàng)參數(shù),橫軸是時(shí)間。 音量是一條直線,用手指向上抹出一個(gè)小山包,山包對應(yīng)的時(shí)間段的音量就會發(fā)生變化。 語調(diào)是曲線,可以用手指涂抹直接改變聲調(diào)的上揚(yáng)或下抑。 語氣輕重是折線,可以制造強(qiáng)調(diào)聲或輕聲。 發(fā)聲位置,可以調(diào)出氣音、鼻音、胸腔共鳴、丹田發(fā)聲不同的效果。 還有音高、語速等等各種各樣的參數(shù)。原本“平平無奇沒有靈魂”的普通對話,可以在這個(gè)界面往千奇百怪的方向去調(diào)整,輸出令人嘆為觀止的多樣性成果。 第四步就是最后一步,完成這一步之后,系統(tǒng)就生成了mp3文件。 邵逸明聽了一遍又一遍,最后靠在椅子上,用手蓋住臉,長嘆一口氣。 除了音色有些出入,這整句話和他所設(shè)想的一模一樣。 過了半天,他終于找到理由安慰自己:“……第四步也太復(fù)雜了,選擇困難癥怕不是能玩一年。要是都這么一句話一句話地調(diào),猴年馬月才能完成一段配音?” 厲害歸厲害,效率反而降低了。 這個(gè)想法剛一冒出來,app頁面彈出提示:“是否感覺參數(shù)太細(xì)致,建立音頻太麻煩,耗時(shí)過長?下載pc客戶端,體驗(yàn)高效率AI配音?!?/br> 邵逸明立刻捕捉到關(guān)鍵點(diǎn):pc端的功能更加強(qiáng)大?