新聞中心
目前主流的音頻采集主要包括近場(chǎng)拾音和遠(yuǎn)場(chǎng)拾音兩種場(chǎng)景。讓 下面我們以降噪為例來(lái)談?wù)務(wù)Z音分離。這是語(yǔ)音的元音部分。左上圖為純語(yǔ)音對(duì)應(yīng)的幅度譜,右上圖為含噪語(yǔ)音對(duì)應(yīng)的幅度譜??雌饋?lái)有點(diǎn)亂,語(yǔ)音成分也壞了。右圖對(duì)應(yīng)于將IBM(左圖)覆蓋到噪聲語(yǔ)音頻譜(右圖)以形成去噪語(yǔ)音頻譜。公式中的IBM其實(shí)就是深度學(xué)習(xí)最終預(yù)測(cè)的目標(biāo)。這些目標(biāo)實(shí)際上類似于IBM,但是做了一些修改。例如,IRM的值不僅是0和1。支持人聲背景音分離,適合需要分離人聲或人聲伴奏的朋友。
本文由創(chuàng)新互聯(lián)(www.cdcxhl.cn)小編為大家整理,本文主要介紹了如何利用深度學(xué)習(xí)實(shí)現(xiàn)單通道語(yǔ)音分離的相關(guān)知識(shí),希望對(duì)你有一定的參考價(jià)值和幫助,記得關(guān)注和收藏網(wǎng)址哦!

創(chuàng)新互聯(lián)建站專業(yè)為企業(yè)提供安寧網(wǎng)站建設(shè)、安寧做網(wǎng)站、安寧網(wǎng)站設(shè)計(jì)、安寧網(wǎng)站制作等企業(yè)網(wǎng)站建設(shè)、網(wǎng)頁(yè)設(shè)計(jì)與制作、安寧企業(yè)網(wǎng)站模板建站服務(wù),十余年安寧做網(wǎng)站經(jīng)驗(yàn),不只是建網(wǎng)站,更提供有價(jià)值的思路和整體網(wǎng)絡(luò)服務(wù)。
如何利用深度學(xué)習(xí)實(shí)現(xiàn)單通道語(yǔ)音分離?
目前主流的音頻采集主要包括近場(chǎng)拾音和遠(yuǎn)場(chǎng)拾音兩種場(chǎng)景。那么什么是語(yǔ)音分離呢?其實(shí)我們常說(shuō)的降噪、去混響、多聲分離等等過程,都屬于語(yǔ)音分離的過程。讓 下面我們以降噪為例來(lái)談?wù)務(wù)Z音分離。
圖計(jì)算聽覺場(chǎng)景的公式,讓 讓我們把公式放在一邊,看看下面四個(gè)音標(biāo)。
如圖所示,可以看出,與圖像信號(hào)不同,語(yǔ)音信號(hào)是一維信號(hào),而圖像信號(hào)是二維信號(hào)。利用一維信息直接處理語(yǔ)音信號(hào)是非常困難的,所以我們將通過時(shí)頻變換,如短時(shí)傅立葉變換(STFT),得到左上圖中——原始信號(hào)的幅度譜。光譜顏色越深,能量越大。左上圖紅色部分是演講的部分。它看起來(lái)像一個(gè)梳狀條紋,這是講話的諧波結(jié)構(gòu)。這是語(yǔ)音的元音部分。左上圖為純語(yǔ)音對(duì)應(yīng)的幅度譜,右上圖為含噪語(yǔ)音對(duì)應(yīng)的幅度譜??雌饋?lái)有點(diǎn)亂,語(yǔ)音成分也壞了。右圖就是我剛才提到的IBM。IBM的意思是理想二進(jìn)制掩碼。右圖對(duì)應(yīng)于將IBM(左圖)覆蓋到噪聲語(yǔ)音頻譜(右圖)以形成去噪語(yǔ)音頻譜。從圖中可以看出,去噪后的語(yǔ)音頻譜(右下)比有噪語(yǔ)音頻譜(右上)干凈很多,但與純語(yǔ)音頻譜相比,存在局部過壓現(xiàn)象。聽起來(lái)實(shí)際效果是噪音基本消除,但會(huì)有一些失真。
接下來(lái),讓我們 讓我們看看IBM的計(jì)算公式。公式中的IBM其實(shí)就是深度學(xué)習(xí)最終預(yù)測(cè)的目標(biāo)。IBM計(jì)算的值是0和1,也就是說(shuō)最終結(jié)果可以歸入0和1。那么如何定義0和1呢?定義條件如下:如果語(yǔ)音的能量S減去噪聲的能量N大于一個(gè)θ值,θ一般取值為0。此時(shí),IBM s值為1,即我們認(rèn)為語(yǔ)音比噪音大的地方,IBM為1;同樣,在我們認(rèn)為聲音比噪音小的地方,IBM為0,說(shuō)明是噪音。這解釋了為什么在前一個(gè)圖形中從左到右第二個(gè)圖形上第二層從左到右覆蓋第一個(gè)圖形所獲得的信號(hào)與純語(yǔ)音之間存在間隙。這樣做的好處是可以成功地把一個(gè)回歸問題變成一個(gè)分類問題,只需要預(yù)測(cè)它是0還是1,這樣學(xué)習(xí)的難度就小了,也更容易預(yù)測(cè)。但不好的是聽起來(lái)有點(diǎn)失真。但是在2013年,這種方法的效果已經(jīng)很好了。在此之后,其他人提出了一些其他的計(jì)算目標(biāo),如TBM,IRM等。這些目標(biāo)實(shí)際上類似于IBM,但是做了一些修改。例如,IRM的值不僅是0和1。當(dāng)我們認(rèn)為其中一半是語(yǔ)音時(shí),那么我們的目標(biāo)值就是是0.5。目前,我們的大多數(shù)計(jì)算目標(biāo)都在IRM。
希望能幫到你!
把視頻中的人聲去掉?
實(shí)際上,需要使用聲音分離技術(shù),用軟件模糊視頻中的聲音,然后提取背景音樂。讓 s看看所有的聲音分離方法,第二種是語(yǔ)音識(shí)別,聲音提取后的聲音效果更好。1.au
相信很多做視頻的朋友應(yīng)該聽說(shuō)過這個(gè)軟件。它的功能很多,適用于需要編輯視頻和給視頻添加特效的場(chǎng)景。它還可以將聲音靜音,將視頻導(dǎo)入其中,然后它會(huì)自動(dòng)檢測(cè)并形成兩個(gè)音軌,然后刪除視頻的聲音,或者將聲音調(diào)整為0。最后導(dǎo)出的視頻只有背景音樂!
2. "聲音分離 "小應(yīng)用程序
這是一個(gè)專業(yè)的音頻處理軟件,具有很高的語(yǔ)音識(shí)別準(zhǔn)確率。支持人聲背景音分離,適合需要分離人聲或人聲伴奏的朋友。方便需要制作混剪視頻或者進(jìn)行二次創(chuàng)作的創(chuàng)作者!
支持多種音視頻格式,如WAV、MP3、MP4等。最后,提取的音頻可以導(dǎo)出使用!
3.網(wǎng)上找人幫忙分離視頻聲音。
許多不喜歡的朋友。;不會(huì)做視頻總想第一時(shí)間求助。相對(duì)來(lái)說(shuō)比較方便,但是性價(jià)比不高,需要大量的時(shí)間溝通和修改。
怎么在TT語(yǔ)音里變聲?
,我和。;我很高興再次見到你。如果該軟件不 沒有自己的變聲器,它 是時(shí)候從網(wǎng)上下載一個(gè)變聲器了。那么讓我們 讓我們來(lái)看看作者的教程,如何打開變聲器。第一步:安裝鼠標(biāo)變聲器,如圖。第二步:打開鼠標(biāo)變聲器,選擇麥克風(fēng),如圖。
第三步:選擇語(yǔ)音,如圖。
第四步:點(diǎn)擊語(yǔ)音庫(kù),可以選擇各種聲音,如圖。
你干過最瘋狂刺激的事情是什么?
在,當(dāng)著全班同學(xué)的面,我打開了36V電壓的開關(guān),發(fā)出了 "biu "砰的一聲,把鐵絲塞進(jìn)我嘴里品嘗 "電力與能源。突然,我全身都在抖,整個(gè)人都在翻白眼。這真的很像吃 "炫 "我不能。;不要停!這是第三天。作為一個(gè)數(shù)學(xué)和物理的愛好者,我無(wú)數(shù)次幻想自己成為化學(xué)家拉瓦錫或者物理學(xué)家安培和牛頓。作為一名 "多動(dòng)癥和學(xué)生,我不止一次讓老師頭疼。
首先,小物理屁喜歡玩 "電力與能源。小時(shí)候欠的。比如90年代,有個(gè)搖頭的臺(tái)式電風(fēng)扇,我就把外面反方向轉(zhuǎn)的外殼拿掉了,這樣中間旋轉(zhuǎn)的金屬螺套就露出來(lái)了。
我發(fā)現(xiàn)了一件有趣的事。只要我的手靠近這個(gè)螺套,我的手就會(huì)被吸進(jìn)去。多么有趣的事情!
所以我玩了一下午,相當(dāng)于被 "觸電 "整個(gè)下午。
后來(lái)小哥哥回家,發(fā)現(xiàn)我在玩這個(gè)可怕的游戲,很認(rèn)真的跟我說(shuō)。你整個(gè)下午都在按開關(guān)。你想死嗎?
第二,在物理實(shí)驗(yàn)課上,我想體驗(yàn)富蘭克林 的感情。當(dāng)時(shí)我早早的完成了老師布置的實(shí)驗(yàn)任務(wù)。
剩下的二十分鐘真的很無(wú)聊。
我就想試試低壓電穿過身體的感覺。
尤其是當(dāng)我的舌頭與燈泡串聯(lián)時(shí),電流作為導(dǎo)體通過我的舌頭,能讓燈泡變亮嗎?
燈泡開著的時(shí)候,亮度會(huì)不會(huì)比不經(jīng)過舌頭的時(shí)候低。
每當(dāng)我腦子里出現(xiàn)問題,我必須馬上解決它。
于是我趕緊接上電線,合上開關(guān),然后號(hào)召身邊的幾個(gè)同學(xué)一起見證這一刻。
這時(shí)候班里幾個(gè)女生怕我出事,特意跟我說(shuō), "It 這很危險(xiǎn),所以不要。;不要嘗試 "!
"危險(xiǎn) "?我仍然要挑戰(zhàn)這個(gè) "危險(xiǎn)與危險(xiǎn),尤其是在這么多女生面前。我必須成為 "危險(xiǎn) "一次讓他們看看我有多強(qiáng)大!
第三,電一點(diǎn)都不好吃,差點(diǎn)把我舌頭燒出來(lái)。趁還來(lái)得及,為了擔(dān)心壞學(xué)生告訴老師,我急忙往嘴里塞了兩股線。
就在我想咯咯笑的時(shí)候,我發(fā)現(xiàn)我的嘴沒有 別再聽我的了。
整個(gè)電流通過我的身體,我的心臟 "撲通撲通 "貼著我的胸口,然后我的舌頭感覺好像吃了一塊熱紅碳。它在燃燒,我的眼睛沒有。;不聽我的,開始模糊,四肢開始顫抖!
低壓,36伏,產(chǎn)生的電流,居然這么猛!
此外,我可以 我不能控制我的四肢,所以我保持 "通電和充電。
還好同組的同學(xué)用一本物理書打掉了我的手,救了我!
物理老師一臉嚴(yán)肅的跑過來(lái): "唐 我不想活了?可以隨便把電線塞到嘴里嗎?實(shí)驗(yàn)結(jié)束后,你無(wú)事可做,但你可以自己玩?
后來(lái),那天中午,腦子里嗡嗡作響。
我仍然不 我不明白這36伏的低壓電怎么能產(chǎn)生這么強(qiáng)的電流。
還有,還有一件事,我 我回頭問同學(xué),通電時(shí),燈泡是開著的還是關(guān)著的?實(shí)際上沒有人告訴我,但它 這個(gè)實(shí)驗(yàn)很遺憾。
在這里,我想說(shuō),電力不是一件好玩的事情,一直以來(lái)都是一個(gè)高危行業(yè),有危險(xiǎn)。小伙伴們千萬(wàn)不要像我這么窮,玩電是很危險(xiǎn)的!
分享名稱:人聲ai語(yǔ)音合成(如何利用深度學(xué)習(xí)實(shí)現(xiàn)單通道語(yǔ)音分離)
文章來(lái)源:http://www.5511xx.com/article/cochshp.html


咨詢
建站咨詢
