新聞中心
這是構(gòu)建語音識別系統(tǒng)的第一步,因為它可以幫助您理解音頻信號的結(jié)構(gòu)。 處理音頻信號可遵循的一些常見步驟如下所示 -

目前創(chuàng)新互聯(lián)已為千余家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)頁空間、網(wǎng)站托管維護、企業(yè)網(wǎng)站設(shè)計、古城網(wǎng)站維護等服務(wù),公司將堅持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
記錄 當必須從文件中讀取音頻信號時,首先使用麥克風錄制。
采樣 用麥克風錄音時,信號以數(shù)字形式存儲。 但為了解決這個問題,機器需要使用離散數(shù)字形式。 因此,我們應(yīng)該以某個頻率進行采樣,并將信號轉(zhuǎn)換為離散數(shù)字形式。 選擇高頻采樣意味著當人類聽到信號時,他們會感覺它是一個連續(xù)的音頻信號。
示例
以下示例顯示了使用 Python 存儲在文件中的逐步分析音頻信號的方法。 這個音頻信號的頻率是 44,100HZ。
下面導(dǎo)入必要的軟件包 -
import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile現(xiàn)在,讀取存儲的音頻文件。 它會返回兩個值:采樣頻率和音頻信號。 提供存儲音頻文件的路徑,如下所示 -
frequency_sampling, audio_signal = wavfile.read("/Users/admin/audio_file.wav")使用顯示的命令顯示音頻信號的采樣頻率,信號的數(shù)據(jù)類型及其持續(xù)時間等參數(shù) -
print('\nSignal shape:', audio_signal.shape)
print('Signal Datatype:', audio_signal.dtype)
print('Signal duration:', round(audio_signal.shape[0] /
float(frequency_sampling), 2), 'seconds')這一步涉及如下所示對信號進行標準化 -
audio_signal = audio_signal / np.power(2, 15)在這一步中,從這個信號中提取出前 100 個值進行可視化。 為此目的使用以下命令 -
audio_signal = audio_signal [:100]
time_axis = 1000 * np.arange(0, len(signal), 1) / float(frequency_sampling)現(xiàn)在,使用下面給出的命令可視化信號 -
plt.plot(time_axis, signal, color='blue')
plt.xlabel('Time (milliseconds)')
plt.ylabel('Amplitude')
plt.title('Input audio signal')
plt.show()下面輸出圖形是上述音頻信號提取的數(shù)據(jù),如圖所示 -
Signal shape: (132300,)
Signal Datatype: int16
Signal duration: 3.0 seconds 網(wǎng)站題目:創(chuàng)新互聯(lián)AI教程:AI人工智能可視化音頻信號-從文件讀取并進行處理
分享路徑:http://www.5511xx.com/article/dpossds.html


咨詢
建站咨詢
