语音信号处理教程（一）音频文件录制、导入、绘图

2023-08-27 13:49:13

这篇文章我们来看下如何用Matlab和Python产生录制音频、播放音频、导入音频文件，并查看音频文件的波形图。

首先来看下Matlab中如何操作。Matlab提供了audio*一系列函数来对音频信号进行处理，下面我们来一一讲解。

audiorecorder(Fs, NBITS, NCHANS, ID)

该函数用于产生一个audiorecorder的对象，可以用来录制音频信号；其中
- Fs表示采样率，常用的采样率有：8000, 11025, 22050, 44100, 48000和 96000 Hz
- NBITS表示采样位数，可以选择8、16、24
- NCHANS表示声道数，只能是1或2，表示单声道或双声道
- ID表示录音设备，不指定或者-1表示默认的录音设备
该函数配合recordblocking()函数，一起完成录音功能。使用play()函数来播放该刚刚录制的音频信号。

fs = 44100;
r = audiorecorder(fs, 16, 1);
disp('Start speaking.')
recordblocking(r, 2);  % 录音2秒
disp('End of Recording.');
play(r);

如果要获取audiorecorder对象中的音频数据，可以使用getaudiodata()函数

mySpeech = getaudiodata(r, 'int16'); % get data as int16 array
figure;plot(mySpeech);

将录制的音频信号保存成文件，使用audiowrite()函数，直接音频对象、保存文件名和采样率即可。

%% save file
filename = 'mySpeech.wav';
audiowrite(filename, mySpeech, fs);

对于先用的音频文件，使用audioread()函数将其读入到workspace中，使用sound()函数可以将该数据进行播放，如果要倍速或者慢速，调节sound()函数中的采样率即可。

%% load file
r_data = audioread(filename);%% play file data
sound(r_data, fs);

下面来看Python中如何完成上面的操作，在Python中，需要用到pyaudio和wave库，其中pyaudio在安装时，使用conda install pyaudio来完成，如果使用pip install pyaudio是不行的，因为pyaudio库需要PortAudio的支持，PortAudio是一个免费、跨平台、开源的音频I/O库，这并不是一个python的库函数，因此不能使用pip来进行安装，至于为什么用conda安装是可以的，请自行搜索pip install和conda install的区别。

前面我们指定4个参数，分别是缓冲区帧数、采样位宽、声道数和采样率，跟Matlab中唯一的区别就是多了个缓冲区帧数，这个参数在我们录制和回放音频时会用到，由于每次录制/回放的点数都是有限的，因此在录制/回放时都是循环进行的，即每录制/回放完当前缓冲区的数据，再去重新取最新的数据进行录制/回放，Matlab中该过程不需要我们手动设置，Matlab的系统函数已经做好了。

在录制文件时，参数input=True，在回放文件时，参数output=True；如果回放文件时进行倍速或慢速，修改p.open()中的参数rate即可。在load_wave()函数中通过str_data = wf.readframes(nframes)读上来的都是字符串类型，因此我们又通过np.fromstring转成了np.short类型。

import pyaudio
import wave
import numpy as np
import matplotlib.pyplot as pltCHUNK = 1024              # 每个缓冲区的帧数
FORMAT = pyaudio.paInt16  # 采样位数
CHANNELS = 1              # 单声道
RATE = 44100              # 采样率def record_audio(wave_out_path, record_second):""" 录音功能 """p = pyaudio.PyAudio()                      # 实例化对象stream = p.open(format=FORMAT,channels=CHANNELS,rate=RATE,input=True,frames_per_buffer=CHUNK)  # 打开流，传入响应参数wf = wave.open(wave_out_path, 'wb')       # 打开 wav 文件。wf.setnchannels(CHANNELS)                 # 设置单声道wf.setsampwidth(p.get_sample_size(FORMAT))# 设置采样位宽为16bitswf.setframerate(RATE)                     # 设置采样率print('Start speaking for %ds\n' % record_second)for _ in range(0, int(RATE * record_second / CHUNK)):data = stream.read(CHUNK)wf.writeframes(data)                  # 写入数据stream.stop_stream()  stream.close()print('End of Recording.')p.terminate()wf.close()def play_audio(wave_input_path):p = pyaudio.PyAudio()                     # 实例化对象wf = wave.open(wave_input_path, 'rb')     # 读 wav 文件stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),channels=wf.getnchannels(),rate=wf.getframerate(),output=True)data = wf.readframes(CHUNK)               # 读数据print('Play back audio.\n')while len(data) > 0:stream.write(data)data = wf.readframes(CHUNK)stream.stop_stream()  stream.close()p.terminate()def load_wav(wave_input_path):wf = wave.open(wave_input_path, 'rb')    # 读 wav 文件params = wf.getparams()nchannels, sampwidth, framerate, nframes = params[:4]str_data = wf.readframes(nframes)wf.close()wave_data = np.fromstring(str_data, dtype=np.short)plt.figure()plt.plot(wave_data)plt.show()if __name__ == '__main__':record_audio('test.wav', 2)play_audio('test.wav')load_wav('test.wav')

欢迎关注微信公众号：Quant_Times

欢迎大家学习我的课程：
System Generator & HLS数字信号处理教程

在这里插入图片描述

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

语音信号处理教程（一）音频文件录制、导入、绘图

相关文章