Python 如何在Python中获取麦克风音频输入并即时处理

在本文中，我们将介绍如何使用Python从麦克风获取音频输入，并进行实时处理。

1. 使用pyaudio库获取麦克风音频输入

要获取麦克风的音频输入，我们可以使用pyaudio库。首先，我们需要安装pyaudio库：

pip install pyaudio

接下来，我们可以使用以下代码从麦克风获取音频输入：

import pyaudio
import numpy as np

chunk = 1024
sample_rate = 44100

p = pyaudio.PyAudio()

stream = p.open(format=pyaudio.paInt16,
                channels=1,
                rate=sample_rate,
                input=True,
                frames_per_buffer=chunk)

while True:
    data = stream.read(chunk)
    audio_data = np.frombuffer(data, dtype=np.int16)
    # 在这里对音频数据进行处理
    ...

在上面的代码中，我们使用PyAudio打开一个音频输入流，并设置了音频的格式（16位整数），声道数（单声道），采样率（44100 Hz）和缓冲区大小（1024）。

然后，我们使用一个无限循环来持续读取音频数据。每次读取数据后，我们将其转换为NumPy数组，并可以对音频数据进行处理。

2. 实时处理音频数据

在获取到音频输入后，我们可以对音频数据进行实时处理。下面是一些常见的音频处理任务的示例：

2.1 音频波形可视化

要将音频波形可视化，我们可以使用Matplotlib库。以下是一个简单的示例：

import matplotlib.pyplot as plt

plt.ion()
fig, ax = plt.subplots()

while True:
    data = stream.read(chunk)
    audio_data = np.frombuffer(data, dtype=np.int16)

    ax.clear()
    ax.plot(audio_data)
    plt.pause(0.001)

在这个示例中，我们使用Matplotlib创建了一个实时的音频波形图。每次读取新的音频数据后，我们清除图形并绘制新的波形图。

2.2 音频分析

要对音频进行频谱分析，我们可以使用SciPy库。以下是一个简单的示例：

from scipy.fft import fft, fftfreq

while True:
    data = stream.read(chunk)
    audio_data = np.frombuffer(data, dtype=np.int16)

    spectrum = np.abs(fft(audio_data))
    frequencies = fftfreq(len(audio_data), 1/sample_rate)

    # 在这里对频谱数据进行处理
    ...