使用卷积神经网络进行音频分类
使用卷积神经网络和 Raspberry 5 AI 模型部署进行音频分类
讲师:Ahmed Qusay
双语IT资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
您将学到什么
- 定义真实的音频环境来记录机器学习模型预测的片段。
- 编写负面和正面的音频片段以供机器学习使用。
- 注入“音频关键词”以在 Positive Audio Clips 中触发 RASPI 5 处理器动作。
- 将音频文件切分成多个音频片段,以供神经网络输入。
- 应用神经网络使用的原始音频准备的 5 个阶段(负载、时间域、频域、频谱图和调整大小)。
- 使用 Librosa、频谱图和原始音频分贝供神经网络使用。
- 将标记音频片段用作正音频和负音频,以供神经网络训练使用。
- 对音频片段进行切片、标记和批处理以供神经网络使用。
- 使用 Google Colab 创建一个带有卷积神经网络的 Python 程序,用于音频分类和预测,并保存为 H5 AI 模型。
- 组装 Raspberry Pi 5 和其他硬件设备以用于音频预测。
- 安装 Raspberry Pi 5 软件要求,包括操作系统、VNC 查看器、Librosa、Tensorflow 等。
- 使用FileZilla将要保存的H5 AI模型传输到Raspberry Pi 5中。
- 在 Raspberry Pi 5 内部部署并运行 H5 AI 模型并进行音频预测。
- 使用 Raspberry Pi 5 音频预测来控制伺服电机的运动。
探索相关主题
要求
- 具备Python基础知识和AI基础知识。
描述
本课程旨在让您真正了解如何在机器学习中处理音频文件。本课程将为您提供使用 Python 从 A 到 Z 处理音频文件的完整记录。本课程将解释如何使用卷积神经网络生成用于音频分类目的的 H5 AI 模型。本课程将让您全面了解 Raspberry Pi 5 的组装、编程、AI 模型部署和音频文件预测。我们将学习如何识别音频环境以用于机器学习。我们将学习如何录制音频文件并将其切成正负类型的片段。如何处理原始音频片段并注入神经网络要检测的“关键字”。应用片段标记、片段切片和片段批处理,为将音频片段馈送到神经网络做准备。应用所需的阶段(加载、时域、频域、频谱图和调整大小)来处理原始音频片段以供预测使用。使用 Python 编程生成用于音频预测目的的 H5 AI 模型。在 Raspberry Pi 5 中部署并运行 H5 AI 模型,以音频命令控制伺服电机的运动。使用实时音频预测过程测试模型。
本课程适合哪些人:
- 每个人都需要全面了解机器学习中的音频文件操作。
- 每个人都需要全面了解 Python 中的音频文件操作。
- 每个人都需要全面了解使用 Raspberry Pi 5 进行音频文件处理。
如果你有能力,请务必支持课程的原创作者,这是他们应得的报酬!
本站收取的费用,仅用来维持网站正常运行的必要支出,从本站下载任何内容,说明你已经知晓并同意此条款。