音频的使用

简介

KOI作为多功能的人工智能模块,集合了麦克风与喇叭,因此可以实现音频功能,如录音与播放,另外还能进行特定人声语音识别。

录音与播放需要有内存卡,内存卡不支持热拔插,因此需要插上KOI的USB前插好。

特定人声语音识别处于Beta版本,识别率不高,大家先轻微体验。

连接KOI

确保你已经安装更新了Klink,已经打开Klink与连接好KOI,如果有疑问请翻看前面的入门教程。

积木块介绍

颜色识别积木如下:

../../../_images/0123.png

点击录制音频,KOI屏幕出现Recording,这时候应该对着麦克风进行说话,KOI会进行3秒录制,录制完毕后,它会播放录制的内容。若KOI无内存卡,屏幕则会提示No card的信息。

音频命名必须为XX.WAV

../../../_images/0222.png02

点击播放音频,请确保你的音频名称与录制音频的名称一致。否则播放不出声音。

../../../_images/0320.png03

此积木块用于特定人声识别前环境噪音校准,点击环境噪声校准,会反馈回来一个值,若值比你设置的值大,则需要更改阈值。

../../../_images/0419.png04

命令词添加与分类器的标签录入类似,用于绑定语音与标签

../../../_images/0519.png05

当命令词都添加好后,点击命令词搜索

../../../_images/0618.png06

录音与播放示例程序

编写如下的程序:

../../../_images/0714.png

具体操作:

点击录制音频,屏幕出现Recording的字符串,这时候对着麦克风进行说话,3秒后录音完毕。KOI会自动播放你录制的音频。

当你点击播放音频,KOI就会播放对应内存卡卡中的音频。

特定人声语音识别示例程序

编写如下的程序:

../../../_images/0816.png

具体操作:

点击KOI环境噪声校准,若返回值比设置的阈值大,则需要更改阈值,需要改到比返回值大。

点击KOI命令词添加1,KOI屏幕变为土黄色,这时候开始说出你的口令,大概录制3秒,若录入成功,屏幕变为绿色。若录入识别,屏幕变为红色。同一个命令词标签,至少需要录入2~3次。录制完毕后,再进行下一个命令词标签。

最后点击命令词搜索,KOI屏幕变为土黄色,说出你的命令词。此积木块会返回命令词的标签

使用注意

录音,只能录制大概3秒的音频,大小不超过512K。播放音频也只能播放512K内的wav音频。

特定人声语音识别还处于研发改进阶段,因此识别率不是很高,大家先体验体验。