windows speech sdk - 穆世明博客

前言：本系列准备介绍一款基于的语音通信软件开发过程，希望对你有所帮助！

环境： +

参考链接：https://www.cnblogs.com/gaoyaguo/p/5032920.html

（读音[spi:ks]）是一套开源免费的、无专利保护的、针对语音设计的音频压缩格式。Speex项目通过以提供昂贵的专用语音编解码器的免费替代方案为目标，来降低语音应用程序的进入门槛。此外，Speex非常适用于互联网应用程序，并提供了其他大多数编解码器中不存在的有用功能。最后，Speex是GNU项目的一部分，可以在修订后的BSD许可证下使用。

一种基于码激励线性预测（CELP）算法的开源软件语音引擎。
面向Internet 上的语音通信。
其主要设计目标是为了提供高质量和低比特率的语音编码。
同一个比特流中对语音信号实现
- 窄带( 8 kHz)
- 宽带( 16kHz)
- 超宽带( 32 kHz) 的编码;
支持声音强度的立体声编码;
丢包补偿能力;
可变比特率( variable bitrate, VBR) 特性,
编/ 解码器可以在任意时刻动态地改变语音的比特率;
语音活动检测( voice activity detection, VAD) ;
声音的DTX( discontinuous transmission, 不连续传输);
语音处理的定点数计算功能;
声学回声消除功能。

官网：http://www.speex.org

用户手册：http://www.speex.org/docs/manual/speex-manual.pdf

API手册:http://www.speex.org/docs/api/speex-api-reference.pdf

speex-1.2beta2开源音频编码器win32下编译：http://www.360doc.com/content/070719/11/29694_619680.html

Ekiga－开源的视频聊天程序：http://www.ekiga.org

注意：编解码器已经被编解码器淘汰，Speex还是可以继续使用，但由于Opus比Speex在各方面都更好，所以鼓励大家切换到Opus，但是Opus只支持编码和解码，不支持噪音抑制、声学回音消除等其他处理功能。

下载地址：https://www.speex.org/downloads/

这里写图片描述

win32VS2008包含项目：

项目名称内容 speexenc speex编码器控制台程序，输入是ogg格式封装的speex编码的spx文件，输出是格式为raw PCM或者WAVE文件，有控制台参数提示信息。依赖libogg库 speexdec speex解码器控制台程序，输入是格式为raw PCM或者WAVE文件，输出是ogg格式封装的speex编码的spx文件，有控制台参数提示信息。依赖libogg库 testenc 测试窄带编码 testenc_wb 测试宽带编码 testenc_uwb 测试超宽带编码 libspeex 库里面包含了编码和解码相关的函数

下载地址：http://www.linuxfromscratch.org/blfs/view/svn/multimedia/libogg.html

libogg包包含Ogg文件结构。这对于创建(编码)或播放(解码)一个物理位流非常有用。众所周知，这个包使用LFS-8.2平台构建和工作。

这里写图片描述

打开libogg-1.3.3win32VS2015libogg_static.sln ，编译此项目，生成；
将libogg-1.3.3中的文件复制到speex-1.2.0下的include下；
speex-1.2下新建文件夹，将生成的复制到speex-1.2的lib目录下；
打开speex-1.2win32VS2008libspeex.sln;
配置项目和的lib库文件，即将添加到这两个项目中，添加库目录，设置链接器输入附加依赖；
编译speexenc和speexdec项目 ;

编译错误：

编译可能报错1.：fatal error C1083: 无法打开源文件: “……libspeexfftwrap.c”: No such file or directory

解决：删除文件

编译可能报错2.：error MSB8036: 找不到 Windows SDK 版本8.1。请安装所需的版本的 Windows SDK 或者在项目属性页中或通过右键单击解决方案并选择“重定解决方案目标”来更改 SDK 版本。
解决：修改属性 SDK 版本；

编译可能报错1.：

1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_packet_to_header，该符号在函数 _process_header 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_bits_init，该符号在函数 _main 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_bits_destroy，该符号在函数 _main 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_bits_read_from，该符号在函数 _main 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_bits_remaining，该符号在函数 _main 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_decode_stereo_int，该符号在函数 _main 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_std_stereo_request_handler，该符号在函数 _process_header 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_decoder_init，该符号在函数 _process_header 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_decoder_destroy，该符号在函数 _main 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_decode_int，该符号在函数 _main 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_decoder_ctl，该符号在函数 _main 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_lib_ctl，该符号在函数 _version 中被引用
1>speexdec.obj : error LNK2019: 无法解析的外部符号 _speex_lib_get_mode，该符号在函数 _process_header 中被引用

解决：属性→配置属性→链接器→输入→附加依赖项：

编译可能报错2.：

1>libspeex.lib(stereo.obj) : error LNK2019: 无法解析的外部符号 __imp__floor，该符号在函数 _speex_encode_stereo 中被引用
1>libspeex.lib(speex.obj) : error LNK2001: 无法解析的外部符号 __imp__floor
1>libspeex.lib(sb_celp.obj) : error LNK2001: 无法解析的外部符号 __imp__floor
1>libspeex.lib(nb_celp.obj) : error LNK2001: 无法解析的外部符号 __imp__floor

解决：参考解决方法

使用的API函数对音频数据进行压缩编码要经过如下步骤：

定义一个SpeexBits类型变量bits和一个Speex编码器状态变量enc_state。
调用speex_bits_init(&bits)初始化bits。
调用speex_encoder_init(&speex_nb_mode)来初始化enc_state。其中speex_nb_mode是SpeexMode类型的变量，表示的是窄带模式。还有speex_wb_mode表示宽带模式、speex_uwb_mode表示超宽带模式。
调用函数 int speex_encoder_ctl(void * state, int request, void * ptr)来设定编码器的参数，其中参数state表示编码器的状态；参数request表示要定义的参数类型，如SPEEX_GET_FRAME_SIZE表示设置帧大小，SPEEX_SET_QUALITY表示量化大小，这决定了编码的质量；参数ptr表示要设定的值。
可通过speex_encoder_ctl(enc_state, SPEEX_GET_FRAME_SIZE, &frame_size) 和speex_encoder_ctl(enc_state, SPEEX_SET_QUALITY, &quality)来设定编码器的参数。
初始化完毕后，对每一帧声音作如下处理：调用函数speex_bits_reset(&bits)再次设定SpeexBits，然后调用函数speex_encode(enc_state, input_frame, &bits)，参数bits中保存编码后的数据流。
编码结束后，调用函数speex_bits_destroy(&bits)，speex_encoder_destroy(enc_state)来关闭和销毁SpeexBits和解码器。

对已经编码过的音频数据进行解码要经过以下步骤：
定义一个SpeexBits类型变量bits和一个Speex编码状态变量enc_state。
调用speex_bits_init(&bits)初始化bits。
调用speex_decoder_init (&speex_nb_mode)来初始化enc_state。
调用函数speex_decoder_ctl (void *state, int request, void *ptr)来设定编码器的参数。
调用函数 speex_decode(void *state, SpeexBits *bits, float *out)对参数bits中的音频数据进行解编码，参数out中保存解码后的数据流。
调用函数speex_bits_destroy(&bits), speex_ decoder_ destroy (void *state)来关闭和销毁SpeexBits和解码器。

上一篇： pytest与unittest框架原理

下一篇： shtml和html的区别

版权声明：
本文来源网络，所有图片文章版权属于原作者，如有侵权，联系删除。

本文网址：https://www.mushiming.com/mjsbk/12784.html

相关文章：