搜索资源列表
1.voiceregonitionbasic
- 语音识别课程的讲义,内容言简意赅,值得一看。因为文件较大,所以分多次上载。-speech recognition programs overhead, as is concise and interesting sites to visit. Because larger document, so many hours on the set.
TTS1
- 用VC实现的语音库的建立的程序. 首先建立单音节语音库,然后将所有的单音节语音文件合成一个大的.wav文件,并且制定索引机制,便于快捷查找
0-9(Speech-Recogenition)用matlab仿真0到9十个数字的语音识别
- 用matlab仿真0到9十个数字的语音识别 1、对语音的WAV文件和LAB文件进行处理,产生十个文件,每个文件对应于一个数字,存贮着该数字的波形文件。(shujuzhengli.m) 2、分别利用上面十个文件训练出十个HMM模板,具体方法是:首先将语音的波形文件分帧,以128个点为一帧,帧移为64,每一帧通过mfcc.m计算出13个系数,随着波形的长度不同,一个语音文件可以计算得到13*N个系数,截取13*15的矩阵(mfcc系数)用作训练数据。一般一个HMM模板用20组mfcc系数
MFCCdeC
- 工程包括声音文件的读取、预处理、MFCC参数的提取、最后的聚类函数,对于做语音识别的人帮助很大-The works will include the sound files to read, pre-treatment, MFCC parameters extracted, the final clustering function, to do speech recognition for the great help of people
GAUSSIANloglikelihood
- GMM高斯混合模型大规模概率对数计算 需要一个模型地址文件和一个需要识别的声音的mfc文件可以一次执行大批量-GMM Gaussian mixture model probability on the number of large-scale computing need a model of address file, and the voice of the mfc file which need to be identified .can be an implementation
SR_speechrecognition
- 微软语音识别分两种模式:文本识别模式和命令识别模式.此两种模式的主要区别,主要在于识别过程中使用的匹配字典不同.前者使用的是通用字典,特点是内容多,覆盖的词汇量大,字典由sdk提供.适用于没有预定目标的随机听写之类的应用.同时因为词汇量大直接导致识别的精度降低,识别速度较慢.后者的字典需要 开发者自己编写,就是你们所说的xml文件.通过SR引擎读取xml实现特定词识别-Microsoft speech recognition points two modes: text recognition
TMMFCCdeCh
- 工程包括声音文件的读取、预处理、MFCC参数的提取、最后的的聚类函数,对于做语音识别的人帮助很大,已通过测试。 -The works will include the sound files to read, pre-treatment, MFCC parameters extracted, the final clustering function, speech recognition for people who do great help to the full source co
pitch
- 得到声音文件的数据和采样率,求自相关序列,基音周期分析函数,求最大值所对应的位置,即基音周期 -Receive voice data of a file and sample rate, and auto-correlation sequence, the function of pitch analysis, a position corresponding to the maximum demand, the pitch
pipeichangdingwei
- 本程序是计算深海远场情况下的声源定位,首先要编译海洋环境文件(包含阵元信息),利用Krakren程序计算本征函数和本征模态,再利用本程序的子程序计算拷贝向量,然后合成声源信号,最后根据匹配场的程序进行匹配定位,由于数据量比较大,计算区域如果选的比较大的话,计算时间就比较长,酌情选择。-This procedure is to calculate the far-field sound source localization in case of deep sea, we must first c
jiyintiqu
- 程序主要是求一段音频数据的基音频率 jiyinzhouqi.m --------求基音周期 find_maxn.m --------求自相关函数的最大值 test2.wav --------程序中用到的示例wav数据文件-The program is mainly the fundamental frequency for an audio data Jiyinzhouqi.m- for pitch period Find_maxn.m- the maximum
sy3
- (1)录制语音文件 利用GoldWave或NGwave录音软件录制单字发音语音文件,以wav音频格式保存,共录制两组,一组用于计算参考模板,另一组作为测试模板用于语音识别。 录制语音时,为了能够在主程序中循环读入语音文件,文件名采用数字顺序命名。记录语音文件以及所对应的发音。记于表3中。 另外,录制语音时,注意调整合适的Mic音量,避免语音波形幅度过小,难于同噪声区分开。同时也要避免波形幅度过大,造成波形失真。 (2)调试端点检测程序 结合流程图读懂Matlab程序,先单独调
sound_to_spectrogram2
- 从大文件下读取子文件夹里的声音,并转成语谱图,并保存在本地电脑上面(sound transfer spectrogram)