搜索资源列表
10-1snoopy
- 该程序是非特定人语音识别程序,原来在SPCE500A下运行,能识别并应答16个命令,存储空间为128K字节。 //我们将其进行了修改,使其能在SPCE061A下运行,由于存储空间为32K字,只能识别并应答9个命令。 //在这个例程当中,我们示范了如何使用语音识别引擎对8个已经经过训练的命令进行识别。 //第一个命令 \"Snoopy\",可以作为使能命令,也就是说使用者只能在该命令之后发出其他命令。 //例如,用户只有在发出 \"Snoopy\"命令并且听到响应\"Snoopy here\"之后
exp_001
- 自己用VC编写的一个读取wave文件,并计算短时能量、短时过零率以及自相关函数的程序。所有的计算结果都会显示在程序运行后生成的文本文档中。注意,运行程序时需要修改wave文件路径,在程序中体现为wavefilename字符串指针所指向的内容。-own VC prepared a document reader wave and short-term energy calculation, Short-term rates and zero autocorrelation function pro
tdpsola
- 此算法是针对语音合成,采用时域的基音同步叠加算法,对波形进行韵律特征提取,修改,以及合成(包括短时能量分析,短时过零率分析等等算法)!算法是用matlab编写的-Speech synthesis, using time-domain synchronous Pitch stack algorithm, rhythm right waveform feature extraction, modification, and synthesis (including short-term energy
tf32_revision
- 语音处理控件bds2006,原来是delphi的控件,本人修改成bcb2006下使用的,还有一些问题-bds2006 speech processing controls, the original is delphi Controls I revise bcb2006 use, there are still some problems
PickWav
- 可将含有自定义头信息的多段语音的合成文件按照头信息内容进行选择,提取,分割和再组合。本程序用在非特定语音识别的语音库文件的批量处理中,略作修改即可扩展至其他用途。-will contain information from the definition of the first multi-Speech Synthesis of the document in accordance with the information content of the first choice, extract
MATLAB-YUYINSHIBIE
- 完整的基音识别程序,经过修改,测试正确。包含基音检测,DTW,LPCC,MFCC提取等-integrity of the pitch identification procedures, the result of the revision, the test correctly. Pitch Detection included, DTW, LPCC Features, MFCC extraction
LSAcausal
- 语音增强算法,基于LsA-MMSE方法,并对其先验信噪比估计器进行了修改,具体过程参看Isal的论文。语音间隙间的音乐噪声也消除了。-speech enhancement algorithms, based on LsA - MMSE, and signal-to-noise ratio of its prior estimate for the changes, See specific process Isal theses. Voice gap between the music also
hmm-viterbi-c
- 下载的一个不错的HMM程序,主要实现HMM中的viterbi最佳路径选择算法,用vc编写,可以根据自己需要参考修改 this is a excellent HMM program,it completes the VITERBI algorithm in HMM.
audioretrieval
- 一个音频检索的例子。里面含有VC源码,并且附了一个PDF文档说明。根据自己需要修改一下可以用。
g729-itu
- g729的定点C实现,可以高效地进行语音压缩,修改后可用于各种语音传输场合
sonogram_1
- 能画出一段语音信号的语谱图,修改其中的参数能改变窗长和帧长来改变语谱图的时间分辨率和频谱分辨率。
libsvm-2.84
- 一个很不错的开源的SVM软件,可以自由的修改源代码
source_fingerprint
- 程序需要imagemagic的支持,imagemagic可以在网上搜索到最新的版本(程序在图像 的输入/保存代码处用了imagemagic的函数,如果读者不想使用imagemagic,可以修改 程序有关图像存取的部分,改成自己的图像存取函数,这部分的工作量不是太大)。 代码可以在Linux下面编译通过。
speechsdk528
- 使用微软的Speech sdk5.1实现了语音的的中文和英文合成,同时可以修改说话人的种类
Wave
- 这是我的毕业设计的前期处理部分,毕业设计题目是“基于神经网络的拼音识别系统”。 端点检测的函数是CWaveDoc::OnEndpointDetect() ,大家运行时需要修改读入语音信号的路径。 需要读入的语音信号b1.wav一并附于wav文件。
insertimagedemo
- freetextbox上传文件的修改,freetextbox上传文件的修改
amendtheformant
- 可以对语音信号的共振峰作出修改,效果不错
imskpe-1.0beta7-win32-full
- klatt共振峰语音合成器,可以修改模型参数达到修改合成语音音质的目的。该程序采用gtk开发,可跨平台使用-Formant voice synthesizer, model parameters can be amended to meet the synthetic voice quality purposes. The program uses gtk development, the use of cross-platform
Paris ica
- ica 权威paris在很久以前写的ica算法程序,稍作修改可以用于声音信号识别。-Paris, one of the authorities of ICA, created the program at long time ago. It can be used to recognise speech signal if modify a little.
fft2ftftE
- 修改的倒谱处理语音的函数,将fft转为倒谱,采用了遮掩原理-Modify the function of speech cepstrum processing