搜索资源列表
JAVA的声音处理方法 (转自伊氏女人)-----淘特网
- 数字音频格式有很多种,其质量与采样频率和采样精度两个参数有关。频率的表示单位为赫兹〔Hz〕,它表示每秒采样次数。采样频率越高,音质就越好。采样精度为每次采样所存储的数据数量,它决定每个数字信号所能够表示的离散振幅的数量。存储每个样本的数据越多,音质就越好。但是高品质的声音需要占用大量的内存和磁盘空间。考虑到网络带宽,在Internet连接上传输就需要花费很长的时间。对于Applet来说,保证声音文件的最小化是极为重要的。-digital audio format there are many,
spectrogram_analysis
- 语音语谱图分析程序,提供了数字样本数据,值得参考.matlab程序.-language voice spectrum analysis procedures, and providing a digital sample data, a good reference. Matlab procedures.
voiceandmatlab
- 对语音进行的时频分析,语音识别技术作为信息社会朝着智能化和自动化方向发展的关键技术之一,具有重要的研究意义和实用价值。经过近五十年的艰苦探索和研究,语音识别技术研究获得了极大的发展,其中有些比较成熟的技术已经逐步应用于日常生活中。但总体来说,语音识别在研究和实用化方面的难度还比较大。本文概括介绍了语音识别技术的全貌,所采用的关键技术、具体应用以及当前所面临的困难,并对单个语音样本在MATLAB上进行了仿真分析。-right voice for the time-frequency analysi
htk3.4
- 隐马尔科夫模型工具箱使用样本文件,可以广泛应用于识别等领域,语音识别工具htk的最新版本。无需解压密码-HMM toolbox use sample documents can be widely applied in such fields as identification, Speech recognition tools htk the latest version. Without extracting passwords
luyin
- 用MATLAB采集和播放一段(5s长,采样率为8k,每个样本位数8位)的语音信号。
lpc
- 功能:计算lpc系数由lpc得到lpcc,对模板参数和样本参数进行dtw比较 -Function: lpc coefficient calculated by the lpc be lpcc, samples of the template parameters and parameters of Comparative dtw
jiyuneirongdeyinpinjiansuoyan
- 本文根据上述的研究,采用基于Mel倒谱系数特征的隐马尔可夫模型对音 乐进行分类。在音乐特征提取方面,以感知特征和Mel倒谱系数组成特征向量 在音乐分类方面,以隐马尔可夫模型作为分类器,对音乐进行聚类和分类。通过 有监督的学习方式进行聚类,分类时将测试样本归入似然值最大的类别,对同一 音频抽取若干样本,对样本识别结果采用投票法,判定该音频的音乐类别,使分 类的准确率得到进一步的提高。根据上述方法进行了仿真实验,并对实验结果进 行了分析。本文将音频数据分为5类,对4种分类器
HMM
- :为了使应力变异在顽健语音识别系统中能够达到较好的识别效果,研究了基于隐马 尔可夫模型(HMM)的自适应技术,提出了将最大后验概率(MAP)和最大似然回归方法(MLLR)用 于应力变异语音的自适应中。实验结果表明,与基本系统相比,两种方法均有效地提高系统识别 率。以SD为初始模型的最大后验概率方法在150个训练样本时识别效果最好,可以达到90.4% 。-: In order to stress variation in the robustness of speech recogni
Research_on_DTW-based_speech_recognition_for_voice
- 研究了将语音识别中的 ( 动态时间规整) 算法用于声纹鉴别的技术。通过引入 DTW Dynamic Time Warping, , 由所给的有限个样本建立最大相似于样本点的样本域, 计算被测样本的相似度。该算法提高了语 “样本域”的概念 音鉴别( 区分不同发音者) 的效率。有限人数的实验结果显示该算法辨伪率为 ( 人次) , 识别率 (98.75 400 81~93 80 人次) 。-Will be studied in speech recognition (dynamic
pattenrecongition
- 通过用最小距离分类判别方法,用MATLAB程序找出最小距离分类判别时的识别界面,从而进行识别已知的两类训练样本,并分析其识别错误率。-By using minimum distance classifier discriminant method, using MATLAB program to find the minimum distance classifier recognition interface when the judge, which is known to identify
yuyinyangben
- 这是我做语音识别用到的一些语音样本,希望对做语音识别的同仁有所帮助。-This is what I used to do speech recognition, some voice samples do want to help colleagues in speech recognition.
snr
- 计算语音、音频信号的信噪比程序(包含音频样本文件)-Calculation of voice, audio program signal to noise ratio (including the audio sample file)
mean-K-KPCA
- 通过核 K- 均值聚类的方法对语音帧进行聚类 , 由于聚类的中心能够很好地代表类内的特征, 用中心样本帧取代该类, 减少了核矩阵的维数, 然后再采用稀疏 KPCA方法对核矩阵进行特征提取。-Through the nuclear K-means clustering method for clustering of speech frames, the cluster center can be a good representative of the class characteristics
lbg
- 实现已知训练序列的矢量量化器(LBG)算法。初始码书从训练序列每隔五个样本选取一组-Achieve a known training sequence of the vector quantizer (LBG) algorithm. The initial codebook from the training sequence every five samples to select a group of
CODE
- 提取语音信号的MFCC参数进行语音信号的识别,利用神经网络,自带有训练样本和测试样本-Identification of MFCC parameters of speech signal extraction of speech signal, using neural network, with the training samples and test samples
simon-0.4.0
- 跨平台开源语音识别软件Simon发布了v0.4版。新版历经了多年的开发,主要新特性有:全新的语音识别层;改进上下文感知准确性和性能;新的对话系统引入脚本变量、整合模板系统、数据引擎和文本语音输出,能支持与用户的完整对话;新的样本评审工具Afaras,Akonadi命令插件,-The project provides a ready-to-use interface for the julius CSR engine for a handicapped child which is not abl
anglecos
- 利用夹角余弦距离进行样本数据分类。实现步骤主要分为以下两部分:a、待测样品X与训练集里每个样品Xi的距离采用夹角余弦距离公式计算。b、循环计算待测样品和训练集中各已知样品之间的距离,找出距离待测样品最近的已知样品,该已知样品的类别就是待测样品的类别。-Using the sample data classification Angle cosine distance.Implementation steps are divided into the following two parts: a,
语音聚类示例
- 实验示例是基于语音中的mfcc,语音倒谱特征来进行聚类,先利用训练样本来计算训练样本聚类中心(用到了lbg算法),之后再进行分类。 注意:使用代码时需要自己更改文件路径。(This example is based on the MFCC in speech and the feature of speech Cepstrum to cluster. First, the training sample is used to calculate the training sample clus
mfcc
- 采用MFCC方法提取训练集样本或测试集样本语音特征参数的MATLAB程序,仿真时需先将voicebox语音处理工具箱添加到MATLAB软件中(The MFCC method is used to extract the MATLAB program of the training set sample or the test set sample speech feature parameters. The voicebox voice processing toolbox is added t