CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 其它 语音合成与识别 搜索资源 - 因为

搜索资源列表

  1. 1.voiceregonitionbasic

    1下载:
  2. 语音识别课程的讲义,内容言简意赅,值得一看。因为文件较大,所以分多次上载。-speech recognition programs overhead, as is concise and interesting sites to visit. Because larger document, so many hours on the set.
  3. 所属分类:语音合成与识别

    • 发布日期:2008-10-13
    • 文件大小:26.13kb
    • 提供者:吴诗意
  1. matlab_reduce_noise

    0下载:
  2. matlab去除50hz噪声。 我用电脑录了一段声音,里面有50hz的周期噪声(因为受交流电干扰)。而我自己的声音频率最低是90hz。我使用了一个10阶butterworth高通滤波器,边带是70hz(介于50跟90之间)。 问题是,这不能直接用。因为声音文件的采样率是22k,70相对于22k来说太小了。所以我得先把我的声音欠采样,然后再滤波,然后再插值。
  3. 所属分类:语音合成与识别

    • 发布日期:2008-10-13
    • 文件大小:6.09kb
    • 提供者:张文斌
  1. Great_Outdoors_by_sandals82.zi

    0下载:
  2. 一种简单有效的基于动态时变语音识别源码 对于大多数研究者来说,寻找能够匹配二重时间序列信号的最佳途径是很重要的,因为它有许多重要的应用需求.DTW是实现这项工作的显著技术,尤其在语音识别技术领域,在这里一个测试信号被按照参照模板拉伸或压缩, ,Searching for the best path that matches two time-series signals is the main task for many researchers, because of its importa
  3. 所属分类:Speech/Voice recognition/combine

    • 发布日期:2017-05-12
    • 文件大小:2.53mb
    • 提供者:宋小小
  1. melppp

    0下载:
  2. 在语音编码算法中,混和激励线性预测(MELP)算法因为能更好的模拟自然语言特征,在低速率上能合成较高质量的语音,而成为现代低速率语音编码中最有潜力的算法之一。-In the speech coding algorithm, the mixed excitation linear prediction (MELP) algorithm because it can better simulate the natural language features can be synthesized at
  3. 所属分类:Speech/Voice recognition/combine

    • 发布日期:2017-04-10
    • 文件大小:1.32mb
    • 提供者:杨亚欣
  1. speech-emotion-recognition-system

    1下载:
  2. gmm模型下的语音情感识别系统,GMM只是一个数学模型,只是对数据形态的拟和,但是和你所看到的数据分布存在出入也是正常的,因为用EM估计GMM的那些参数时,一般假设我们所得到的数据是不完备的(也就是说假设我们看到的数据分布不是真正的分布,它在运算时把那部分丢失或者叫隐藏的数据“补”上了)-gmm model speech emotion recognition system, GMM is a mathematical model, but fitting the data form, but
  3. 所属分类:Speech/Voice recognition/combine

    • 发布日期:2017-03-23
    • 文件大小:11.26kb
    • 提供者:张忠顺
  1. EVRC_B_fl_v1.5_20061102

    0下载:
  2. 这是EVRC(增强型语音编码)的C程序,我认为很有用的,希望能帮助需要的人。因为我也需要他人的帮助-this is a C program of EVRC (enhanced speech coding),I think it is useful for someone ,I hope to help people who need help because I need other s help too.
  3. 所属分类:Speech/Voice recognition/combine

    • 发布日期:2017-05-10
    • 文件大小:2.12mb
    • 提供者:李伊
  1. SR_speechrecognition

    1下载:
  2. 微软语音识别分两种模式:文本识别模式和命令识别模式.此两种模式的主要区别,主要在于识别过程中使用的匹配字典不同.前者使用的是通用字典,特点是内容多,覆盖的词汇量大,字典由sdk提供.适用于没有预定目标的随机听写之类的应用.同时因为词汇量大直接导致识别的精度降低,识别速度较慢.后者的字典需要 开发者自己编写,就是你们所说的xml文件.通过SR引擎读取xml实现特定词识别-Microsoft speech recognition points two modes: text recognition
  3. 所属分类:Speech/Voice recognition/combine

    • 发布日期:2017-04-09
    • 文件大小:1.96mb
    • 提供者:mr chen
  1. wav_FFT_demo

    2下载:
  2. 快速傅氏变换(FFT),允许用户查看的音频信号的频谱内容。 FFT这里给出的代码是由唐交叉出现,他的主页,随后被撤下。而不是解释的FFT的数学理论,我将试图解释它的用处,因为它涉及到的音频信号。 FFT允许用户获得的音频信号的频谱构成,获得它的各种频率的分贝,或获得其各种频率的强度。光谱观众(在上面的图片所示),均衡器,或VU表可以使用FFT,以显示其结果。它们之间的差值,然后取决于一对夫妇方程采取的FFT的实部和虚部的组件,并返回的强度或分贝水平被用于在绘制结果中的一个。下面的代
  3. 所属分类:语音合成与识别

    • 发布日期:2014-03-20
    • 文件大小:33.89kb
    • 提供者:dcc
  1. MSP_Python

    0下载:
  2. 讯飞云语音的Python实现 只是简单的用Python调用dll,自己用着觉得还不错,分享给大家。 双击test.bat就可以实现对wav_test.wav的识别,这个wav是sdk demmo中的123456789的那个。 其它语音文件的话,可以仿照test文件自己写一个。 双击test2.bat可以识别麦克风的输入。这个需要pyaudio的支持。 我是在win7的CMD下运行正常,但是xp的CMD可能会乱码~~~因为日志输出的是unicode编码的
  3. 所属分类:Speech/Voice recognition/combine

    • 发布日期:2017-03-29
    • 文件大小:670.32kb
    • 提供者:harry
  1. sphinx3-0.4.1

    0下载:
  2. sphinx系统是一个拥有悠久历史的语音识别系统,李开复自称第一个sphinx是他写的。 传说 中是第一个实用的10数字语音系统。 是由卡奈基.美隆大学研发。 sphinx3.x是基于C语言的最新版本,sphinx和 sphinx2请大家不要去研究了。 sphinx for ppc是一个在PocketPc上实现的嵌入式语音识别系统。 而 sphinx4是完全用JAVA编写实现的语音识别系统, 因为JAVA的特性,在平台间移植
  3. 所属分类:Speech/Voice recognition/combine

    • 发布日期:2017-06-10
    • 文件大小:17mb
    • 提供者:hw
  1. 02_i-vector_system_with_ALIZE3.0.tar

    1下载:
  2. 为了更好地理解说话人确认和ALIZE工具的基础知识,我们推荐仔细阅读i-vector教程,因为它也包含functionnalities 这不是在其他部分描述的,也可以是有用的。 该程序包括基于ALZIE的i向量的说话人识别的指导步骤。-For a better understanding of the basics of speaker verification and the ALIZE toolkit, we recommand to read the i-vector tuto
  3. 所属分类:Speech/Voice recognition/combine

    • 发布日期:2017-05-16
    • 文件大小:4.2mb
    • 提供者:
  1. SAM-master

    1下载:
  2. Sam是一个用C编写的非常小的文本到语音(TTS)程序,运行在大多数流行的平台上。它是由Don't Ask software(现为SoftVoice,Inc.)于1982年出版的Commodore C64语音软件SAM(软件自动嘴)的C语言改编而成。它包括一个称为背诵器的文本到音素转换器和一个用于最终输出的音素到语音例程。它是如此的小,以至于它也可以在嵌入式计算机上工作。在我的电脑上,它占用的磁盘空间不到39KB(在嵌入式设备上要小得多,因为不需要执行开销),而且是一个完全独立的程序。为了立即输
  3. 所属分类:语音合成

    • 发布日期:2020-10-05
    • 文件大小:54kb
    • 提供者:fa_Q
搜珍网 www.dssz.com