搜索资源列表
SR_speechrecognition
- 微软语音识别分两种模式:文本识别模式和命令识别模式.此两种模式的主要区别,主要在于识别过程中使用的匹配字典不同.前者使用的是通用字典,特点是内容多,覆盖的词汇量大,字典由sdk提供.适用于没有预定目标的随机听写之类的应用.同时因为词汇量大直接导致识别的精度降低,识别速度较慢.后者的字典需要 开发者自己编写,就是你们所说的xml文件.通过SR引擎读取xml实现特定词识别-Microsoft speech recognition points two modes: text recognition
9178839
- 汉语分词算法,包含最大匹配和基于概率的分词算法()
znmhss_1.0
- 早在N年前就有网友问过:类似百度的站内模糊搜索怎样才能实现?最近工作需要,做了一个asp站内搜索。要求完全匹配的关键词要排在前面,关键词要模糊匹配。在网上搜了半天没有找到需要的代码,只好自己编写,现在分享给有需要的人。 功能介绍: 1、利用分词技术,先把关键词拆分为多个词组。如:“搜索炼药师”,拆分为:“搜索”、“索炼”、“炼药”、“药师”等多个词组。 2、如:数据库标题字段完全匹配“搜索炼药师”的排在前面,数据库标题字段模糊匹配“搜索”、“索炼”、“炼药”、“药师”等多个词组的分别在
128083
- 汉语分词算法,包含最大匹配和基于概率的分词算法()
合工大自然语言处理报告代码
- 四、中文词法分析系统 1、实验要求 语料库:1998-01-2003版-带音.txt 要求:根据构建的单词词典和双词词典,用n-gram模型,或者前向最长匹配,或者后向最长匹配等算法,鼓励用更复杂一些的方法来进行,包括隐马尔科夫模型和条件随机场模型。 二、宋词自动生成 1、实验要求 语料库:ci.txt 要求:输入词牌,基于宋词的词典和宋词的词牌,可以随机或者按照语言模型,自动生成宋词。设计相应的Ui或者Web界面。 实现了隐马尔科夫模型分词