搜索资源列表
WAVE文件格式剖析
- WAVE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个字节便是“RIFF”。WAVE文件由文件头和数据体两大部分组成。其中文件头又分为RIFF/WAV文件标识段和声音数据格式说明段两部分。WAVE文件各部分内容及格式见附表。-WAVE as a multimedia documents used in the acoustic format, it is based
traditionalsp
- 语音信号的频域处理,语音虽然是一个时变、非平稳的随机过程。但在短时间内可近似看作是平稳的。因此如果能从带噪语音的短时谱中估计出“纯净”语音的短时谱,即可达到语音增强的目的。由于噪声也是随机过程,因此这种估计只能建立在统计模型基础上。利用人耳感知对语音频谱分量的相位不敏感的特性,这类语音增强算法主要针对短时谱的幅度估计。 -voice signals in the frequency domain processing, voice is a time-varying, nonstationa
TextSeparter
- 将文本按照标点符号分开的程序源码,可以把分开后的源码分开保存到文本文件中.为方便语音识别软件的制作而开发.-punctuation separate proceedings source, can be separated from the source to maintain separate text file. For the convenience of voice recognition software production and development.
speech classification
- 这是一个以HMM为基础的语音训练模形源码从中可以了解HMM如何做参数撷取及如何辨识-this is a HMM-based voice training from the source pattern HMM can understand how to do and how to capture parameter identification
接收机的MATLAB仿真程序
- Title: MMSE Receiver for DS-SS in AWGN Channel Author: Panson Tantikovit Summary: An adaptive receiver for DS-SS systems MATLAB Release: R12.1 Required Products: Communications Toolbox,Signal Processing Blockset Descr iption: This
Shoot_Voice
- 开发语言:VB6 + TTS 5.1 作者:shootsoft@yahoo.com.cn 方式:开源 大小:213K 转载请注明出自www.shootsoft.net-development languages : VB6 + TTS 5.1 Author : shootsoft@yahoo.com.cn ways : revenue Size : 213K Please specify reproduced from www.shootsoft.net
voice464
- 基于dtw算法的语音识别 1 ENFRAME.M和MELBANKM.M取自voicebox工具箱 2 vad.m实现端点检测 3 mfcc.m计算mfcc参数 4 dtw.m实现DTW算法[训练] dtw2.m实现DTW高效算法 5 testdtw.m测试程序-based speech recognition algorithm and a ENFRAME.M MELBANKM.M from v oicebox Toolbox 2 vad.m ach
speech20040601
- 我的毕业设计,vc++的语音识别的简单程序。-I graduated from the design, voice recognition vc the simple procedure.
gaborvoicerecognition
- 使用gabor变换作语音识别,下载自剑桥的实验室的网站,有兴趣的可以去网站上找资料-used for voice recognition, Cambridge downloaded from the website of the laboratory, interested parties can go to find information on the web site
ica_C
- 在linux平台下,纯c写的盲信号分离的代码.它采用基于卷积混合的盲信号分离算法,不但可以分离人工合成的混合信号,而且对于真实环境中的卷积混合的语音信号也能够分离.在本程序中,包含了两个测试文件,makefile后便可以直接使用. 另外值得一提的是,压缩包里包含有一些语音处理方面的常用函数.例如fft变换,读取\\写入wav文件,以及一些常用的一维向量和二维矩阵变换的函数.这些可以直接应用在其他应用程序里去.-in linux platform, net write c Blind Si
SR3
- 基于倒谱特征的说话人识别技术 提取语音的倒谱特征进行说话人识别-based Cepstral Speaker voice recognition technology from the Cepstral for Speaker Recognition
yuyincompare
- 语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一 语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。-voice recognition technology from 2000 to 2010 among the field of information technology in 10 major technol
dsp1.1
- LMS算法,从宽带信号中提取单频信号的算法,方法简单易行-LMS algorithm, broadband signal from the single-frequency signal extraction algorithm is simple
yycl
- 提取语音信号的lpc参数并进行时间归整,需要将wav语音文件放在指定目录下‘e:\\yyzl’-voice signal from the lpc parameters and time consolidation, need to wav sound files on the specified directory 'e : \\ yyzl'
yuyinshibiedsp
- 用DSP实现的一个简单的语音识别系统,只要实现单个词的识别即可,采样率8k,帧长30ms,帧移10ms,系统采样后分帧--端点检测,将检测到的原始语音信号保存下来,基本上一个字在30帧左右,然后提取每帧的LPC参数--将LPC参数转换为LPC倒谱系数,然后利用DTW方法和模板比较.-a brief speech recognition system, as long as the realization of a single word can be identified. 8 k sampli
pitch_detect
- 语音信号的基音提取对于语音编码,识别都十分重要,该程序用于提取语音信号的基音-voice signal from the pitch for speech coding, identification is important, The procedure used to extract the speech signal Pitch
CorrelogramFrame
- Compute one frame of a correlogram. The input data is a two-dimensional array of cochlear data, each row representing firing probabilities from one cochlear channel. The output picture is a two dimensional array of width \"picWidth\".-Compute
linjiedai
- 语音的短时谱的临界带特征矢量,从人耳对频率高低的非线性心理感觉角度反映了语音短时谱的特征.-voice spectrum with the critical feature vector, From ear to the level of the nonlinear frequency psychological sense approach reflects the short-term speech spectrum characteristics.
345636323
- 一套指纹识别VC++环境下的源码,我从网上找的供大家学习参考-a fingerprint identification VC environment of the source code, I find from the Internet for all to study reference
HTK3.4forWindows
- HTK3.4是由英国剑桥大学2006年12月推出的最新版本HMM Toolkit, 是世界上流传最广的强大的语音识别的开放源码。如果你遇到什么问题欢迎来http://asr.blog.hexun.com/留言。我们乐于讨论语音识别以及其他模式识别问题。-HTK3.4 from the University of Cambridge, England in December 2006 launched the latest version of HMM Tool kit, is the world