1 问题描述 这两天复现代码。先构造数据集,纯净语音、不同噪声、不同SNR的混合语音。其中纯净语音由两部分组成,IEEE corpus和TIMIT。 一开始我用MATLAB中的audioread读取音频文件,合成后用audiowrite保存下来。没有任何问题。 后来,师姐让我换成python ...
最近在背单词,为了能提高效率,找到一个比较有名的 美国当代英语语料库COCA词频 来源应该是:http: www.wordfrequency.info ,当然是收费的。 免费的可以在这里下载pdf文件:http: vdisk.weibo.com s ctvvyfhPYLfj 由于是pdf文件,且包含大量其他不太有用的信息,就想到提纯。 花了半小时写了个小程序,对pdf文件进行提炼。 这个下载htt ...
2017-04-01 17:50 0 15161 推荐指数:
1 问题描述 这两天复现代码。先构造数据集,纯净语音、不同噪声、不同SNR的混合语音。其中纯净语音由两部分组成,IEEE corpus和TIMIT。 一开始我用MATLAB中的audioread读取音频文件,合成后用audiowrite保存下来。没有任何问题。 后来,师姐让我换成python ...
中国自然语言开源组织:http://www.nlpcn.org/ (一) 国家语委 1国家语委现代汉语语料库http://www.cncorpus.org/ 现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语语料库在线 ...
语料库:是我们要分析的所有文档的集合 使用搜狗实验室提供的语料库,里面有一个classlist,里面内容是文件的编号及分类名称 1、导入模块 使用os.walk传入这个目录作为参数,遍历该文件夹下的全部文件,该方法返回一个Truple的数组,第一个root是文件所在目录 ...
:nltk.corpus.words.words() 词汇语料库是Unix 中的/usr/dict/words 文件,被一些拼写检查程序使用。下面这 ...
最近收到很多要语料的,我把关于这个的都放在百度云盘了。链接: https://pan.baidu.com/s/1tZj8MDiPfCT2SYBvClQbew 提取码: krbd ;大家有需要就从里面找吧!不零碎得回复大家了。 我的天,清明节三天假期,我竟然除了逛街闲游,只做了一件事 ...
Python NLTK库中包含着大量的语料库,但是大部分都是英文,不过有一个Sinica(中央研究院)提供的繁体中文语料库,值得我们注意。 在使用这个语料库之前,我们首先要检查一下是否已经安装了这个语料库。 >>>import nltk >>> ...
语言环境 学习英语大家都说需要语言环境。其实每个人只要愿意都可以有自己的英语环境,简单一个:英语电影。另一个难点是不是记忆单词呢?起码我是。为此我报了一些英语的学习班,花了万把元钱吧。现在总算有点起色了。也正因此又爱看英语电影了。所以我的英语的学习就是词根背单词+英语电影。 APP收词 ...
常用2万英语单词中,各种长度英文单词数量统计 单词长度 单词数量18 - 216 - 215 - 514 - 3313 - 9912 - 15011 - 30610 - 5199 - 6788 - 8877 - 10386 - 10645 - 9684 - 8293 - 2872 - 371 ...