当前位置: 首页 > news >正文

浅谈政府门户网站建设/全媒体广告代理加盟靠谱吗

浅谈政府门户网站建设,全媒体广告代理加盟靠谱吗,wordpress在线制作,wordpress后台无法打开用 kaldi 和 CVTE开源模型 实现语音识别 文章目录用 kaldi 和 CVTE开源模型 实现语音识别下载模型使用测试自己的数据集准备文件0. 音频文件1. wav.scpwav.scp 格式2. utt2spkutt2spk 格式3. spk2uttspk2utt 格式测试:下载模型 CVTE开源了kaldi的中文模型&#xff…

用 kaldi 和 CVTE开源模型 实现语音识别

文章目录

  • 用 kaldi 和 CVTE开源模型 实现语音识别
    • 下载模型
    • 使用
    • 测试自己的数据集
      • 准备文件
        • 0. 音频文件
        • 1. wav.scp
          • wav.scp 格式
        • 2. utt2spk
          • utt2spk 格式
        • 3. spk2utt
          • spk2utt 格式
      • 测试:

下载模型

CVTE开源了kaldi的中文模型,
模型下载地址: http://kaldi-asr.org/models/0002_cvte_chain_model.tar.gz
解压放到kaldi/egs/下

使用

egs/wsj/s5中的steps和utils拷贝到egs/cvte/s5目录下:
egs/hkust/s5/local/score.sh拷贝到egs/cvte/s5/local目录下:

cp -r egs/wsj/s5/steps egs/cvte/s5/steps
cp -r egs/wsj/s5/utils egs/cvte/s5/utils
cp egs/hkust/s5/local/score.sh egs/cvte/s5/local

注释掉utils/lang/check_phones_compatible.sh中if语句中的exit 1:

 36 # check if the files exist or not37 if [ ! -f $table_first ]; then38   if [ ! -f $table_second ]; then39     echo "$0: Error! Both of the two phones-symbol tables are absent."40     echo "Please check your command"41     #exit 1;42   else43     # The phones-symbol-table1 is absent. The model directory maybe created by old script.44     # For back compatibility, this script exits silently with status 0.45     exit 0;46   fi

然后执行./run.sh就可以了

测试自己的数据集

准备文件

0. 音频文件

要求是16-bit位深,采样率16000Hz,单声道,wav格式的语言文件

1. wav.scp

在这里插入图片描述

wav.scp 格式
音频id 音频位置

如下:

AUDIO_20211129_170900_0000    ./audio/2021_11_29_17.09.00_0000.wav
AUDIO_20211129_170901_0000    ./audio/2021_11_29_17.09.01_0000.wav
AUDIO_20211129_170902_0000    ./audio/2021_11_29_17.09.02_0000.wav
AUDIO_20211129_170903_0000    ./audio/2021_11_29_17.09.03_0000.wav
AUDIO_20211129_170904_0000    ./audio/2021_11_29_17.09.04_0000.wav
AUDIO_20211129_170905_0000    ./audio/2021_11_29_17.09.05_0000.wav
AUDIO_20211129_170906_0000    ./audio/2021_11_29_17.09.06_0000.wav
AUDIO_20211129_170907_0000    ./audio/2021_11_29_17.09.07_0000.wav
AUDIO_20211129_170908_0000    ./audio/2021_11_29_17.09.08_0000.wav
AUDIO_20211129_170909_0000    ./audio/2021_11_29_17.09.09_0000.wav
AUDIO_20211129_170910_0000    ./audio/2021_11_29_17.09.10_0000.wav
AUDIO_20211129_170911_0000    ./audio/2021_11_29_17.09.11_0000.wav
AUDIO_20211129_170912_0000    ./audio/2021_11_29_17.09.12_0000.wav
AUDIO_20211129_170913_0000    ./audio/2021_11_29_17.09.13_0000.wav
AUDIO_20211129_170914_0000    ./audio/2021_11_29_17.09.14_0000.wav

2. utt2spk

音频ID
说话人ID
音频ID最好含有说话人ID

由于本例没有说话人,所以用音频ID代替说话人,即每条音频都是一个独立的说话人

utt2spk 格式
音频ID1 说话人1
音频ID2 说话人2

如下:

AUDIO_20211129_170900_0000    AUDIO_20211129_170900_0000
AUDIO_20211129_170901_0000    AUDIO_20211129_170901_0000
AUDIO_20211129_170902_0000    AUDIO_20211129_170902_0000
AUDIO_20211129_170903_0000    AUDIO_20211129_170903_0000
AUDIO_20211129_170904_0000    AUDIO_20211129_170904_0000
AUDIO_20211129_170905_0000    AUDIO_20211129_170905_0000
AUDIO_20211129_170906_0000    AUDIO_20211129_170906_0000
AUDIO_20211129_170907_0000    AUDIO_20211129_170907_0000
AUDIO_20211129_170908_0000    AUDIO_20211129_170908_0000
AUDIO_20211129_170909_0000    AUDIO_20211129_170909_0000
AUDIO_20211129_170910_0000    AUDIO_20211129_170910_0000
AUDIO_20211129_170911_0000    AUDIO_20211129_170911_0000
AUDIO_20211129_170912_0000    AUDIO_20211129_170912_0000
AUDIO_20211129_170913_0000    AUDIO_20211129_170913_0000
AUDIO_20211129_170914_0000    AUDIO_20211129_170914_0000

3. spk2utt

spk2utt 格式
说话人1 音频 音频 音频
说话人2 音频 音频 音频

有几个说话人就是几行,中间用空格隔开
如下:

AUDIO_20211129_170900_0000    AUDIO_20211129_170900_0000
AUDIO_20211129_170901_0000    AUDIO_20211129_170901_0000
AUDIO_20211129_170902_0000    AUDIO_20211129_170902_0000
AUDIO_20211129_170903_0000    AUDIO_20211129_170903_0000
AUDIO_20211129_170904_0000    AUDIO_20211129_170904_0000
AUDIO_20211129_170905_0000    AUDIO_20211129_170905_0000
AUDIO_20211129_170906_0000    AUDIO_20211129_170906_0000
AUDIO_20211129_170907_0000    AUDIO_20211129_170907_0000
AUDIO_20211129_170908_0000    AUDIO_20211129_170908_0000
AUDIO_20211129_170909_0000    AUDIO_20211129_170909_0000
AUDIO_20211129_170910_0000    AUDIO_20211129_170910_0000
AUDIO_20211129_170911_0000    AUDIO_20211129_170911_0000
AUDIO_20211129_170912_0000    AUDIO_20211129_170912_0000
AUDIO_20211129_170913_0000    AUDIO_20211129_170913_0000
AUDIO_20211129_170914_0000    AUDIO_20211129_170914_0000

测试:

替换data/fbank/test/ 下同名文件在 执行./run.sh就可以了

在这里插入图片描述
可见 准确率还是比较高的

http://www.jmfq.cn/news/4797109.html

相关文章:

  • wordpress最好用的编辑器/搜索引擎优化论文
  • 阿里巴巴网站建设的背景/武汉网站seo公司
  • hishop/济南seo整站优化价格
  • 韩国明星都在那个网站做直播/seo综合查询爱站
  • 北京知名的网站建设公司/市场营销教材电子版
  • 建设厅查询网站/sem竞价托管多少钱
  • 动漫做那个视频网站/女生学市场营销好吗
  • 建一个购物网站需要什么条件/什么是百度指数
  • 网站赌博代理怎么做/网络推广公司深圳
  • 直播类型网站开发/新站seo竞价
  • 快手作品推广网站/常州网站建设制作
  • 南通企业网页制作/百度seo关键词排名s
  • jsp网站购买空间/站长工具服务器查询
  • 上海宝山区网站建设/安卓优化大师app下载安装
  • 网站建设尚品/免费b站推广网站2023
  • 做网站被骗怎么办/免费平台
  • 学校语言文字网站建设/推广公司品牌
  • 做ppt会去什么网站找图/淘客推广
  • 做阿里巴巴网站需要多少钱/搜索引擎优化是什么
  • 公司网站制作效果/网站优化检测
  • 做网站用什么语言制作最安全/热门网站
  • 网络域名ip查询/aso应用商店优化
  • 学php网站开发好吗/网站开发的流程
  • 广州 深圳 外贸网站建设/网络营销推广策划案例
  • 邵阳邵东网站建设/小说网站排名前十
  • 企业宣传网站案例/优化大师好用吗
  • 网站建设走无形资产/完整企业网站模板
  • 怎么在云主机上做网站/北京seo公司司
  • 怎么做私服发布网站/怎么做个人网页
  • 网站设计维护合同/免费seo视频教程