录音标注新手入门手册

上传人:莉**** 文档编号:240145262 上传时间:2024-03-19 格式:PPTX 页数:27 大小:2.41MB
返回 下载 相关 举报
录音标注新手入门手册_第1页
第1页 / 共27页
录音标注新手入门手册_第2页
第2页 / 共27页
录音标注新手入门手册_第3页
第3页 / 共27页
点击查看更多>>
资源描述
会计学1录音标注新手入门手册录音标注新手入门手册培训流程培训流程项目概况说明项目概况说明1 1软件操作讲解软件操作讲解2 2标注规范讲解标注规范讲解3 3质检验收标准讲解质检验收标准讲解4 4第1页/共27页3项目概况说明项目概况说明uu项目名称:项目名称:录音数据标注项目录音数据标注项目uu项目结果应用领域:项目结果应用领域:语音识别技术语音识别技术uu应用目的:应用目的:提高语音识别引擎的识别率,即提高语音识别结果的准确率。提高语音识别引擎的识别率,即提高语音识别结果的准确率。uu技术应用:技术应用:1 1、呼叫中心自动质检(可以对通话记录进行自动质检,以减少人工质检)、呼叫中心自动质检(可以对通话记录进行自动质检,以减少人工质检)2 2、语音自动转文字;如微信对用户的语音进行了标注,则实现了语音转文字、语音自动转文字;如微信对用户的语音进行了标注,则实现了语音转文字的功能;类似的应用有:百度语音助手、苹果的功能;类似的应用有:百度语音助手、苹果sirisiri等;等;3 3、其他的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简、其他的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等单的听写数据录入等第2页/共27页标注软件操作标注软件操作讲解讲解一、打开软件一、打开软件二、导入录音文件二、导入录音文件1 1、上传录音、上传录音第3页/共27页标注软件操作标注软件操作讲解讲解2 2、生成、生成textgridtextgrid文件进行标注文件进行标注第4页/共27页三、常用操作指令三、常用操作指令播放播放/暂停:暂停:TabTab键键放大放大/缩小:界面左下角:缩小:界面左下角:all all 全屏显示;全屏显示;in in 逐步放大;逐步放大;outout逐步缩小;逐步缩小;sel sel 选中选中部分全屏显示部分全屏显示选中音频:在语音波形上拖动鼠标选中音频:在语音波形上拖动鼠标拖动音频:拖动标注界面最下的滑动条拖动音频:拖动标注界面最下的滑动条生成切割线:在语音波形上用鼠标点击需切割处,即出现一条红色虚线,同时该生成切割线:在语音波形上用鼠标点击需切割处,即出现一条红色虚线,同时该红色虚线与每个标注层的相交处有一个空心圆圈。点击空心圆圈,即可生成切割红色虚线与每个标注层的相交处有一个空心圆圈。点击空心圆圈,即可生成切割线。(快捷键:线。(快捷键:EnterEnter)移动切割线:鼠标点住要移动的切割线,左右拖动。移动切割线:鼠标点住要移动的切割线,左右拖动。标注软件操作标注软件操作讲解讲解第5页/共27页标注软件操作标注软件操作讲解讲解删除切割线:删除切割线:1 1、快捷键、快捷键Alt+BackspaceAlt+Backspace 2 2、点击界面左上顶部、点击界面左上顶部“BoundaryBoundary”选项选项-选择选择Remove,Remove,即可删除。即可删除。保存:保存:Ctrl+SCtrl+S查看秒数:在标注层下面,滑动条上面,有三个显示依次为:每个切割片切割秒查看秒数:在标注层下面,滑动条上面,有三个显示依次为:每个切割片切割秒数、屏显秒数、整条音频秒数数、屏显秒数、整条音频秒数做完之后删除记录:选中文件之后,点击左下角的做完之后删除记录:选中文件之后,点击左下角的RemoveRemove第6页/共27页标注规范讲解标注规范讲解一、语音文件分类一、语音文件分类按语音质量,把语音文件分为两大类:一类为训练语音;另一类为非训练语按语音质量,把语音文件分为两大类:一类为训练语音;另一类为非训练语音。(本项目只标注训练语音,非训练语音不标注)音。(本项目只标注训练语音,非训练语音不标注)非训练语音识别条件非训练语音识别条件文件大小方面:文件大小方面:文件大小为文件大小为200KB200KB以下的语音;(时长过短,未形成对话的语音)以下的语音;(时长过短,未形成对话的语音)噪音方面:噪音方面:整段语音伴有严重的持续背景噪音的语音;(背景音如严重电流声、整段语音伴有严重的持续背景噪音的语音;(背景音如严重电流声、风声和干扰声等)风声和干扰声等)文本方面:文本方面:不能听懂的方言类语音,如某些南方方言等;经常性听不清,不能准不能听懂的方言类语音,如某些南方方言等;经常性听不清,不能准确写出文本的语音;无贡献文本的语音(如:文本只有确写出文本的语音;无贡献文本的语音(如:文本只有“喂,你好喂,你好”这几个字的语音)这几个字的语音);整段语音中;整段语音中50%50%以上文本为脏话的语音。以上文本为脏话的语音。其他方面:其他方面:回声大的语音(听觉上出现双字的语音);过载严重的语音(音量过回声大的语音(听觉上出现双字的语音);过载严重的语音(音量过大导致截幅严重的语音,这里指全段语音的每字都严重截幅的语音;稍微截幅的要算大导致截幅严重的语音,这里指全段语音的每字都严重截幅的语音;稍微截幅的要算作训练语音中标注)。作训练语音中标注)。第7页/共27页标注规范讲解标注规范讲解二、标注层级二、标注层级第8页/共27页图片案例图片案例第9页/共27页标注规范讲解标注规范讲解三、标注规范细则三、标注规范细则第10页/共27页图片案例图片案例第11页/共27页标注规范讲解标注规范讲解第12页/共27页图片案例图片案例第13页/共27页标注规范讲解标注规范讲解第14页/共27页图片案例图片案例 第15页/共27页标注规范讲解标注规范讲解第16页/共27页图片案例图片案例第17页/共27页标注规范讲解标注规范讲解第18页/共27页图片案例图片案例 第19页/共27页标注规范讲解标注规范讲解第20页/共27页图片案例图片案例 第21页/共27页标注规范讲解标注规范讲解第22页/共27页图片案例图片案例 第23页/共27页标注规范讲解标注规范讲解1标注规范中出现的所有符号为英文半角符号,标识必须为大写字母。标注规范中出现的所有符号为英文半角符号,标识必须为大写字母。3标注结束后,保存标注信息文件时,请确保标注的标注结束后,保存标注信息文件时,请确保标注的textgridtextgrid文件与当前的文件与当前的wavwav语音文件所在路径保持一致。语音文件所在路径保持一致。2不能出现标点符号,切割时以语义完整的一句话为一个片段,句末不加标点。规则中要求标注的符号除外。不能出现标点符号,切割时以语义完整的一句话为一个片段,句末不加标点。规则中要求标注的符号除外。四、注意事项四、注意事项第24页/共27页质检验收标准质检验收标准讲解讲解1 1、正确率、正确率96%96%2 2、质检验收标准细则、质检验收标准细则验验收收标标准准文本有误(多字少字错字)主说话人的大段文本未标注(漏标、大段标成听不清)听不清的未单独切段;说话人角色、性别、身份有误噪音标识有误(错标、漏标)切割线位置不准;同一人说话时长10S以上的未分段符号未半角,标识未大写两人同时说话情况未用|分隔,或上下层顺序不一致第25页/共27页LOGO第26页/共27页
展开阅读全文
相关资源
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!