语音标注兼职规范
无效性别
混音例如:重叠部分是:“的话”与“我说”,留哪个主体?双击小喇叭
例句,A:您好,很高兴为您服务。B:喂,你好。
2)B的“你好”音量明显覆盖住了A的“服务”。标注文本应为:您好很高兴为您,你好
2、半混音情况:
1)A 整句与B “喂”全混,与B “你好“不混。标注文本应为:您好很高兴为您服务,你好
2)A 整句与B “喂”全混+不混的明显大噪音/听不清的人声+与B “你好”不混。标注文本应为:您
3)A 整句与B“喂”全混+与A 混的明显大噪音(能听清A 说的啥)+与B“你好”不混。标注文本应为
4)A 整句与B“喂”全混+与A 混的明显大噪音(不能听清A 说的“服务”)+与B“你好”不混。标注文1、全混音情况: AB完全相混,只写出主体人,即写:其中(说话多,声音大的,说的清楚的
1) 标注文本应为A的全话:您好很高兴为您服务。
*我们验收就是按照6.5个格左右全可以算无效,不到6.5个格的必须都写出来,
2、 英语文本之外整句都是听不懂的英文,也算无效。PS:如果有能听懂的要写出文本,听不
3、经过电脑处理过后的那种很快的机器声,怪音,快的听不出来说的啥,可以标为无效。整句无人声,或乱乱的小声说话,分不出性别的,文本写#,性别标其他,(注意不
1、不管发出什么声音,只要能确定性别的都需要写出来,
整句出现:男+女=其他 关于童声,严禁出现标童声的情况
2、男女音量相混,即使文本只写了男声的,但性别必须选其他。PS:性别以自己听到的为准
2)人声前/中/后,出现持续的2秒6.5个格的非人声噪音或静音,PS:严格要求一丁点人声 必须同时满足以上两个条件才算无效。
语音标注规范(三项)及常见问
语音标注招聘要求:有电脑,有时间,有耐心,不限地区。符合条件的请关注微信公众号:w
1.到底哪种情况为无效语音?无效语音,直接打勾,文本不用修改。
1)整句必须有人声出现。PS:铃声、叮声、打喷嚏,咳嗽,呼吸、笑声、扑话筒
口音标#文本书写规定10、口语,啊,呀,哦,奥,额等,您和你,就是和就,等分不清,发音较近的,任意写。(
11、文本和声音一致,以声音为准改文本。不能出现多字、少字、错字
14、文本标点符号不做要求,可写可不写
12、符号情况,如#,*,-,.等符号,按照发音写,应写为:井,星,杠,点
13、回音情况:前者回音与后者混,忽略,写后者说的。前者回音与后者不混,能听清写字,
2、发音为儿化音的,“儿”不要写。固有名词如女儿,婴儿,儿子,“儿”必须要写
3、单词发音小写(wifi,Iphone);字母发音大写(OK,I,MSN,CMCC,QQ);一半
4、半音即声母和韵母只发了其中一个,没发音完全的。听清说什么字就写出来,听不清不用
5、结巴的,如:我我我我,说几个写几个,如果是说太快,连着了,可以大概写几个
6、歌词,听清唱啥写啥,听不清标#。如果歌词前后伴有音乐,需要前后各标一个#
7、姓名,姓必须写对,名只要音对就可以。地名,能查到的正确写出来,查不到的音对即可
8、不是口音问题,而是发错音的,比如“水浒”,jiao,如果读的 xu,,就要写成说错的字
9、规范文本要求写成简体字,英文单词要求输入法半角书写
4、听不懂的方言或除英语外的其它国语言,写为#。
5、不是正常人的说话,象机器人或语音合成的声音;或录的电视里的播音;声音被 听得清楚的部分写成文本,听不清楚的部分写为#.
6、发音出现拼音而不是英文时,如:a1 bo1 ci1 de1,不能写成:a b c d,应写#。
7、笑/哭着说的,能听清楚写文字,听不清楚写#。
8、笑声,哼哼声等,能写出字的写字,写不出的标#
答案:就是说您这边如果要把儿童票订成大人票,我说
3、 如果说话人其中一个人拉长音,导致重叠半个字的,文本都要写出来
文本标注核心:听清写字,不清写#
1、阿拉伯数字一定要写出汉字的形式,特别注意发音为“一”写一,为“幺”写幺
1、人声中出现突然间的大噪音且与人声不相混,包括铃声、叮声、咳嗽、呼吸、笑声、扑话
2、人声前边或后面出现一片听不清的乱乱的小声说话且与人声不混,写#和不写#都可以。 PS:人声背后持续的背景噪声,忽略
3、整句无人声,或乱乱的小声说话,分不出性别的,文本写#,性别标其他,(注意不是无效
例如这句话就要写:哦 另外有一个赠送您的
波形6、修改信息/修改密码:此处可以修改个人信息/个人密码。(领到个人账号后,请先修改个
口音
光标条软件说明
系统说明2、将验收详情里面标有wrong 的,前面的句号,复制粘贴到标注界面下面的句号跳转里,回车
3、只有一次修改机会,先改判错的2个,再仔细检查其余未抽检的剩余句号,再提交验收
验收修改流程 delete 代表无效录音
sex 代表性别
text 代表文本
5、白底:抽查你做的文本。绿底:抽查你标无效的句子。
4、验收详情里
no 代表每个数据账号中的句子号;
4、统计信息:可以看到通过次数,百分比,原始录音时长,验收详情。(看自己错在哪里,
5、验收统计:可以查看处于验收检查中的任务一验结果(仅供参考)。抽检中为二验正在验
7、关于提交:由于系统长时间操作,有时你点提交就会自动退出让你重新登录。这时,重新
1、打开两个浏览窗口,一个处在标注界面,一个处在统计信息里面的验收详情界面。
2、教学视频如果无法观看,请下载暴风影音。
3、领取任务流程:选择批次-设为当前批次-领取新任务-确认,(系统会比较慢,等待。)
2、验收中:标注中的任务进行提交后,就会跳到验收中进行显示。(抽查你所做句数的25%,
3、所有任务:处在所有状态的任务均在此处显示
1)领取的新任务 2)提交一次,验收被打回的。(后面有验收时间)4、领取完新任务后,需要先安装V2008运行库。(详见《新人必读》)1、标注中:2) 选中功能。选中的是播放蓝条最左端到黄条最右端的声音。当语速特别快时,建议分段选
3) 确定#在哪儿出现。
波形一般都是一个枣核一个枣核的,一个枣核一般代表一个字词,结巴的时候可以
1、文本规范为PDF格式,需要下载PDF阅读器。(详见《新人必读》)
如不确认是哪个字词不清楚或混音,请用蓝条和黄条选中进一步确认。蓝条和黄条的功能有 3 个1) 尺子,不管宽窄都表示 0.3 秒,可以用于量取 2 秒判断无效。
蓝:应该这样标的红:特别注意的
叭
您好很高兴为您,你好
高兴为您服务,你好
好”不混。标注文本应为:您好很高兴为您服务#你好
你好”不混。标注文本应为:您好很高兴为您服务,你好
)+与B“你好”不混。标注文本应为:您好很高兴为您#你好
,声音大的,说的清楚的)那个人的话。
须都写出来,
能听懂的要写出文本,听不懂的标# 群文件有文本
的啥,可以标为无效。
注意不是无效哦)
:性别以自己听到的为准,和你写谁的文本没关系
PS:严格要求一丁点人声都不能有
常见问题汇总
号:wgz189扑话筒均为噪音
发音较近的,任意写。
(di,要写出 的 )
错字
星,杠,点
与后者不混,能听清写字,听不清写#
,“儿”必须要写
;一半字母发音,一半单词发音(Wlan),要区分i'm和I am
字就写出来,听不清不用去猜标#,(挪动黄蓝条节段仔细听发音),可以大概写几个
要前后各标一个#
出来,查不到的音对即可。(用英文说出来的地名要写英文形式)
就要写成说错的字,水许,
声音被破坏的;音量特别小,听几遍也听不清楚的;
a b c d,应写#。
写出来
,为“幺”写幺
咳嗽、呼吸、笑声、扑话筒等,写 1个#。
,写#和不写#都可以。
别标其他,(注意不是无效哦)
认。
。
语速特别快时,建议分段选中去听,写下文本,正确率会提高。
候可以用数枣核来进行大概判定个数
)
系统会比较慢,等待。)
》)
(抽查你所做句数的25%,其中无效最多抽查5句)
情。(看自己错在哪里,点验收详情;听句子,点查看)
)。抽检中为二验正在验收。以最终二验结果为准。(上面的日期可以调)个人账号后,请先修改个人信息)
你重新登录。这时,重新登录,重新提交即可
的验收详情界面。
面下面的句号跳转里,回车,进行修改即可
剩余句号,再提交验收