资源描述
数据标注训练,1,人工智能的定义,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。,2,人工智能应用领域,3,人工智能学习的过程,不断地用标注后的数据去训练模型,不断调整模型参数,得到指标数值更高的模型。,4,什么是数据标注,标注是对未处理的初级数据,包括语音、图片、文本、视频等进行加工处理(如标识发音人性别,判断噪音类型等),转换为机器可识别信息的过程。,提供标注服务的厂商,叫做人工智能基础服务供应商。,5,数据标注中的角色,数据标注部分可以分为三个角色 标注员:标注员负责标记数据。 审核员:审核员负责审核被标记数据的质量。 管理员:管理人员、发放任务。 只有在数据被审核员审核通过后,这批数据才能够被算法学习利用。,6,数据标注(数据处理)的业务分类,数据审核:色情审核、暴恐审核、政治敏感审核、违禁敏感审核、广告审核、灌水谩骂审核 数据清洗:对于杂乱的、有错误的数据进行分类、归纳及重新排列和存储。 数据标注,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,不漏标 正确标注 理解需求,标注原则,38, 账户:姓名全拼 密码:123456,39,
展开阅读全文