AI 公司为什么要设立这样一个职位
职责边界是什么
什么样的人适合
职位发展前景如何
等等问题,都还是业内空白,为此我将在正文中为大家一一揭晓。
核心结论
人工智能训练师的定义:通过分析产品需求和相关数据,完成数据标注规则的制定,最终实现 " 提高数据标注工作的质量和效率 " 以及 " 积累细分领域通用数据 " 的价值。
人工智能训练师的行业认知度:开始得到杭州、北京等城市 2 年以上 AI 公司的重视,考虑到人工智能训练师的人才缺口 5 年后将增长 20 倍以上,该职位将会愈加受到各家 AI 公司的重视。
人工智能训练师的职业规划:1~3 岁互联网产品经理最有可能成为人工智能训练师的主要来源职位;而 AI 产品经理将成为最合适的上升职位。
目录
人工智能训练师的产生背景
人工智能训练师是什么
人工智能训练师的人才缺口
人工智能训练师的职业规划
一、人工智能训练师的产生背景
一般而言,AI 公司从客户(用户)那里获取到的原始数据无法直接用于模型训练,在 " 人工智能训练师 " 出现以前,是由 AI 产品经理先用相关工具简单处理,再交给数据标注人员进行标注加工,但因为标注人员对数据的理解和标注质量差异很大,导致整体标注工作的效率和效果都不够理想。
同时,AI 公司在其细分领域内积累了大量数据,这些数据往往在使用一次后就不再产生更多价值,随之带来了第二个问题:数据无法沉淀和复用。
基于这两个问题," 人工智能训练师 " 应运而生。
* 注:" 人工智能训练师 " 这个职位,据说最早是由 BAT 某部门在 2 年前创造的。
二、人工智能训练师是什么?
1. 定义
人工智能训练师,是通过分析产品需求和相关数据,完成数据标注规则的制定,最终实现 " 提高数据标注工作的质量和效率 " 以及 " 积累细分领域通用数据 " 的价值,从工作流和工作难度等角度看,它介于数据标注和 AI 产品经理之间。
2. 工作职责
人工智能训练师的工作职责,主要有以下三点:
提供数据标注规则:通过算法聚类、标注分析等方式,从数据中提取行业特征场景,并结合行业知识,提供表达精准、逻辑清晰的数据标注规则,最终确保数据训练效果能满足产品的需求;
数据验收及管理:参与模型搭建和数据验收,并负责核心指标和数据的日常跟踪维护;
积累领域通用数据:根据细分领域的数据应用要求,从已有数据中挑选符合要求的通用数据(适用于同领域内不同客户 / 用户),形成数据的沉淀和积累。
* 注:在不同公司,人工智能训练师的职责具有一定差异性,比如有的偏重前期的数据挖掘和模型训练,有的偏重后期的产品运营和产品体验。
3. 职位辨析
人工智能训练师和数据标注、AI 产品经理的异同
1)人工智能训练师和 AI 产品经理的异同
人工智能训练师需要和 AI 产品经理讨论需求,进而制定数据标注规则,并提出产品体验优化建议。
2)人工智能训练师和数据标注的异同
人工智能训练师需要和数据标注人员紧密协作,把控好整个流程的输入规则和输出结果,最终输出标注准确的数据(供模型训练)。
3)人工智能训练师的工作流程图
下图,展示了人工智能训练师和数据标注、AI 产品经理协作的工作流及其每个节点的交付物。
不难发现:人工智能训练师在数据标注和 AI 产品经理之间,起到桥梁的作用。
人工智能训练师和初级互联网数据产品经理的异同
1)两者工作职责的主要区别在于 " 积累细分领域通用数据 ",这项工作将为公司创造新的价值,比如:
大大减少后续标注人员的工作量,提升业务的接入速度和效率。
逐步建立细分领域的行业壁垒。
总之,由于一般的数据不能全领域通用,所以不同应用场景下,细分领域通用数据少的问题,将成为整个行业的痛点和机会。
2)在 AI 工作场合,原本由初级互联网数据 PM 完成的 " 贡献数据采集标准、打通数据资源、数据应用的推广 " 等工作,并没有交给人工智能训练师,而是由更适合的 AI 产品经理完成,原因在于这部分工作更偏重前端的需求和推广(AI 产品经理更熟悉和擅长产品体验及流程)。
4. 能力模型
基于人工智能训练师的工作职责,需要具备哪些能力呢?
通过调研分析,我们总结出了如下的能力模型:
数据能力:了解科学的数据获取方法论,能运用数据处理工具(如 Excel 等),逻辑思维强。