大语言模型时代下人工智能训练师的变与不变
来源: 时间:2024-05-06
前言:

唐朝著名的边塞诗人岑参在其知名的代表作《白雪歌送武判官归京》中写道:“忽如一夜春风来,千树万树梨花开。”用以描述北国突降大雪,漫天白雪皑皑的景象,将白雪比作梨花,就好像是突然的一夜春风,千树万树,漫山遍野的梨花都全部竟相的开放,带给人们强列的视觉冲击。2022年11 月 30日,美国人工智能公司 OpenAI 发布 ChatGPT 通用对话系统,GPT的发布正好似岑参看到的大雪,给“所有的”AI之树都裹上了银装。GPT(Generative Pre-trained Transformer)的发布对于技术路线的进步、OPEN AI公司的发展来说是必然,但几乎对所有“传统的”人工智能行业从业者来看却是非常的偶然。因此当又一轮新的人工智能技术革新浪潮袭来,对于那些之前已经在海水中弄潮冲浪且获得了一定收获的从业者来说,是“近乎放弃或重开一局”投入到大语言模型的军备竞赛之中还是另辟蹊径将二者相结合;对于还在岸上观望技术发展与落地应用的人们来说又该如何进去这个赛道。对于原有AI从业者们已经掌握的技能是否需要重新学习?大模型浪潮之下还需要掌握哪些技能才能让自己稳稳立身于变革之中呢?这些都是AI从业者们普遍的困惑。为此,笔者根据多年人工智能服务产品产品的经验,从人员技能视角出发,与大家共同探讨大语言模型时代下一个重要的角色—人工智能训练师较之以往的工作的变与不变。


01武林至尊,宝刀屠龙。大语言模型对人工智能技术的变革与影响


人工智能技术自20世纪发展以来从最早的简单模型到现在的高度复杂模型,历经过多个关键的节点,每个关键节点都对技术的发展与进步起到不可获取的技术,但这些节点无一例外都是以一种渐进和累积的方式逐步向前(如技术的进步,产品的研发都是如此)。但GPT系列却是以一种蛮横的姿态出现,GPT系列的发展不仅在技术上是一个巨大的飞跃,标志着AI领域的迎来了一个新时代,大语言模型不仅在技术层面上取得了突破,也极大地扩展了AI的应用范围,从而引发了一场行业的变革。

如何衡量这种变革的影响呢?是打开各种短视频软件,通篇的大语言模型宣传视频还是全网铺天盖地的话题讨论,这让笔者想起了幼年时期曾经看过的一本小说《倚天屠龙记》,其中有这么一段描写:元朝末年,群雄逐鹿,武林动荡不安,江湖中流传着“武林至尊,宝刀屠龙,号令天下,莫敢不从,倚天不出,谁与争锋”的传说,武林中人对屠龙刀和倚天剑都趋之若鹜。屠龙宝刀的突然出现搅动得江湖血雨腥风,所有的武林人士都投入到了屠龙宝刀的争夺战之中,而GPT系列的大语言模型推出,就好似屠龙宝刀一般,所有AI从业的公司都纷纷下场与转型,躬身入局,2022年11月正式开启大语言模型的大航海时代!
大语言模型究竟有何种魅力能够造成如此之大的影响呢?

自从2018年BERT模型的出现打开了大语言模型的大门以来,GPT系列的推出更是如同一股不可阻挡的潮流,深刻地影响了人们对于人工智能能力的认知。这些模型的共同特点是利用大规模的数据集进行预训练,通过学习海量文本中的语言模式,从而能够执行包括文本生成、语言理解、翻译等多种自然语言处理任务。它们的出现不仅是技术进步的体现,更是对旧有AI应用模式的一次颠覆。

从创新角度看,大语言模型有以下几个吸引人的地方:
(1)高级理解和生成能力:大语言模型能够理解复杂的语言表达,并生成流畅、连贯的文本。这意味着它们可以用于自动写作、对话系统、内容创作等多种应用。

(2)泛化能力:通过在大规模数据集上预训练,这些模型学会了大量的语言知识和世界知识,使得它们能够在多种任务和领域中表现出色,甚至在未见过的任务上也能进行一定程度的推理和应用。

(3)可定制性和灵活性:虽然预训练模型已经具备广泛的知识,但它们还可以通过微调(fine-tuning)进一步专门化,以适应特定的应用或行业需求,从而提供更加个性化和高效的解决方案。

(4)加速创新和研究:大语言模型的开发和应用推动了自然语言处理(NLP)和人工智能(AI)领域的研究与创新,为解决复杂问题提供了新的工具和方法,促进了技术的快速发展。

(5)多语言支持和跨文化交流:一些大型语言模型支持多种语言,能够处理和生成非英语的文本,促进了不同语言和文化背景人群之间的交流和理解。

(6)应用多样性:从文本摘要、机器翻译、情感分析,到更复杂的如问答系统、法律文档分析、创意写作等,大语言模型的应用几乎遍及所有可以利用语言处理的领域。

若是回到智能服务领域,大语言模型则在以下几个地方具备“传统智能服务”所不具备的优势:在智能服务产品侧,大语言模型的产品形态并未发生革命性的变化,即以前有智能文本、智能语音、智能助手、智能质检,大语言模型技术加载后还是这些产品,但其内核或是其原子能力已经发生了“鸟枪换炮”般的影响与变化了,如:

(1)语义理解能力:具备更好的人类自然语言理解能力,能够有效解决以往所谓“答非所问,机器人听不懂人类的话”这样的情况出现,具体则体现在如:流程生成、上下文理解、错别字纠偏、话术总结、关键成分分析、理解精度提升;

(2)推理能力:具备更强的逻辑推理能力,能够在服务营销方面有更好的表现,为客户推荐更加精准的产品,如:表格比较、产品推荐;

(3)生成能力:具备生成能力,能够根据历史文章、关联文章为外部客户推荐问题答案或者产品;为内部服务人员提升工作效能,如:自动生成历史摘要,生成会话小结,生成工单等等;

尽管大语言模型带来的变革给许多行业带来了前所未有的机遇,但它们的出现也引发了对于这种变革性质的讨论。一方面,这种变革可以被视为是技术发展的自然演进,是基于早期模型和算法不断积累和优化的结果。另一方面,它们所能实现的技术突破和应用范围的扩展,也足以被定义为一场行业的颠覆。这种双重性质使得大语言模型时代的来临,既有着渐进的一面,也有着革命性的一面。


02苟能制侵陵,岂在多杀伤——AI或者大语言模型技术落地的关键要素


即然大语言模型技术或是加载大语言模型技术下的新AI技术带来如此大的变革,那么企业究竟如何落地,落地的关键又在于何处?大语言模型的成功实施不仅能够提升操作效率、改善客户体验,还能开辟新的商业机遇和增长路径。然而,技术本身的复杂性加上企业实际操作的复杂环境,使得AI技术的落地成为一项挑战。成功落地的关键在于几个方面的综合施策,包括技术适配、人才培养、文化改革、战略规划,以及关键执行的业务人员的作用。
因此从整体视角来看应该包括:

(1)技术适配与集成:首先,企业需要评估现有系统的技术架构,确保它能够与AI和大语言模型技术兼容。这可能需要升级现有的硬件、软件或网络架构,以支持这些技术的高性能运算需求。同时,技术集成是关键步骤,确保AI能够无缝融入企业现有的工作流程,提升而非干扰日常操作。

(2)人才培养与团队构建:尽管AI和大语言模型本身极为强大,但它们的实际应用和持续优化需要依赖于具备相关技能的人才。企业需要投资于人才培养,包括培训现有员工和吸引外部专家,构建一个能够理解和应用AI技术的团队。这个团队不仅需要包含算法科学家和代码工程师,还应该有能够理解AI应用价值并将其转化为实际业务策略的产品经理,以及实际落地应用的人工智能训练师。

(3)文化转变与管理支持:技术转型成功的另一个关键因素是企业文化和管理层的支持。创新的技术引入往往伴随着变革的阵痛,管理层需要为这种转型提供清晰的视角和坚定的支持。此外,建立一个鼓励创新、容忍失败的企业文化对于促进技术创新和团队合作至关重要。

(4)战略规划与执行:成功落地AI和大语言模型技术需要清晰的战略规划,包括确定技术引入的目标、选择合适的用例、分配资源以及制定实施时间表。然而,规划仅是成功的一半,执行力是将计划转化为现实的关键。这就需要依靠企业内部的关键执行业务人员,他们了解企业的业务流程、客户需求以及市场动态,能够确保技术应用与企业的实际需求和长期目标保持一致。

综上所述,AI和大语言模型技术的成功落地是一个多方面的挑战,需要技术、人才、文化和战略的全面考虑。然而,最终的成功归结于能够将这些技术转化为具体业务成果的关键执行业务人员。他们是连接技术潜力与实际业务需求的桥梁,确保技术投资能够转化为企业的实际价值。因此,企业在推进技术转型的过程中,应当给予这些业务人员充分的信任和支持,为他们提供必要的资源和培训,确保他们能够在这一过程中发挥关键作用。

若是从整体视角对每个关键因素展开分析,大家可能会得出一个悲观的理由那就是小企业或者中体量的企业根本无法应用大语言模型,只能是理想的空中楼阁。但因为近几十年的计算机高速发展与技术红利的存在,真实情况是几乎所有的企业都能以很多种方式引进人工智能、大语言模型,如AI agent(智能体)便是如今大模型落地业务场景的主流形式。因此,让我们排除那些较为宏观的干扰因素,聚焦到AI、大语言模型落地后的关键执行业务人员。

想要分析的透彻,没有遗漏那么就必须要有一条清晰的脉络线来贯穿,接下来我们以大语言模型采购后落地企业,企业开箱使用,使用后根据企业实际情况进行自适应优化,优化后积累行业经验能力,然后设计出适合于本行业的应用模型,这一生命周期进行分析可以发现,关键人员需要承担以下5大类角色;

(1)基础开箱人员:企业购买了一套标准的大语言模型,需要在企业落地应用,首先需要有一类开箱人员(把大语言模型当成一个设备和系统,使用之前需要先打开,让其处于标准可运转的状态),开箱人员的主要工作是根据模型开发者的要求,像其投喂合适的语料与数据即承担数据标注工作。回到智能客服视角即智能客服落地企业后,需要数据标注员进行数据采集(原始聊天对话日志),清洗数据(清洗原始聊天对话),标注数据(根据模型要求进行如编写相似问、用户意图标准、多轮对话流设计等)。

(2)深度应用人员:当模型已经开始上线且持续运转一段时间后,模型的业务指标与结果不是那么的尽如人意或者需要扩大应用范畴(注:一般企业落地人工智能或者大语言模型几乎都是采用试点方式,先进行小范围测试,达到效果后在扩大应用的业务范围确保业务的稳定),此时标准的模型已经无法满足企业业务发展的需求,那么关键业务人员所承担的工作则是根据业务特征与相应的人工智能或大语言模型的产品经理共同研究分析,制定产品策略。如:智能客服上线后,机器人无法解决客户问题,客户选择转人工,但转人工后坐席代表以一句“您好,有什么可以帮您的”惹恼客户。根据这一业务痛点得出需要在机器人转人工时增加一个“历史会话摘要”的模型或功能。这类关键人员承担了业务分析与产品选型、功能设计等职责。

(3)模型开发人员:一旦确定了需要开发或调整的新功能,如“历史会话摘要”等,接下来的任务就落到了模型开发人员的肩上。这群人员通常具备深厚的技术背景,包括但不限于数据科学、机器学习、软件工程等领域。他们的主要职责是根据前期业务分析和产品策略的要求,进行新模型的开发或现有模型的调整和优化。这一过程中,模型开发人员需要紧密与基础开箱人员和深度应用人员合作,确保开发的模型能够准确地理解和满足业务需求。工作内容不仅包括编码实现,还包括数据预处理、模型训练、测试以及迭代改进等一系列复杂的工程活动。此外关键执行业务人员还需要积极参与模型测评、业务需求分析,以及模型开发与迭代期间的模型测试工作即类似于算法测试员的工作内容,但这里的算法测试员更多是从业务应用效果的角度与算法工程师共同完成测试工作。

(4)模型管理人员:在模型开发完成并投入使用后,需要有专人负责模型的日常管理和监控工作,这就是模型管理人员的职责所在。他们负责监控模型的运行状态,包括性能评估、效果监控、异常检测等,以确保模型稳定高效地服务于业务。此外,模型管理人员还需要定期对模型进行维护和更新,比如根据新的数据对模型进行重新训练,或者根据业务发展的需要调整模型参数。他们是确保模型长期有效运行的关键人员,其工作对于维护和提升企业人工智能、大语言模型应用的质量至关重要。同时模型管理人员还会承担或者一定的架构设计或者应用层管理类、对外市场推广类、商业模型制定类等对专业能力和综合素质都有较高要求的工作。

(5)模型设计人员:这类人员主要负责在模型开发前期,根据企业的业务需求和目标,设计出合适的模型架构和算法选择。模型设计人员需要具备深入的算法知识和业务理解能力,能够预见不同设计选择对模型性能和业务目标的影响。他们的工作是整个模型开发流程的起点,通过与业务分析人员、产品经理等其他角色紧密合作,确定模型设计的最佳方案。模型设计不仅仅是技术活动,更是一种艺术,需要设计人员在满足技术可行性的同时,也要兼顾业务的实际需求和约束。


03新事物的诞生,旧事物必将死亡?

从上文的分析,我们得出了大语言模型落地企业的关键业务执行人员的主要工作类别,同时也分析出大语言模型技术具有传统AI技术的积累与旧AI应用模式的颠覆式创新双重性质。那么传统的人工智能技术与大语言模型的关键业务执行人员从工作内容视角又是一种怎么样的关系呢?唯有搞清两者之间的关系才能明白究竟原来学习的人工智能知识在大语言模型时代是继承后在学习还是从零开始。

说起传统人工智能在企业落地所产生的新工作一定无法绕开“人工智能训练师”这一关键的角色,根据相关报道数据“人工智能训练师”从概念发展为新职业,其从业人员从0发展到20万,只用了四年时间。2020年2月,“人工智能训练师”正式成为新职业并纳入国家职业分类目录。人社部对人工智能训练师的职业定义为:“人工智能训练师新职业隶属于软件和信息技术服务人员小类,主要工作任务包括:标注和加工原始数据、分析提炼专业领域特征,训练和评测人工智能产品相关的算法、功能和性能,设计交互流程和应用解决方案,监控分析管理产品应用数据、调整优化参数配置等。”

人工智能(AI)训练师在人工智能技术落地的过程中扮演着至关重要的角色。他们的工作不仅涉及到技术层面,更关键的是连接技术与实际业务需求的桥梁,确保AI技术能够高效、有效地解决实际问题。人工智能训练师的关键作用与重要性如下:

(1)数据准备与预处理:AI训练师负责收集、清洗和标注数据,这是AI模型训练的基础。他们确保数据质量和数据的代表性,从而使得训练出的模型能够准确反映现实世界的复杂性和多样性。

(2)模型训练与优化:通过选择合适的算法和参数设置,AI训练师对模型进行训练和调优。他们需要不断试验和评估不同的训练方法,以找到最优的模型配置,从而提升模型的性能和准确度。

(3)桥接业务需求与技术实现:AI训练师深入理解业务需求,并将这些需求转化为可执行的AI解决方案。他们与业务团队紧密合作,确保开发的AI模型能够解决实际业务中的问题,增强业务流程的智能化和自动化水平。

(4)监控、评估与迭代改进:部署后的模型需要持续的监控和评估,AI训练师负责监测模型性能,及时发现并纠正偏差或不足。他们还需根据业务环境的变化或新的数据,对模型进行迭代更新和优化,保证模型始终保持最佳性能。

(5)知识传递与培训:AI训练师还承担着向非技术人员传授AI知识和技能的责任,帮助业务团队理解AI技术的潜力和限制。这种跨领域的知识传递对于促进团队之间的沟通、协作非常关键,有助于整个企业更好地利用AI技术。

综上所述,人工智能训练师在AI技术落地的过程中起着不可或缺的作用。他们不仅需要具备深厚的技术知识,还需要了解业务需求,并具备跨领域沟通的能力。通过他们的工作,可以确保AI技术能够有效地解决实际问题,助力企业实现数字化转型和智能化升级。

基于人工智能训练师在人工智能技术落地的重要地位,因此2021年底人社部、工信部等单位共同参与制定的新一批“国家职业技能标准目录”正式对外公布。其中,人工智能训练师作为一门新兴职业被纳入此次公布的标准中,并在《人工智能训练师国家职业技能标准(2021年版)》(下文简称为《标准》)中对该职业的活动内容进行了明确的规定,同时也对各等级从业者的技能水平和理论知识水平进行了规范细致的描述。在该标准中对人工智能训练师的职业定义有了更进一步的阐述:“使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。本职业包含数据标注员、人工智能算法测试员两个工种。”同时该职业标准还从数据采集和处理、数据标注、智能系统运维、业务分析、智能训练、智能系统设计等参考维度,划分出了五个职业等级;五个职业等级依照数据采集和处理、数据标注、智能系统运维、业务分析、智能训练、智能系统设计等参考维度划分,从五级/初级工到一级/高级技师,人工智能训练师的职业技能要求依次递进。

当我们仔细阅读该标准后能得到一个惊人的发现,即人工智能训练师的工作内容职业与上文中我们所分析的大语言模型落地的关键执行业务人员的工作内容有着惊人的相似,大语言模型这一新生事物的出现,所带来人员工作内容的变化并不是非0即1的旧事物死亡,而是在旧事物的基础之上有了更新的解读和工作环境、工作细则的变化,但其中的关键逻辑依然一脉相承。


04 龙蛇之变,木雁之间


新事物的诞生往往基于旧事物的演进之上,虽表面呈现为颠覆性创新,其实内部却保持着复杂而深刻的联系。在新事物完全成型与普及之前,迷茫与犹豫常常是普遍的情绪。在大语言模型席卷行业的过去一年,这种迷茫与犹豫也常常出现于笔者的心中,庄子有云“木雁之间、龙蛇之变”,因此我们更不应该放弃或者躺平而是积极寻求解决方法,积累自己的力量。那么对于原有的人工智能训练师来说如何更好适应技术变化带来的工作内容变化,可以从以下几个点出发:

(1)技术理解能力:需要对人工智能和机器学习的基本原理有深入的了解,特别是大语言模型的工作原理、架构以及它们如何被训练和部署。

(2)数据处理能力:强大的数据处理能力是必须的,包括数据收集、清洗、标注和预处理,以确保数据的质量和多样性,从而训练出更准确和高效的模型。

(3)代码理解与提示词编写:熟练掌握至少一种编程语言(如Python),以及掌握相关的机器学习库和框架(如TensorFlow、PyTorch),能够自主进行模型调试和优化。

(4)问题解决能力:在训练过程中,需要能够识别和解决各种问题,如过拟合、欠拟合、数据偏差等,以及能够针对特定应用场景调整模型参数。

(5)沟通和协作能力:与数据科学家、产品经理、开发者等多个角色有效沟通,确保大语言模型的训练目标和业务需求的一致性。

(6)伦理和法律知识:理解人工智能的伦理原则和相关法律法规,确保模型训练和应用过程中的数据隐私、安全和公平性。

(7)持续学习能力:人工智能和机器学习领域快速发展,训练师需要持续学习最新的研究成果和技术动态,以便不断优化模型和训练方法。

(8)创新思维:在快速变化的技术环境中,拥有创新思维能够帮助训练师探索新的解决方案,提出改进模型性能和效率的新方法。

其中,现有的大语言模型大都还是依赖于提示词编写能力,无论是ChatGPT还是最新惊艳世人的Sora,因此当前人工智能训练师对于提示词的学习也是重中之重,有效利用和设计提示词(prompts)来引导或改善大语言模型的输出。这种能力对于提升模型性能和适应性至关重要,涉及以下几个方面:

(1)提示词设计:训练师需要能够设计出精准、高效的提示词,这些提示词能够明确地向模型传达期望的任务类型、输出格式和语言风格。这要求训练师深入理解模型的工作机制,以及如何通过不同的提示词影响模型的行为。

(2)语境理解与应用:掌握提示词能力意味着能够根据具体的应用场景和上下文环境,调整和优化提示词。这包括理解不同领域的专业术语、用户意图以及文化差异,以确保模型输出的相关性和适用性。

(3)实验和迭代:有效的提示词往往需要通过反复的实验和迭代来优化。训练师应具备设计实验、分析结果和调整策略的能力,以找到最优的提示词设置。

(4)创新与策略开发:在某些情况下,标准的提示词可能无法达到预期效果,这要求训练师具备创新思维,能够开发新的策略和方法来提升模型的表现。这可能包括结合多个提示词、使用条件性提示词或开发动态提示词系统。

(5)评估和优化:掌握提示词能力还包括能够准确评估提示词对模型性能的影响,并据此进行优化。这需要对模型输出的质量进行细致的分析,识别可能的偏差或不足,并据此调整提示词设计。

(6)跨领域应用:最后,强调提示词能力的掌握还意味着能够跨领域应用这一技能。无论是在医疗、法律、教育还是娱乐领域,有效的提示词设计都是提升大语言模型应用效果的关键。

写在后面:
在探讨大语言模型技术颠覆式的创新与AI技术演进的长河之中,笔者认为”龙蛇之变,木雁之间”是非常恰当的关键词,寓意着变革(“大语言模型”)与传承(“传统AI”)的深刻哲理。这一概念既描绘了历史与现实中的剧烈变动,也象征了在这些变化中寻找到的连续性和稳定性。龙蛇,作为中国文化中变化与动力的象征,代表着技术革命和思想观念的迅猛发展,它们在社会的每个角落激荡着变革的波澜;而木雁,则象征着历史的传承与文化的连续,无声地在变革的浪潮中坚守着根基和精神。

在大语言模型技术突如其来席卷全球的背景之下,个体从业者和企业都面临着如何适应和引领变革的挑战。”龙蛇之变”要求我们不断学习新技术、掌握新知识、适应新趋势,以创新的思维和方式解决问题,推动AI技术向前发展。”龙蛇之变,木雁之间”不仅是对当前AI大变革的描述,更是对未来发展道路的指引。在这个过程中,每个从业者都将是参与者,我们既是新AI(大语言模型)的推动者,也是旧AI的传承者。通过不断的学习新知识,我们可以在这场AI的长河中找到自己的位置,既能驾驭”龙蛇”之变,又能在”木雁”之间找到安宁和智慧,共同奋进。