呼叫中心中的概率分析与应用
来源: 时间:2020-05-25
各位从事呼叫中心的管理者们,大家是否都会有这样的疑惑:XX指标我定多少比较合理?通关考试应多少分算通过?当指标达成到多少时我需要进行预警上级?
在面对以上问题时,我们通常是选取与此指标相关的其他历史数据来进行计算,确定目标值或及格线等问题的答案。但在进行上述计算时,我们通常也会遇到以下两个问题:

01相关数据不完整


因为我们无法判断与此指标相关的数据中,谁的影响最大,谁的影响次之,所以一旦缺失一项我们认为会对其有影响的数据,且仍执意进行计算时,我们很容易对最终结果产生质疑,或者容易被其他人质疑;

02我们无法想到影响此指标的所有参数


在一个开放性的世界中,一件让人意想不到的事件,往往是由非常多的因素所影响的最终结果,而不是由一个单一的原因所导致。尽管使用相关数据进行计算可以得到一个确定的、准确的答案,但由于我们无法想到所有相关的参数,这个答案可能会非常难以确定。

以上的两个问题其实都可以归类为数据不完整,这个时候,我们就需要改变一下思路,使用一个整体的历史数据来进行计算,不再将它们区分成哪些原因,而是看成一个整体,计算一个概率或区间,使用回归分析中的逻辑回归方法,告诉我们一个概率的答案。

逻辑回归

逻辑回归是并不是回归,而是分类与预测算法中的一种,也是入门机器学习时学习的第一个算法。它不仅可以来预测相关数据的影响程度,还可以寻找影响其指标的因素有哪些。例如银行业使用逻辑回归来判断信誉达到多少时可以成为优质客户;在医学上用来判断蛀牙与刷牙、饮食习惯、年龄等影响之间的关系;以及电影行业为了保证收入,会调研社会群体中的平均年龄和性别比例,来安排不同类型电影的拍摄与上映等等。在呼叫中心行业,我们也可以使用逻辑回归来帮助我们进行以下工作:


01相关性与目标

在进行数据分析时,都需要一个前提:尽可能的获取所有与此有关的数据。所以我们在进行数据分析之前,需要先进行判断,此指标数据与我们要进行分析的指标数据之间,是否存在相关性。例如我们在分析气候异常与汽车尾气排放时,需要先判断汽车尾气排放与气候异常存在相关性,然后再计算确定尾气每排放多少会影响天气多少度。同样呼叫中心数据在分析时,也需要做这一步。

例如我们在分析服务水平如何能达标时(当然我们可以通过Erlang_C公式来计算,但大家应该都知道,Erlang_C公式是有缺陷的,公式无法考虑呼损,以及人力配备不足时计算结果会非常不准确),我们联想到缺勤、人员配备、AHT等可能会影响服务水平的达成,那我们需要使用相关性分析来判断以上数据是否与服务水平会有相关性,此时我们通常使用Excel中的CORREL函数来进行判断,CORREL函数也叫皮尔逊相关系数,计算的结果是在【-1,1】区间中的一个值,正数为正相关,负数为负相关,结果的绝对值越趋向于1或-1,表示相关性越强。


在确定出有相关性的指标后,我们就需要使用逻辑回归来判断其影响几率,较为限制的一点是,逻辑回归只可以判断其他数据“是、否”会影响本指标。


例如我们想看一下服务水平考核10秒80%这个指标是否合理。首先我们需要收集与服务水平相关的指标,这里使用大家普遍都认可的接通率作为与服务水平具有相关的指标,并设为X。收集的数据为日度维度,每天的接通率对应的服务水平不是具体数据,而是达标或未达标,达标用“1”表示,未达标用“0”表示(达标即为达成10秒80%服务水平),并设为Y。使用Excel的规划求解功能可以计算出逻辑回归方程中斜率和截距的最优解,之后我们将从1%~100%每级递增1%的接通率X数据分别带入方程式中,与规划求解计算出的斜率和截距的最优解进行计算,将会得出1%~100%的100个接通率X数据所一一对应的100个概率数据点,将这100个数据节点做成折线图: