今回は実際の企業データを分析した結果から
「入社後の情報(評価)から退職を予測できるか?」
という課題について考えてみます。
※関連記事は「退職(予測)に関するデータ分析結果(まとめ)」よりご覧ください。
退職(離職)は予測できるか?
従業員の離職を予想する方法はありますか?
データがあれば、傾向をつかむことは可能です。
既存の評価データだけでも、分析できますか?
はい、どの程度未来予測ができるか見てみましょう。
前回記事では、「1人が退職すると年収相当の利益損失」の可能性があることがわかりました。特に「ハイパフォーマー」や「将来の幹部候補」には、退職してほしくないと考える企業は多いかと思います。
そこで今回は、
・入社後の情報(評価)から「退職」をどの程度予測できるか?
また
・退職しやすい人はどのような特徴がみられるか?
について、実際のデータを使って分析をしていきます。
「退職」を機械学習(AI)で予測する
まずは「退職した人」について、機械学習(AI)を用いて予測を行ってみます。
今回は、比較的多くの企業でデータとして残っていると考えられる
・勤続年数、評価、等級、異動回数、給与金額
のみを利用して分析してみます。
(「性別」「年齢」などの属性情報は、あまり「退職」の予測に寄与しないことを別途確認しています。)
今回は、
・「2012年~2015年」のデータを、予測モデルを作る「学習データ」
・「2016年~2017年」のデータを、「テストデータ」(以下の検証結果で利用)
としています。
機械学習はプログラムが頑張ってしまうので、さっそく結果です。
※該当企業の2016年~2017年に在籍していた約1000人(人数は丸めています)に対する分析結果です。
結果、
・正解率は「83%」((31人+795人)/1000人)
・「退職」と予測し、実際に「退職」だった人は、「46%」(31人/67人)
となりました。
※「正解率」は「退職と予測し、実際に退職した人」と「在職と予測し、実際に在職の人」の合計の割合です。
今回の企業では当該期間の退職率は「約17%」だったため、
機械学習を用いることで2.7倍(46%/17%)の確率で退職を予測できる
ことがわかりました。
今回の退職予測に意味はあるか?
今回の結果の解釈としては、
・統計的な予測モデルとしては、改善の余地がある
・一方、実利用を想定すると、ある程度有効に使える可能性がある
という結論だと考えています。
統計的な予測モデルの観点では、実際の退職者「169人」中「31人」(約2割)しか退職を予測できていないため、予測精度はまだまだ改善の余地があると感じます。
※ただし、退職については様々な要因があるため、1つの予測モデルだけでは限界があり、複数の要因を検証できる予測モデルが必要とも感じています。
一方、実利用を考えると、機械学習(AI)が予測した「67人」(うち31人退職)の「退職リスクが高い人」に対し、サポートを手厚くする施策を実施することで、全体に対する施策よりも効果的な施策を実行できる可能性があります。
予測結果を具体的にどのように施策に落とし込めるかが、予測がどれだけ意味があるかを決めるポイントかなと考えています。
退職しやすい人の特徴とは?
実際に機械学習に取り組まれている方の悩みとして
「機械学習の結果だから!という理由では現場が動いてくれない」
という話を伺うことがあります。
そこで今回は、複雑な予測モデルの要素を分解し、「退職者」の特徴を抽出しています。
※具体的には、予測モデルから影響度の高い部分を仮説として抜き出しています。
今回の企業の場合、「等級」と「給与上昇の回数」が、退職予測に比較的強い影響を与えていることがわかったため、「等級」ごとに「給与上昇回数」と退職率の関係性をまとめてみました。
結果、
・「若手」では、「給与上昇回数が多い」ほうが退職率が高い
※特に、上昇回数が0.75~1回/年の場合、退職率は約2倍になる
※ただし、「最も給与上昇回数が高い層」(1.25回/年以上)は、退職率は低い
・「中堅以上」では、「給与上昇回数が少ない」ほうが退職率が高い
という結果になりました。
上記を解釈すると
「若手」は、一定の評価をされている人(トップではない2番手)が、退職しやすい
傾向があるといえます。
この結果は、個人的な感覚ともあう部分があると感じます。
※この層の若手は将来の組織を支える大切な人財の場合が多く、期待値ギャップを埋めるなど、優先的にサポートができるとよいのかなと感じます。
もちろん「機械学習による予測モデル」のほうが「精度」は高いですが、現場を巻き込み「成果を生む」ことを重視すると、上記のような単純集計を用いたほうが、成果に近づけるのかもしれません。
まとめ
今回、入社後の情報(評価)から「退職を予測できるか」という課題に対し
・正解率は「83%」
・「退職」と予測し、実際に「退職」だった人は、「46%」(31人/67人)
・機械学習を用いることで約3倍の確率で退職を予測できる
という結果を得ることができました。
また、退職しやすい人の特徴として
「若手」で、一定の評価(ただしトップではない)をされている場合
※中堅以上ではあまり評価されていない場合
があることがデータから示唆されていることを確認しました。
みなさまの会社では、退職リスクに対して、どのような取り組みをされていますか?ぜひご意見をいただけますと幸いです。
※執筆者:塚本鋭
東京大学・大学院において、複雑ネットワークや大規模シミュレーションに関する研究に従事。人工知能学会研究会優秀賞・東京大学工学系研究科長賞 等を受賞。 大学院修了後、株式会社野村総合研究所にコンサルタントとして入社し、ICT・メディア領域を担当。2013年1月より株式会社クラウドワークスに8番目の社員として参画し、2014年12月に上場を経験。データ分析・産官学連携を軸としながら、B2B事業立ち上げ、カスタマーサポート部門立ち上げ、子会社副社長等を歴任。2018年より現職。