研修効果測定ー行動レベルの研修アンケート2022

トップページ

海外の人材開発トレンド

パフォーマンス重視の研修アンケート2022

パフォーマンス重視の研修アンケート2022

2023.0501

ここでは、パフォーマンス重視の研修アンケート（2022）について解説します。

０.まとめ

研修アンケートの目的
研修アンケートは研修効果の先行指標になるのか？
Thalheimerの初版と第2版で何が違うのか？

１.学術的な裏づけのない項目はやめる

よくある研修直後アンケート項目（例）
研修アンケート結果と学習成果・職場の行動
Qualcomm年次エグゼクティブレポートの指標（2007年当時）

２.職場実践につながる４つのことを聞く

パフォーマンス重視のアンケートの特徴
人材開発の仕事の流れとThalheimerの研修アンケートの関係

３.５段階評価をやめ、Thalheimerの尺度を参考にする

よくある研修アンケートの問題点
Thalheimerが提案する研修アンケート（例）総合評価

４.今後、研修アンケートをどう考えるのか？

3種類の研修指標例

0.まとめ

William Thalheimerが第2版“Performance-Focused Learner Surveys”（2022）を出した。
研修アンケートの設計について何をどのように見直せばよいのか、60の質問例にもとづいて解説し、ものすごくわかりやすくなっている。特に、初版ではわかりづらかったアンケート設計の全体像が明確になった。
独断と偏見で思い切って著者の主張を要約すると、以下の3点になる。

学術的な裏づけのない項目はやめる
研修成果は学んだことを職場の実務に活用することにある。よく利用されている「研修満足度」など、学術的には職場での活用に関係性がないと実証されている項目はアンケートの質問から外すべきである。
職場実践につながる４つのことを聞く
「職場での実務活用」に関連する要因は、「①学習内容の理解度、➁学習内容の記憶度、③職場での活用意欲、④職場でのフォロー状況」の４つである。研修アンケートは直後①～③と事後④の2回に分け、この4つを聞く。
５段階評価をやめ、Thalheimerの尺度を参考にする
回答者によって解釈がばらつく、抽象的な5段階評価はやめるべきである。それに代わる誰が見ても違いが明確な尺度を数多く例示しているので、取り入れてほしい。

上記のような主張の根拠として、学術論文や著者の実践経験などを示し、解説している。
研修直後のアンケートは、研修品質であり、研修効果ではない。研修効果というのであれば、設計段階で「研修効果」を定義し、職場での実務行動やKPIの変化をみるべきである。
参考になることは多いが、今後、Chat GPTなど、対話型のAIを使って学習やフォローをするようになれば、4レベルに基づく研修アンケートの議論はもはや意味をなさないと思う。

2016年

Amazonで購入

2022年

Amazonで購入

人材開発担当の教育_研修効果測定の基礎知識

人材開発担当の教育_研修効果測定基本からレベル3・4の実践まで

まず、研修アンケートの議論の前提として以下4点を整理しておきましょう。

ひとつ目は研修効果測定の議論がもつバイアスです。多くの場合、研修は経営幹部の意向を踏まえ、本社スタッフによって企画実施されます。

「学習プログラムがうまく機能していないことがわかって得をする関係者はほとんどいない」

– シュロモ・ベンハー『企業内学習入門』2014年

したがって、上記のベンハーの指摘のように「研修が失敗したとわかって得をする人」は誰もいません。つまり、最初から「研修はうまくいった、成功した」と報告をすることが暗黙の裡に求められているのです。

前提のふたつ目として、研修アンケートの目的を確認しておきましょう。

図表１.研修アンケートの目的

図表１はThalheimerがあげている研修アンケートの目的ですが、「人材開発部の存在意義を示す」といった1990年代的な内容ではありません。最近の研修効果測定の目的は、二番目のような「職場での活用を支援する」、つまり職場のパフォーマンス改善に重点が移っています。

前提の３つ目は、「研修アンケートは研修効果を示す先行指標になるのか？」ということです。

図表２.研修アンケートは研修効果の先行指標になるのか？

結論から先に言うと、研修アンケートの項目内容により、研修効果の先行指標として使えるものと使えないものがあります。使えそうなものでもそれほど強力な先行指標とは言えません。Thalheimerが初版から主張していることですが、カークパトリックの旧4レベルで言われている研修満足度は、残念ながら研修効果の先行指標にはらないという学術的なメタ解析の結果があります。

A Meta-Analysis of the Relations among Training Criteria (1997)
A Review and Meta-Analysis of the Nomological Network of Trainee Reactions（2008）

前提の４つ目は、図表３の初版と第2版の「共通の考え方」にあるように、「完璧な研修効果測定のツール」はありませんし、「完璧な研修アンケートの質問文」もないということです。

図表3.Thalheimerの初版と第2版で何が違うのか？

それでは、Thalheimerは具体的にどのような主張をしているのか、概要をおさえていきましょう。

図表３のように、第2版はタイトルを変え、100ページくらいボリュームが増えて、研修アンケートの設計について全体像が明確になりました。さらに、研修アンケートの設計について何をどのように見直せばよいのか、60の質問例にもとづいて解説し、ものすごくわかりやすくなっています。

独断と偏見で思い切って著者の主張を要約すると、以下の3点になります。

①学術的な裏づけのない項目はやめる

②職場実践につながる４つのことを聞く

③５段階評価をやめ、Thalheimerの尺度を参考にする

それでは、この3点について順を追ってみていきましょう。尚、図表1～11は著者が独自に作成したものであり、原書にはありませんのであらかじめご了承ください。

人材開発担当の教育_研修効果測定の基礎知識

1.学術的な裏づけのない項目はやめる

Thalheimerは、「研修成果は学んだことを職場の実務に活用することにある」と定義しています。

したがって、研修成果の測定は「職場に戻った学習者が学んだことを実務に活用しているか」を観察したり、上司や同僚に聞いたりするのが最も適切です。そして、実務に活用しているのであれば、その結果、具体的な成果・業績の変化があるのかを確認すればよいわけです。

しかし、実際はそこまで時間をかけられないので、研修アンケートで代用するわけです。

図表４は、「研修アンケート」でネット検索して上位表示された5社のアンケート項目をまとめたものです。どれも見覚えのある項目でしょう。

図表4.よくある研修直後アンケート項目（例）

Thalheimerは、図表４のように伝統的な研修アンケートの項目は「学習・研修の品質を重視した内容になっている」「アンケート結果から具体的な改善の打ち手がすぐにわからない」といった批判をしています。

さらに、「議論の前提の３つ目」でふれたように、カークパトリックの旧4レベルで言われている研修満足度は、研修効果の先行指標にはならないと指摘しています。その根拠のひとつとしてあげているのが図表５のSitzmannたちのメタ解析結果です。

図表5.研修アンケート結果と学習成果・職場の行動

図表５は2016年の小社コラムですでに紹介したものですが、解析結果をざっくりと言うと、次のようになります。

研修前の受講者の「やる気」「生来的な同調性」「研修に対する不安」は、「研修直後の満足度」と相関がある。
研修中のインストラクターの「スタイル」や「人間的なかかわり」、「研修に対する職場の支援的な雰囲気」は、「研修直後の満足度」と相関がある。
受講者の「研修直後の満足度」が高いと研修後の「やる気」や「自己効力感」も高まる。
「研修直後の満足度」と学習成果である「職場での手続き的知識（スキル的なもの）」は因果関係にない。「職場での手続き的知識」を見るのには「研修直後の満足度」より「研修後の自己効力感」の方が役に立つ。

関連記事：パフォーマンス重視の研修アンケートと今後の人材開発指標

Thalheimerはこの結果から「研修直後の満足度（レベル1）と学習成果（レベル2）は関係ない」と主張しています。というのは、上記の図表５の「D研修後の学習成果」の相関係数（ρ：ロー）がいずれも0.15以下と低いからです。さらに、Alligerらの別のメタ解析結果（1997）では明確に無相関（r=0.09）という結果もあり、カークパトリックの「満足度が高ければ学習成果も高い」という前提は否定されていると主張しています。

ただし、論文の著者Sitzmannたちは、回帰分析の結果も踏まえると「満足度と学習は無関係とは言えない」という立場をとっています。ご関心のある方は以下の論文を参照してください。

Alliger, G. M., Tannenbaum, S. I., Bennett Jr, W., Traver, H., & Shotland, A. (1997). A meta-analysis of the relations among training criteria.
Sitzmann, T., Brown, K. G., Casper, W. J., Ely, K., & Zimmerman, R. D. (2008). A review and meta-analysis of the nomological network of trainee reactions.

以上のような学術的な知見を踏まえると、「研修満足度が高ければ、知識・スキルをよく習得し、職場に戻って実務に活用して成果・業績の改善が期待できる」といったバラ色のシナリオはないということです。

Thalheimerは、こうした学術的な知見の裏づけのない項目はやめるべきだと言っています。実際に、Qualcommのエグゼクティブレポートには「研修満足度」指標はなく、独自の人材開発指標を使っています。

図表6.Qualcomm年次エグゼクティブレポートの指標（2007年当時）

Amazonで購入

関連記事：The Chief Learning Officer-印象に残った17人のCLOの言葉

図表４のような伝統的な研修アンケートの項目は、少なくとも「研修効果」ではなく、「研修品質」としてとらえるべきだと思います。しかし、本当に「良薬」であれば「研修満足度4.9」といった数字になるのがそもそも疑問ですが、それはさておき、「研修品質」は高くて当たり前なのです。

人材開発担当の教育一覧_26

人材開発担当のリスキリング－基礎編：業務の変化・設計・職場活用

2.職場実践につながる４つのことを聞く

それでは、図表４のような伝統的な項目がダメだとすると、どのような研修アンケートを設計すればよいのでしょうか？

図表７はThalheimerが提案している「パフォーマンス重視のアンケート」の特徴を伝統的なアンケートと対比させてまとめたものです。

図表7. パフォーマンス重視のアンケートの特徴

Thalheimerは、具体的な研修アンケート項目として、図表８のように「①学習内容の理解度、➁学習内容の記憶度、③職場での活用意欲、④職場でのフォロー状況」の４つをあげています。

この4つの要因は、トレーニングの効果性についての学術的な知見に基づいています。Thalheimerは、トレーニングの効果性を高める要因として、The Learning Maximizer、The Decisive Dozen、LTEMなどの独自モデルを考案しています。いずれも学習促進、記憶促進、活用促進にかかわる要因を整理しており、図表８の4つの要因につながる内容です。

ただし、この4つの要因を1回の研修アンケートで聞くのではなく、直後アンケートで①～③、事後アンケートでは④と2回に分けて聞くということです。

図表8.人材開発の仕事の流れとThalheimerの研修アンケートの関係

図表８の効果測定のところで「実務テスト」と書いているように、本来は「学習内容の理解度」「学習の記憶度」「職場での活用意欲」も職場に戻って「実務テスト」をすればすぐにわかります。

その「実務テスト」を実施する工数をなかなか取れないので、「A.直後アンケート」「B.事後アンケート」で代用するというわけです。

もう少し「A.直後アンケート」のイメージを確認しておきましょう。

たとえば、「学習内容の理解度」の質問では、まず大項目の「教えてもらった考え方をどの程度理解していると思いますか？」という質問に対し、「A.まだ少し混乱しているところが残っている」「C.教えてもらった考え方をしっかり理解している」「D.教えてもらった考え方を実務に使う準備が十分にできている」といった選択肢で回答します。

それに続いて、理解度が低いという場合、その原因がすぐにわかるように掘り下げる質問が続きます。たとえば、「新しい考え方を理解しやすいようにどの程度準備が整っていましたか？」という質問に対し、設計の問題、説明の問題などの選択肢が用意されています。さらに、別の質問で受講者本人の問題か、講師の問題かをたどっていくのです。

この構造であれば、何が原因で理解度が低くなっているのかすぐにわかるので、改善策がすぐに打てるわけです。図表８でいうと、ひとつ前のフェーズに戻って状況を確認する内容が含まれているのです。

こうして、「大項目の質問→さらに原因を確認する下位質問」という構造で「理解度」に関連する質問だけで5つの質問が例示されています。「記憶度」「職場の活用意欲」についても同様です。

「B.事後アンケート」ではひとつ前の研修転移の取り組みがどうだったのか、リマインドツール、ジョブエイド、職場の上司など、何が十分で何が不十分なのかがわかる４つの質問があります。

Thalheimerの第2版の魅力は、こうしたロジックの通った体系的な質問例が初版から倍増しており、練習問題を含めて60項目あることです。ぜひ、原書を手に取って、ロジック構成をたどりながら質問と選択肢を一つひとつ吟味して確認されることをお勧めします。

2022年

Amazonで購入

人材開発担当の教育_研修効果測定の基礎知識

3.５段階評価をやめ、Thalheimerの尺度を参考にする

Thalheimerが提案するパフォーマンス重視の研修アンケートの真骨頂は、こうしたロジックの通った質問構成もさることながら、すでにお気づきかもしれませんが、研修アンケートの回答選択肢にあります。

よくある研修アンケートの回答選択肢は図表９のような5段階評価だと思います。

図表9. よくある研修アンケートの問題点

Thalheimerは、こうした質問と5段階尺度について次のような批判をしています。

ひとつは、「この研修で新しい知識とスキルを学んだ」という質問自体がポジティブな回答を誘導するバイアスがある。
ふたつ目は、尺度そのものがあいまいである。このあいまいな数字を平均して報告されても経営幹部など関係者はその意味がわかりづらい。

そこで、Thalheimerが提案しているのが図表10のような質問と回答選択肢です。

図表10. Thalheimerが提案する研修アンケート（例）総合評価

この質問と回答選択肢の特徴は3つあります。

ひとつ目は、この例は総合評価ですが、「学習したことをどの程度実務で実行できると思うか？」を聞いており、「研修成果＝職場での活用」の筋が通っています。

ふたつ目は、5段階評価ではなく、A~Eの選択肢そのもので学習者のレベルの違いがわかるようにしていることです。「A今の役割では学習したことを実行できるとは思えない」から「E学習したことを実務でうまく使いこなすことができる」まで、選択肢をさっと読めば誰でもレベル感の違いがすぐにわかります。

3つ目は、右端の判定基準です。図表９の例で言えばA~Cは不合格、DEは合格というように研修設計の段階で経営幹部や関係者と先に合格基準を決めておきます。そうしておけば、研修後に「理解度、記憶度、職場での活用意欲」それぞれの「合格者は〇％」という数字が報告されると、関係者はその意味がすぐにわかるというわけです。

言うまでもありませんが、実際に学習者が回答するアンケートには図表10の判定基準の欄はなく、あくまでも設計者として判定基準を事前に決めておくということです。

以上、Thalheimerの主張している研修アンケートの３つのポイントをみてきましたが、少し言葉を足して整理しておきましょう。

学術的な裏づけのない「研修満足度」などの項目はやめる
職場実践につながる４つのこと、「理解度、記憶度、職場での活用意欲、職場でのフォローの状況」を聞く
よくある５段階評価をやめ、Thalheimerの選択肢・尺度設計を参考にする

人材開発担当の教育_研修効果測定基本からレベル3・4の実践まで

Thalheimerの第2版では、その他にも魅力的な内容がいくつかあります。たとえば、5章質問項目と回答選択肢がナッジ的な効果を生む、8章オンライン研修等に特化した質問の例示、10章カスタマイズするときの留意点、13章集計結果報告の仕方など、初版ではなかった実務家への研修アンケート設計のヒントが幅広く解説されています。

こうしたThalheimerの提案はとても魅力的だと思いますが、実際にこの考え方を取り入れるとすると、いくつか気になることがありますので、次の3点だけ少し検討しておきましょう。

アンケート項目の選択肢設計に時間がとられるのでは？

Thalheimerの最大の特徴である5段階評価をやめて、選択肢そのもので「レベル感」の違いを明確にするためには、原書を参考にして一からつくる必要があります。おそらく、何度か実際にやってみて微妙な言い回しの試行錯誤も発生するでしょう。しかし、これは授業料だと思って乗り越えるべきところだと思います。

アンケート項目が多くなりすぎるのでは？

Thalheimerの前提は米国の大手企業のイメージなので、研修設計者と研修評価者が違う人のような気がします。その結果、どうしても上流にさかのぼって原因を探る下位項目が必要になるのだと思います。

一方、日本企業の場合は、ひとりで設計と評価を担当する方が多いと思いますので、「理解度、記憶度、職場での活用意欲」の下位項目は設計段階で先にチェックできるはずです。したがって、「理解度、記憶度、職場での活用意欲」の大項目の質問だけに数は絞れるのではないかと思います。

とはいえ、各社の状況やお考えがあると思いますので、原書でまずは内容を確認してご判断いただければと思います。

研修直後と事後の2回は工数がとられ、受講者にも不評になるのでは？

これはやり方次第だと思います。面倒なのは2～4週間後の事後アンケートだと思いますが、これは質問を１～3問にして現場での負担感を減らすことだと思います。「研修成果＝職場での活用」という定義に戻れば、2回目ははずせません。これも人材開発部が乗り越えるべき壁のひとつだと思います。

4.今後、研修アンケートをどう考えるのか？

それでは今後研修アンケートをどのように考えたらよいのでしょうか？

先にも述べましたが、研修直後のアンケートは「研修品質」をみるものであり、研修効果ではありません。図表11で言えば品質指標のひとつです。ただし、アンケートの内容はThalheimerの提案する「理解度、記憶度、職場での活用意欲、職場でのフォローの状況」かもしれませんし、伝統的な指標かもしれません。それは各社の判断だと思います。

図表11. 3種類の研修指標例

図表11にあるように、レベル２のテストも「研修品質」を見る品質指標のひとつです。今は「テスト作成は面倒なのでしていない」という企業が多いかもしれませんが、今後は設計段階で対話型AIにつくってもらうことも可能になるでしょう。

研修効果というのであれば、図表11の成果指標にあるようなレベル３「職場での活用度」「実務行動の変化」、レベル４「売上や先行指標などのKPI、成功事例」などをみるべきです。

そうするためには、研修実施後になって研修成果を考えるのでは遅すぎます。最初に経営幹部から研修の相談があったとき、研修を設計する段階で「何を研修効果としてみるのか？」「研修効果」を定義する必要があります。最初に「研修効果」を関係者と一緒に決めておけば、研修の前後で職場での実務行動やKPIの変化を確認するだけでよいのです。