医学教育研究者・総合診療医のブログ

医学教育、総合診療について気ままに綴ります。

The test developer's dilemma: Evaluating the balance of feasibility and empiric performance of test development techniques for repeated written assessments (Med Teach 2022)

Shappell E, Wagner MJ, Bailitz J, Mead T, Ahn J, Eyre A, Maldonado N, Wallace B, Park YS. The test developer's dilemma: Evaluating the balance of feasibility and empiric performance of test development techniques for repeated written assessments. Med Teach. 2022 Sep 6:1-6. pub ahead of print.

背景:筆記試験は、繰り返し実施する場合、項目開発に資源を要すること、理解ではなく項目の想起により成績が向上する可能性があることなどの課題がある。本研究では、これらの課題を解決するための3つの項目開発手法の有効性を検討する。

方法:5つのトレーニングプログラムの学習者が2つの60項目の反復評価を行った。1回目の試験の項目は、2回目の試験のために、(1) 逐語的反復 (Verbatim repetition)、(2) 同型変化 (Isomorphic changes)、(3) 全面改訂 (Total revisions)の3つの処理のいずれかにランダムに振り分けられた。primary outcomeは、テストバージョン間の項目の心理測定値の安定性と、推測を示唆する正答率と誤答率(correct-to-incorrect rate)で測定される、項目の記憶がパフォーマンスに影響する証拠であった。

結果:46名の学習者が両テストを受験した。項目の心理測定は、各テストバージョンで同等であった。correct-to-incorrect ratesはグループ間で有意差があり、推測率が最も高かった (lowest recall effect)のはTotal Revisionグループ(0.15)、推測率が最も低かった (highest recall effect)のはVerbatimグループ(0.05)だった(p = 0.01)。

結論:同形式の改訂と全面改訂は、繰り返し評価における想起の影響を緩和するうえで優れた性能を示した。全項目改訂の高いコストを考慮すると、反復筆記評価に対する効率的かつ効果的なアプローチとして、同型項目の探求が期待される。