22
テスト問題を作るのは難しい。
小野塚 若菜(おのづか わかな)
日本語教育の現場では、今日もどこかでテストが実施されています。クラス単位で行われる小テスト、定期テスト、実力テスト、また、入学試験や卒業試験、さらには日本語能力試験のような国内外で実施される大規模試験もあります。
日常的に行われるテストは、現場の教師が作成することがほとんどです。日々の授業や業務の合間にテストを作るのは大変ですし、簡単ではありません。それでも労力をかけて作り、採点し、学習者に点数を返すという作業を繰り返しているわけです。では、テストを実施した後に、結果を分析し、そのテストの良し悪しを検討している教師はどれほどいるでしょうか。ほとんどの教師が、「Aさんが70点、Bさんが85点」というように、それぞれの学習者の点数を記録するだけで終わっていないでしょうか。
若林俊輔・根岸雅史著『無責任なテストが「落ちこぼれ」を作る―正しい問題作成への英語授業学的アプローチ』(大修館書店、1993年)と出会ったのは、わたしが日本語教師になったばかりのころです。この本の前書きにある、「『試験』なり『テスト』なりは、もともと学習者の学習を援助するものであるはずである。学習を妨害するためのものではないはずである。しかし、現実の『試験』や『テスト』は、この原則に反して、学習者の学習を援助するという役割から離れ、学習者の学習到達度をあまりにも理不尽な物差しで測り、そして学習効果を妨げているのである」という筆者の主張に、当時はひどく驚きました。そして、自身が作成したものも含めて、学習者に実施したテストを改めて見直してみました。すると、確かにありました。答えがはっきりしない問題、質問の意図がわかりにくい問題、授業で学習したこととは関係ないことを問うている問題、読解なのに文章を読まなくても選択肢だけ読めば答えが選べる問題……。このような不備のある問題が含まれるテストで70点をとったAさんは、85点をとったBさんより日本語能力が低いのだろうか、実はこのテストは測りたい能力がきちんと測れていないのではないだろうか、もしそうだとしたら、Aさんは(場合によってはBさんも)“被害者”だ……。わたしはそう考え、申し訳ない気持ちになりました。これらのテストの中には、明らかに不備があるのに一度も修正がされないまま、繰り返し使われているものもあり、“被害者”はもしかしたらかなりの数に上ったのかもしれません。
では、どのようにテスト問題を作れば、被害者を減らすことができるでしょうか。まずテストは、そのテストを使って何を測ろうとするのかという目的をはっきりさせることが重要です。そしてその目的に合うようにテスト問題を作り、構成していきます。これは当然のことと思われるかもしれませんが、案外難しいことです(テスト理論では、これをテストの妥当性と呼びます)。多くの教師が、自分で作ったテスト問題を他者に見てもらうことは少ないでしょう。クラス単位で実施するテストと単純に比較はできませんが、大規模な日本語試験の場合、ひとつのテスト問題は複数(場合によっては数十人)の人の目を通してふるいにかけられ、出題に至ります。テスト問題の原案がそのまま出題されることはほとんどなく、だれの目から見ても不備がない(と思われる)ように修正されていきます。つまり、自分では不備がないと思われるテスト問題でも、他者から見ればおかしいという場合が多いのです。教師はテストを作ったら、他の教師にチェックしてもらい、不備を少しでも減らしていくことをお勧めします。
それだけではありません。テストを実施したら、その結果を記録してみてください。先述したように、学習者個々の点数だけではなく、テスト問題個々について、学習者が具体的にどのような解答をしたのかを記録していくことが大切です。そして、テスト問題ごとに見て行くと、作成側の意図通りに解答されているものもあればそうでないものも見つかると思います。後者の場合は、テスト問題の内容を逐一確認していくと、実は設問(問い)がはっきりしていなかったとか、解答時間が十分でなかったとか、作成当初は想定していなかった不備が見つかる可能性があります。不備が見つかったら修正し、できれば別の学習者に再度出題してみます。すると、また別の不備が見つかることがあります。このように、テスト問題を修正しながら繰り返し出題していくことで、不備のない良いテスト問題ができていきます。それはつまり、テスト問題の良し悪しは、学習者(受験者)が教えてくれるということなのです。
ここまで述べてきたように、教師は自分の作ったテスト問題を過信せず、また、思い入れを捨てなければなりません。自分ではいい問題だと思っていても、実はどこかに不備があって、もしかしたら測りたい能力の高い受験者ほど正解を得られていないかもしれません。テスト問題を作る際は常に客観的な立場で、受験者の目線で検討することが肝要です。
テストは、受験者の能力を測定する道具でありますが、一方で教師の教育活動を評価するための道具でもあります。テストを作成し分析するということは、自身の教育活動をかえりみる作業と同じことなのです。テストの結果は教育活動にヒントを、教育活動はまた、より良いテスト作りへのヒントを与えてくれます。
次の“被害者”を生まないために、公平性を担保しつつ妥当性の高いテスト作りはどうしたら実現できるのでしょうか。テストの結果を、どのように授業に活かしていけるでしょうか。教育活動と教育評価の好循環を目指し、今後もテストの研究を続けていきたいと思います。
(2017.04.01)
《プロフィール》
ベネッセ教育総合研究所 アセスメント研究開発室、研究員。
筑波大学大学院人文社会科学研究科博士後期課程修了、博士(学術)。東京富士大学、東京学芸大学などで日本語教育に従事。一方で、日本貿易振興機構(JETRO)、日本学生支援機構(JASSO)などで大規模試験の開発・分析に携わる。著書に、『日本語教師のためのExcelでできるテスト分析入門』(スリーエーネットワーク)、『ビジネス日本語オール・イン・ワン問題集―聴く・読む・話す・書く』(ジャパンタイムズ)などがある。