The Final Exam

「おじちゃん、代数の最終試験の勉強を手伝ってくれないかな」と息子に聞かれました。

「先生は復習シートを配りましたか?」

「うん、今日もらったこの模擬試験を見てごらん」

「それで、最初の問題は何? 次の方程式をグラフにしなさい。 “

「おい君、絶対値のグラフの描き方を覚えているかい?」

「さっぱりだよ、6ユニット前の9月にやったじゃないか!」

テキストを200ページ以上めくりながら、「さすがだな」と息を切らしてつぶやいていました。

なぜ、コースの最後に、1学期分の内容を網羅した試験を行う講師と、最後の1、2ユニットだけをテストする講師がいるのでしょうか。 多くの学生に聞いてみると、単に意地悪な教官がいると答えるでしょう。 確かに、教授のテスト戦略の裏には、人格障害以上のものがあるはずです。 私は25年ほど前から全学的なテストオフィスの一員として、何百もの試験を見てきましたし、ほぼ同じ数の教授と試験に関する悩みについて話をしてきました。 しかし、最終的なコース評価を行うための戦略について、特に教員に尋ねたことはありませんでした。 教員はどのようにしてコースの最後に使用する評価の種類を決めるのでしょうか?

測定に関するベストセラーの教科書をざっと読んでみても、このトピックに関する記述はほとんどありません。 一般的に、教室での試験をどのように開発するかについては、このコラムで以前に紹介したいくつかの優れた内容を含め、非常に多くの知恵があります (Perlman, McCann, and McFadden, 1999)。

教授がどのように、そしてなぜ最終試験を開発するのかを理解するために、私は街に、私たちの場合はキャンパスの中庭に出ました。 クリップボードを片手に、通りすがりの教授たちに期末試験について尋ねてみました。 彼らの回答には、様々な評価の目的や戦略、そして期末試験を実施することについての考えが反映されていました。

総合的な最終試験を行う理由は何ですか?

「最終試験にもう一度含まれていないと、学生が初期の教材を忘れてしまうのではないかと心配しています」

「学生が持っていることを確認するために、学期全体の仕事を最終試験でテストします!”

「期末試験は、1 学期分のコンテンツをまとめるべきであり、つながっていないものをつなげるものでなければならない」

教授が総合的な期末試験を実施する主な理由または目的は 2 つあることは明らかなようです。 私は、多肢選択式や短答式などの客観的な項目をまとめて、1 学期分の内容をカバーする教員を「見せる」という見出しで分類しています。 “Show “ファイナルは、学生が知識を習得していることを証明するために、学生に学期の内容をすべて勉強し、復習させることを目的としています。 ショー」ファイナルを実施する教授は、学生に次のコースへの準備をさせたい場合が多い。 彼らは、学期全体の内容を強制的に学習・復習することで、学生が次のコースの初期段階で「即戦力」になれると信じている(あるいは期待している)。 この考えに従えば、「本番」のファイナルは、次のコースの事前対策であると同時に、現在のコースの事後対策でもあるのです。 教授の中には、この事後評価を、学生がその分野を続ける能力があるかどうかの自己評価として使ってほしいと考える人もいます。

「ショー」ファイナルを理解するもう1つの方法は、学習階層の初期レベルでの評価と考えることです。 ベンジャミン・ブルームと同僚の委員会は、最もよく知られている学習階層の1つを開発しました。 The Taxonomy of Educational Objectives(Bloom, Engelhart, Furst, Hill, and Krathwohl, 1956)では、学習プロセスを学習成果の梯子を登るように捉えています。 学習者は、下の段をうまく登って初めて上の段にたどり着くことができます。 ブルームの分類法では、6つの学習レベルがあり、単純な知識の成果から始まり、理解、応用、分析、合成、評価と次第に複雑なレベルへと進んでいく。

私が長年見てきた「ショー」ファイナルの大半は、学生の知識の達成度、コンテンツの基本的な理解、そしておそらく素材を応用する能力を測定しようとするものでした。 ショー」ファイナルでの成功は、学習の梯子を上るための基礎を証明するものです。 生徒が分析や合成などの高いレベルの学習を行う前に、必要な用語、基本的な概念、基本原則を習得する必要があります。 例えば、学生は、競合する代替デザインとそのそれぞれの長所・短所を学ぶまでは、与えられた研究デザインの適切性を批判することを期待されるべきではありません。 “

「使用」ファイナルは、学生に客観的かつ短答式の試験項目をまとめて勉強させることで、しっかりとした知識の基礎を身につけさせることに関心のある教授が使用します。 使用」ファイナルを実施する教授は、一般的に、学生がより高いレベルの学習を行うことで、1学期分の蓄積された知識を使用する能力を示すことを望んでいます。 使用」の期末試験には少なくとも2種類あり、学生に知識を使って最終製品を生産または作成することを求める期末試験と、習得した情報の応用を必要とする問題または課題を提供する期末試験があります。 1つ目のタイプの例としては、学部のシニアセミナーで、学生に独自のパーソナリティ理論を構築することを求める持ち帰り式のファイナルがあります。

2つ目のタイプの「使用」ファイナルの例は、問題解決やタスクの完了を伴うことが多く、学生が与えられたデータセットに対して分析を行うことを要求する統計学のコースで見られます。 これらの教授は、平均と分散の知識がなければANOVAを行うことはできないと想定しています。 もう一つの例は、学生にJAVAプログラミングの知識を証明するために、与えられたプログラムのエラーを見つけることを求める期末試験です。

ブルーム分類法を使用して、「見せる」試験よりも「使う」試験の方が高次の学習を評価すると考えると便利かもしれません。 ジャーナル論文の批評や、色覚に関する2つの理論の比較は、ブルーム分類法の分析や評価のレベルの学習を示しています。 どちらも、資料を構成要素に分解し、各要素の関係性を明らかにして評価する能力が求められます。

まとめますと、総合試験を利用する教授陣には、そうする理由があることがわかりました。 教授陣は、学生に、いくつかの項目に答えることで蓄積された知識を示すか、何かの最終製品を作ったり、問題やタスクを完了することで専門知識を使用してほしいと考えています。 教授は、知識の基礎を築くことを最も重視する、入門的な教材や一連のコースの最初のコースを教えるときに、「見せる」最終試験を行う傾向があるようです。 “分析や合成などの高次の学習の証拠を必要とする「使用」の最終試験は、一連のコースの最後に教えるコース、キャップストーンコース、またはおそらく実習やインターンの経験の最後に行われることがほとんどです。 もちろん、教授の中には、上記のいずれのタイプの総合的な最終試験も行わないことを好む人もいます。 典型的には、これらの教授は、学生の学習を順次評価するために評価プログラム(すべての試験、論文、およびプロジェクトを含む)を構成しており、総合的な最終試験によって内容をバックトラックまたは再テストすることに興味がありません。 このような教授の多くは、期末試験や論文は、4回の試験のうちの4回目のような、カバーされていない教材の最後の評価となります。 この評価方法は、内容が独立しているコース(例えば、コースが一連のコースの一部ではない)や、コースの教材が累積的な性質を持っていない場合(例えば、実験室での測定に関する独立したコース)に最も適しています。

最終試験の種類や形式はどのように選択されますか?

「私はいつも多肢選択式の最終試験を行っています。”

「私の最終試験は、他の3つのコースの試験と同じように、エッセイ試験です」

「最終試験は、シニアコースで行う唯一のテストです」

たとえティーチングアシスタントの助けがあったとしても、非常に大きなクラスを教えている教授は、大量のエッセイの最終試験を採点するという、困難で時間のかかる作業に直面しています。 そのため、学期末の成績提出期限や休暇中の旅行の手配などのロジカルな問題から、テストの形式が決まることがあります。

学期中の学習レベルに合った期末試験の形式を選択してください。 コース終了時の学生の評価用紙によく書かれているのが、この授業と試験のミスマッチです。 学生は、問題についての議論や討論を中心としたシニアセミナーコースの最後に、教授が一連の事実やテキストに基づいた多肢選択問題を出題するのは公平ではないと考えています。

複数のテスト形式を選択し、他のコースの評価を補完します。 今日の専門家(Gardner, 1993)が、生徒の学習に対する好みの違いに注意するように言っているように、私たちは、テストを受けて学習を実証する能力における生徒の違いを認識する必要があります。 大勢の生徒にテストの好みを尋ねると、多肢選択式よりも小論文を好む生徒と、その逆の生徒が同じくらいいます。 このような理由から、私は教員ワークショップにおいて、コース内で複数のテスト形式を使用することを常に強調してきました。 複数の試験形式を使用するということは、多肢選択式、小論文、持ち帰り試験を組み合わせたり、多肢選択式と小論文の項目を同じ試験に含めたりすることを意味します。 期末試験は他のコースの評価と補完関係にあるべきです。 言い換えると、すべての時間ごとの試験でM-Cと短答の両方の項目を使用している場合、最終試験も同様にすべきです。また、時間ごとの試験でM-C、短答、または小論文の項目を使用している場合、最終試験では学生を混乱させるほど異なる項目タイプを使用すべきではありません。 学期の計画を立てるとき、教授はどのようなタイプの評価を要求するかだけでなく、どのように多くの評価を行うかを考慮する必要があります。 主要な論文やクラスプロジェクトを必要とするコースを除いて、測定の専門家は1つまたは2つ以上の評価要素を必要とすることを提案しています。 誰にでも悪い日はあります。 学生は、たった1回の成績不良でコース全体の成績が左右されることを恐れるべきではありません。 私は、コースの評価の数と種類が多ければ多いほど、最終的なコースの成績が学生の学習の正確な(有効で信頼できる)尺度となる可能性が高くなると強く信じています。

最終試験はより難しく、より重くなっていますか?

「私の試験は、期末試験まではかなり簡単です」

「私は、授業の最後の4週間をカバーする期末試験を行いますが、他のユニット試験よりも重視しています」

試験の難しさ。 どのくらい難しいか」という質問への答えは、難しさの解釈によって異なります。 難易度が、学習の低いレベルではなく高いレベルでの達成度をテストすることを意味する場合、包括的な「使用」の最終試験は、他のコースの評価よりも難しいと言えますし、そうすべきだと思います。 しかし、難易度をアイテムに正しく回答した学生の数として定義する場合、「show」ファイナルまたは非包括的なファイナルの難易度は他のコースの評価と異なるべきではないと主張します。 コースの最後の3ユニットのみをカバーする第4回(または最終)試験は、他の3つの試験と同様のスコア分布を持つべきです。 総合的な「本番」試験の項目の難易度指数 (項目に正しく回答した学生の割合 – Ory & Ryan, 1993) は、以前に他の試験で実施された項目の難易度指数と同様であるべきです。 最後の試験だからといって、過去の試験よりも高い評価を与えず、低い評価を与える理由にはなりません。 そうしないといけないという教育的な弁明を私はまだ聞いたことがありません。 残念ながら、期末試験を他の学期の試験よりも難しくしようとするほとんどの試みは、教授が見慣れない項目タイプ、トリッキーな表現、または些細な情報のテストを使用するという結果になります。 期末試験に割り当てられる加重の量は、コースの成績を計算するためにコースで使用される他の評価の数および種類に依存します。 すべてのクラスに適用できる単一の公式はありません。 明らかに、大規模なクラスプロジェクトやタームペーパーを必要とする「使用する」期末試験は、最終的なコースグレードに大きなウェイトを置く必要がありますが、12ユニットのうち最後の3ユニットをカバーする期末試験は、他の3つまたは4つの試験と同等にウェイトを置くことができます。 最終成績の大半を占める大規模なコース終了プロジェクトや論文の価値は確かにありますが、私はコース評価の数を減らすよりも増やすことをお勧めします。

試験のスコア分布。 各試験に標準スコアを使用していない場合、希望する加重と実際の加重は、各試験の標準偏差に応じて異なる可能性があることを覚えておいてください (例,

学生のやる気や報酬を得るために期末試験を利用していますか?

「期末試験の前に生徒に自分の立ち位置を知らせ、どのような成績を望むかによって、受けるか受けないかを決めます」

「生徒に期末試験を受けるか、論文を書くかの選択肢を与えます」

モチベーションを高めるためです。 ほとんどの教授は、期末テストの重みを最も高くすることで、学生に期末テストの準備をさせるよう動機づけていると言ってもよいでしょう。

また、一部の教授は、学生がクラス内の試験を受ける、自宅での試験を完了する、または論文を書くなど、いくつかの評価方法から選択できるようにすることで、学生の最終試験でのパフォーマンスを動機付けようとするかもしれません。 しかし、代替の評価方法を使用する際には、教育上の懸念があります。 異なる評価の比較可能性を判断することは困難です。 持ち帰り試験の成績は、クラス内の試験の成績と比較できるでしょうか? 論文を書くことは、最終試験を受けることに匹敵しますか? また、提出された異なる評価の数が均一でない場合、代替評価に評点を割り当てることは困難です。 1つの論文しか提出されない場合、比較のために使用する他の論文がないため、論文を評価するための慎重に作成されたルーブリックがあったほうがいいでしょう。

報酬。 教員の中には、学生のやる気を引き出すというよりも、最終試験を利用して学生に報いることに興味を持っている人もいるようです。 このような教授は、期末試験を要求するのではなく、学生が希望するコースの成績に到達するための手段として提供しています。 学生が自分のコースの成績に満足していれば、試験を受けなくてもよいのです。 この戦略には2つの懸念があります。 1つ目の懸念は、先に述べたように、採点比較のために提出された試験の数が足りないのではないかという問題です。 2つ目の懸念は、選択式の最終試験が最後の数週間の授業内容を測る唯一のものである場合にのみ当てはまります。 もしそうであれば、教授はなぜ何日もかけて、テストされないかもしれない教材を準備し、教えるのでしょうか。 最後の時間ごとの試験から最終試験までにカバーされた内容は、それほど重要ではないのでしょうか? すべての学生が成績だけでやる気になるわけではないことは承知していますが、コースの最後の数週間の評価を怠ると、学生の関心が薄れてしまうのではないかと心配しています。

学生の学習を向上させるためにフィードバックを行っていますか?

「学生は次の学期の初めに、私のオフィスで期末試験の結果を受け取ることができます」

「私の学生は、期末試験のスコアを通して、自分が何を学んだかを知ることができます」

多くの教授が、学生が何を学んだか、何を学んでいないかをフィードバックするために、テストを使用することの重要性を述べているのを聞いたことがあります。 しかし、そのような教授の多くは、「貴重な」授業時間を試験結果の検討に費やすことを嫌がります。 その代わりに、学生は、試験について質問がある場合は、教授のオフィスアワーを利用するように言われることが多いのです。 よくある間違いや誤解を議論するために授業時間を使わないのは、さらなる学習の機会を逃すことになります。 残念ながら、最終試験を使って(その分野のコースワークや研究を進めるための)フィードバックを行うことに興味を示しながら、そのための努力をほとんどしない教員にも同様のことが言えます。 生徒へのフィードバックは、単に点数を知るだけではありません。

学生は、教授または学科の事務局から、試験や論文を返却する方法がなければなりません。 これは当然のことのように聞こえますが、最終試験のスコアをドアに貼るだけで、個々の試験や論文をわざわざ返却しない教授をどれだけ知っているでしょうか。

論文やプロジェクトに対するフィードバックは、評価者が作品の何を見ていて、何を見ていないのかを学生が知ることができるよう、十分に詳細であるべきです。 試験のコピーは、答えと一緒に、鍵のかかった掲示板やWebサイトに掲示されるべきです。 理想的には、正解に加えて、簡単なコメント、テキストの参照、またはその問題で最もよくある間違いを提示することができます。 試験問題を公にしたくないという気持ちは、学生の学習意欲を高めるための大きな関心事に取って代わられるべきです。

生徒の質問や懸念に対応できるようにしておきましょう。 これらの条件が満たされた後も、さらなる議論のために自分自身を利用できるようにすることが重要(かつ必要)です。 学生には、何か質問があればEメールを使うか、次の学期にあなたのオフィスに来るように伝えてください。 この時点であなたは、期末試験を受けた学生が少ないことを思い出し、フィードバックを受けるのは教授と学生の責任であると考えていることでしょう。 私はあなたの考えに答えて、学生の興味のなさや無責任さは、私たちが過去に有益なフィードバックを提供しなかったことでどれほど助長されたかを尋ねます。 学生が試験や論文をわざわざ手に取るのは、そこに書かれているのが文字通りの成績や数字だけだとしたら、なぜでしょう?

結論

私のあまり科学的ではない教員への調査では、期末試験の使用には多くの方法と理由があることがわかりました。 教員が説明した信念と実践は、健全な教育学と学習理論に従ったものもあれば、あまり支持されていないものもあります。 その基盤が何であれ、期末試験は単なる作成者の個性の反映ではなく、いくつかの考慮事項に熟慮して作成された製品であるべきだと私は結論づけます。 私は、教育学と一般的な試験の実施に関する議論の中で、これらの検討事項のいくつかを明らかにしようとしました。 ご意見、ご感想、反対意見などをお待ちしています (E-mail: [email protected])。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です