TESOL@ペンシルベニア大学

University of Pennsylvania 教育学大学院へのフルブライト奨学金留学

Spring Term 大学院授業の振り返り4 言語評価法

春学期に履修したTESOL専攻の4つの科目のうち、選択科目の1つであるLanguage Assessment言語評価法について書こうと思う。

英語の授業で訳読方式を私の周囲でほとんど見かけなくなってからしばらく経つ。授業ではコミュニカティブな活動が多くなり、意見を発表したり内容をまとめたりプレゼンテーションを行ったりすることが増えた。

さらに2020年度の大学入試改革である。しばらくは移行期間ということで、従来の英語試験も併存されるようだが、スピーキングも含めた4技能を測る民間試験の大学入試への活用が本格的に始まるため、コミュニカティブな授業の増加が見込まれる。(あるいは、学校教育では行われず民間試験のための塾や予備校に丸投げになるかも、という懸念もある。)

さて、コミュニカティブな授業やアウトプット活動を重視する授業を行ったらその評価もコミュニカティブな能力を測るテストでなければならない。スピーキング能力とライティング能力をどのように計測したらよいのか、そして4技能を統合させた活動とその評価はどのように行ったらよいのか、特に日本の学校教育の場で、クラス40人や学年320人を公平、公正で効果的に評価する現実的で持続可能な方法へのヒントを得たいと思い、この授業を履修した。

 

Week 1. イントロダクション
論文1本。言語評価のさまざまな種類と、それぞれの利点と問題点について概要の講義と議論。

 

Week 2. 言語評価の理論的枠組み
論文5本。主にvalidityとreliabilityの観点から、さまざまな言語評価法を分析、議論。

 

Week 3. リスニングの評価
論文4本。リスニング能力をどう測るか議論。評価法として、ディクテーションやインタラクションが適切かどうかを理論的背景から分析、議論。

 

Week 4. スピーキングの評価
論文6本。スピーキング能力をどう測るか議論。holisticな方法とanalyticな方法の両方を比較し、実際のスピーキングのサンプル音声を評価し議論。

 

Week 5. リーディングと文法・語彙の評価
論文6本。リーディング能力をどう測るか議論。訳出はリーディング能力を適切に計測できるか理論的枠組みから照らし合わせ分析。語彙サイズの計測方法、四択の妥当性についても議論。

 

Week 6. ライティングの評価
論文5本。ライティング能力をどう測るか議論。コンピュータによる評価と人間の評価の差異、トピックによるパフォーマンスの差異、評価者間での差異について議論。

 

Week 7. タスク中心の評価とLSPのための評価
論文5本。タスクを与えることによる評価法と、一般的なテストとを比較し議論。Language for Specific Purposes(LSP)での評価法、例えば香港の英語教員採用試験問題やイギリスでのESL教員の試験を分析し議論。

 

Week 8. プラグマティクスの評価
論文5本。プラグマティクス能力をどう測るか議論。実用性、authenticityを柱に、実際の英語の授業でどのように評価を組み込めるか議論。

 

Week 9. グループプレゼンテーション1
グループでコンテクストを自由に設定し、英語能力を測定するためのテストを作成し、プレゼンテーションを行う。聞き手はその評価を行う。

 

Week 10. グループプレゼンテーション2
Week 9の続き。グループでコンテクストを自由に設定し、英語能力を測定するためのテストを作成し、プレゼンテーションを行う。聞き手はその評価を行う。

 

Week 11. alternative assessment
論文7本。ポートフォリオ、ピア・アセスメント、自己評価など、従来の評価法とは異なる評価法の妥当性と実用性について議論。

 

Week 12. 若年層の評価法
論文5本。幼児や小学生など、従来のテストでは評価しきれない若年層の英語能力をどう評価するか具体的な手法について議論。子ども向けの英語テストであるTOEFL Primaryなどをサンプルに分析し議論。

 

Week 13. テストの影響
論文4本。テストや評価の学習者へ与える影響と、実際の授業で行われていることと評価の内容との連関について議論。

 

Week 14. 評価法の今後
論文5本。コンピュータによる評価や、World Englishesという観点から今後の評価法の可能性について議論。

 

その他の課題

1.グループ課題(第3、4、5、6、7週)
5人グループで、毎週異なるテーマ(リスニング、スピーキング、ライティング、リーディング、教員採用試験)に沿って5週間行われる。実際の問題サンプルや解答サンプルを分析し理論的枠組みと連関させてレポートを書く。

 

2.テスト開発プレゼンテーションとレポート提出
5人グループで自由にコンテクストを設定し、評価のためのテストを作成し30分間のプレゼンテーションを行う。プレゼンテーションの内容には、context, purposes, test-takers, target language use, administraion, construct, sample questions, rubric, validity, reliability, authenticity, washback, limitationを含めなければならない。私たちのグループは、フィラデルフィアに住む難民と移民の大人を対象とした英語教育機関での使用を想定した、短時間で4技能全てを測定するテストを作成した。他には、アメリカで働く英語を母語としない看護師の英語スピーキング能力試験を開発したり、アジアの民間英語教育機関のEFL教員採用試験を開発したグループもあった。プレゼンテーション終了後に20分間のディスカッションとQ&Aを行う。その後、このディスカッションと聞き手から提出されたフィードバックシートを元に修正を加えたテストとレポートを提出する。

 

3.評価に関する最終レポート
各自で自由にテーマを設定し、評価に関する研究レポートを提出。私は、東京都で実施している英語教員採用試験の筆記試験と実技試験について理論的枠組みから分析した。当初は冒頭に書いた通り、40人クラス規模の日本の高校で継続的に実施できるスピーキングとライティングのテストの分析、開発、展望を論じる予定でいたが、第7週で世界各地の英語教員採用試験や現職英語教員能力試験や英語教員資格取得の試験等を分析し、その多様さが興味深かったこともあり、このテーマとした。高校でのアウトプット活動の評価は復職後に日常的に行うことになるので、当時最も関心を持ち、新たな視点を得られそうなテーマを論じ提出した。

 

 

言語評価といってもその評価の枠組みは実に多様で、スキルによって評価方法も異なるし、対象者の年齢や英語レベル、評価の目的などコンテクストによって適切な評価方法も変わってくる。この授業では全体を網羅し、必要な情報やリソースを得られたので、自分の教えるコンテクストで評価方法を再構築する際のヒントが多く得られた。最終成績はAをいただいたが、実際に日本の学校教育の現場で生徒の英語の4技能を多様な手法で評価する仕組みを構築していくには、多くの試行錯誤が必要になるだろうと思う。

 

 

にほんブログ村 海外生活ブログ 海外留学(アメリカ・カナダ)へ
にほんブログ村

 


アメリカランキング