Y、成績評価

 

Y-1 測定と評価

(1)       測定とは

測定=一定のルールに従って対象に尺度(数値の集合)をあてはめて、数値を付与すること

(2)       評価とは

教育評価=指導の結果が目的、目標に達しているかを判断すること

(3)       評価の機能

@          妄評への達成度や学習の進み具合を診断する

A          教師が指導を振り返って反省し、以後の指導の改善に役立てる

B          児童生徒が自己評価し、確認するのを助け学習を動機づける

C          学校の学力水準を明らかにし、父母や社会の批判に答えその協力を得る→アカウンタビリティー

cf.

スリーパー効果=始めは情報の信憑性が高い方を受け入れていても、時間が経てば信憑性の低い情報も受け入れるようになってくるという現象。情報の内容は覚えていても、情報の信憑性については記憶があやふやになりやすい。

ブーメラン効果=説得的コミュニケーションにおいて,受け手の意見や態度がコミュニケーションの送り手の唱導方向とは逆の方向に変容し,結果的に説得者の意図とは反対の効果がおこること

 

Y-2 テストの備えるべき条件

(1)       信頼性

信頼性=測定誤差が小さく、何回行っても同じ結果が得られるか

@          再検査法

同じ生徒を対象にし、期間をおいて同じテストを2回繰り返して、2回のテスト得点の間の相関係数を求める方法

A          平行検査法

同じ領域をカバーするテストを2つ作り、両者を実施して相関係数を求める方法

B          折半法

1つのテストは通常、数多くの問題項目から成り立っている。例え20題で各5点、計100点満点のテストがあるとする。20題を奇数番号の10題と偶数番号の10題というように2分し、50点満点のテスト2つとして別々に集計する。すると、1人の生徒につき2つのテスト得点が求められる。これら2つのテスト得点の間の相関係数を求める方法である。

(2)       妥当性

妥当性=測定しようと意図したものを、正しくとらえている程度

@          内容的妥当性

テスト問題を作成する際に、指導目標となった範囲から隔たりなく問題を選んできたか、が問題となる

A          経験的妥当性

テストの結果と他の何らかの基準(外部基準)との相関を検討する。進学適正と大学の入学後の相関などは、予測的妥当性といわれる

B          統計的妥当性

1つのテストは、多数の下位テストで成り立っている。それらの下位テストの相関を調べることで、下位テストの妥当性を調べる

(3)       その他

客観性=採点基準が明確で、誰が採点しても同じ結果が得られるテスト

識別性=能力の高い人と、低い人の間にはっきりとした差が出ること

実用性

@          特別な危惧などの準備が不用で実施が容易であること

A          採点が容易であること

B          標準テストの場合はマニュアルが整っていること

C          かけた時間や労力に対して得られる情報が多いこと

D          安上がりに実施、採点ができること。つまり経済性を考量すること

 

X-3 評価の種類

(1)       比較の基準による分類

@          相対評価

集団内での相対的な位置を示し、評価すること

A          絶対評価

他の人たちの成績には無関係に、あらかじめ定められた目標や基準を、個人が満たしているかどうで評価すること=到達度評価

B          個人評価

特定の個人がどんな特徴をもっているのか、また以前より進歩したのかどうか、という観点から評価すること

(2)       実施の時期による分類

@          診断評価

指導計画を立てる際に、事前に児童生徒のレディネスをつかむために用いる評価

A          形式的評価

学習活動の途中で、児童生徒の実体を捉え、それに基づいて指導計画を変えたり、補充的指導をしたりする評価のあり方

B          総括的評価

一連の学習活動の終わりに、成果を確かめる目的で行われる評価

(3)       教育評価の将来

【批判】

@          記憶、理解を中心にした狭い領域だけが測定されがちである

A          総括的である

B          評価が教育を歪めている

【今後のあり方】

C          減点主義から加点主義の発想へ

D          紙と鉛筆によるテストから、作品、観察、実演ほか多様な方法の利用へ

E          記憶重視から創造性や問題意識を含めて問う方向へ

F          教師のみによる評価から、児童生徒による自己評価を含めた総括的な方法へ

cf.

ポートフォリオ評価=児童・生徒が各自の学習活動で生み出した様々な作品やレポートなどを個人ごとに蓄積し、進歩のプロセスを分析する

 

Y-4 適正な評価を阻害するもの

(1)       ハロー効果(光背効果、後光効果)

ハロー(halo)=聖像などの背後にみられる光の輪のこと

測定すべき特性そのものではなく、観察対象に対する良い(悪い)印象によって、測定結果が影響されること

(2)       ピグマリオン効果(教師期待効果)

ローゼンサールとヤコブソンによって見出された原理。教師が期待をもった生徒が教師の期待の方向に沿って実際に変化しうる現象

 

Y-5 学力の評価

(1)       学力とは

教科内容の知識や技能→意欲、思考力、判断力、表現力(新しい学力観)

ブルームの学力3領域

@          認知的領域

知識や理解などの側面

A          情意的領域

興味、関心や価値・態度的な側面

B          精神運動適量生き

手洗いの技能や運動の技能の側面

(2)       学力の程度の示し方

@          学力偏差値

学力偏差値=(個人の得点−同じ年齢集団の平均値)÷標準偏差×1050

A          成就指数

成就指数=能力に応じた学力を確かめるために指数

教育指数=教育年齢を生活年齢で割り100倍したもの

成就指数=教育指数÷知能指数×100=学力偏差値÷知能偏差値×100=教育年齢÷精神年齢×100

知能の割に学力が劣っている場合はアンダー・アチバーあるいは学業不振児、上回っている場合はオバー・アチーバーという

 

Y-6 学力テストの実際

(1)       学力テストの作成と種類

口頭テスト→筆記テスト中心に

@          論文体テストと客観テスト

@、論文テスト

長所=表現能力、論理的思考能力、態度などを調べることができる。問題作成が容易である

短所=問題数が少なくなる。採点が主観的になる。子どもがやまをはる。

A、客観テスト

真偽法、完成法(穴埋め方)、多肢選択法、組み合わせ法など

長所=誰が採点してもOK、出題を多くでき信頼性を上げられる。

短所=偶然に正答が生まれる。暗記学習を誘導しやすい

A          標準テストと教師作成テスト

@、標準テスト

          信頼性や妥当性を上げるために標準化が行われている

→標準化の手続き

壱、評価の目標を明確化

弐、目標に沿った多数の項目を作成

参、比較的少数の集団に予備テスト

四、適切な項目を選択

伍、大規模な集団に本テスト

六、本テストの結果についての妥当性や信憑性を検討

七、平均点や偏差値の算出

八、テスト実施のマニュアル作成

A、教師作成テスト

          学級内部での得点比較しかできない

          教師が知りたい情報を得るためのテスト作成ができる

(2)       テストの実施

@          生徒の緊張を誘わない

A          注意事項は開始前に行い、開始後は集中力を削がないように注意する

B          不正行為の防止に努める

(3)       採点の公正を期する

@          採点は名前を見えなくして行う

A          採点基準の作成

B          生徒単位ではなく、問題単位で採点する

 

Y-7 知能と知能テスト

(1)       知能とは何か

@          抽象的な観念によって考える能力(ターマン)

A          洞察の能力(ケーラー)

B          思考作用であって、一定の方向を維持しようとする傾向、目標達成の順応力、および自己批判能力をもつもの(ビネー)

C          目的をもって行為し、合理的に考え、効果的に環境に対処する能力の総括(ウェクスラー)

(2)       知能テストの歴史

@          ビネー式テスト(ビネー・シモン式知能検査)

1904年 フランス文部当局が知的障害児を正常児から区別するためにビネーとシモンに用具の制作を依頼

1905年 ビネー・シモン知能尺度を作成

1908年 問題を年齢別に配列する改訂

1911年 成人用を加える改訂

A          スタンフォード・ビネーテスト

          1916年にターマンが作成

          精神年齢と生活年齢の比による知能指数という表示方法が初めて採用

B          集団検査の開発

ヤーキーズによって軍隊検査が創案(英語を用いるα式と、図形・記号・数字だけを用いるβ式の2)

→妥当性に疑問視

C          ウェクスラー式知能検査

          WAIS(ウェクスラー成人知能尺度)WISC(ウェクスラー児童知能尺度)2

          言語性IQ、動作性IQ、全検査IQ3つのIQが算出

          もっとも良く用いられる個別式知能検査

(3)       知能の構造

@          スピアマンの2因子説

A          ギルフォードの立体モデル

内容・操作・所産の3次元の組み合わせで知能を説明

B          サーストンの多因子説

知能は少なくとも10個の因子から成り立つとする。そのうち空間知覚、知覚の速さ、数、言語理解、言語の流暢さ、記憶、推理の7因子は、現在の知能検査でも参照されることが多い。

(4)       知能の発達

          幼児期から青年期にかけて発達史、20才頃にピークを迎える(知能テストのデータとして)

          年齢によって変化する事例もあるが、知能の恒常性を唱える説も存在する

 

Y-8 知能テストの利用

(1)       示し方

@          粗点

同じくラスで比較する場合しか利用できない

A          精神年齢

次第に困難になる問題系列を用意しておき、何処まで解けるかを見る問題の合格基準に達したか否かで精神年齢を判定する

B          知能指数

IQ=精神年齢÷生活年齢×100

C          知能偏差値

D          偏差値知能指数

(2)       結果の解釈と利用

@          唯一の絶対的な数字ではない

A          現在の知能テストで測定されている能力は、非常に限定されたものでしかない

B          知能テストに備えての練習は効果があるが意味はない→知能テストの限界

C          1つの道具として利用する心構え