關(guān)于美國通用設(shè)計(jì)測評(píng)對(duì)我國教育測評(píng)的啟示
許銳
摘要在全納教育日益發(fā)展的背景下,通用測評(píng)設(shè)計(jì)(universal design for assessment)已經(jīng)成為美國有效衡量學(xué)校教育質(zhì)量,評(píng)估學(xué)生學(xué)業(yè)成績,提高教學(xué)質(zhì)量的有力措施。從設(shè)計(jì)測驗(yàn)的第一步入手,將所有學(xué)生群體考量在測試范圍內(nèi),力圖讓所有學(xué)生能在測試中充分展示真實(shí)能力,有效地節(jié)省了評(píng)量調(diào)整帶來的消耗。本文通過對(duì)美國通用設(shè)計(jì)測評(píng)的介紹,試圖為我國教育測評(píng)帶來新的啟示。
1 全納教育環(huán)境下的教育測評(píng) 全納教育(Inclusive Education)的理念于1994年由聯(lián)合國教育科學(xué)文化組織在西班牙薩拉曼卡召開的“世界特殊需要教育大會(huì)”上正式提出。這一概念的提出主要是由于現(xiàn)有的教育體制不能公正地對(duì)待所有群體并且難以關(guān)注到每一個(gè)學(xué)生。 隨著我國經(jīng)濟(jì)和教育的發(fā)展,全納教育的理念逐漸深入人心,越來越多樣的群體進(jìn)入普通學(xué)校。(智力落后、肢體殘疾、視覺障礙和聽覺障礙學(xué)生,以及外籍學(xué)生、貧困學(xué)生、弱勢群體子女等等)我們的標(biāo)準(zhǔn)化教育測評(píng)并沒有對(duì)之作出應(yīng)對(duì)。如何做到教育公平是我們努力解決的問題,在設(shè)計(jì)測驗(yàn)之初是否也應(yīng)該考慮到所有學(xué)生都有權(quán)在考試中展示學(xué)習(xí)成果。不僅是有特殊需要的學(xué)生,所有學(xué)生都應(yīng)該受益于公平的考試。這也通用設(shè)計(jì)測評(píng)最根本的出發(fā)點(diǎn)。 2 通用設(shè)計(jì)測評(píng) 通用設(shè)計(jì)力求使設(shè)計(jì)出來的產(chǎn)品能夠?yàn)樗腥朔?wù)。通用設(shè)計(jì)測評(píng)就是讓考試盡可能全面的服務(wù)與所有考試者,而且使在試卷設(shè)計(jì)之初就考慮所有因素(而不是設(shè)計(jì)完成之后再翻修)。在教育領(lǐng)域,通用設(shè)計(jì)測評(píng)促使大型標(biāo)準(zhǔn)化測驗(yàn)適用于如今更加多樣的受試群體。這樣我們可以更清楚地了解學(xué)生的知識(shí)水平和能力。通用設(shè)計(jì)測評(píng)需要注意的包括:(1)結(jié)構(gòu)可以測量;(2)尊重參加考試者的多樣性;(3)簡明易懂的試卷;(4)清晰的格式字體;(5)改變要以不改變?cè)夂碗y度為原則。 通用設(shè)計(jì)測評(píng)是在不改變?cè)u(píng)估標(biāo)準(zhǔn)、不降低難度的前提下在增加考試的容納度,它不能取代評(píng)量調(diào)整和替代性評(píng)估。就算一個(gè)包含了所有通用設(shè)計(jì)元素的良好的測評(píng),在考試地點(diǎn)、時(shí)間、作答方式等方面依然需要依據(jù)學(xué)生的具體情況作出調(diào)整。但是,考試在設(shè)計(jì)之初就應(yīng)該把這些一般性調(diào)整考慮在內(nèi)。通用設(shè)計(jì)測評(píng)并不是為了眷顧特殊學(xué)生而存在,所有學(xué)生都應(yīng)該獲益于公平的考試。 3 通用設(shè)計(jì)測評(píng)原則 通用設(shè)計(jì)測評(píng)是一種教育測評(píng)方法,它的特點(diǎn)就是要盡可能適用于所有學(xué)生,包括有特殊需求的學(xué)生。因此,通用設(shè)計(jì)測評(píng)就是要全納的包括所有學(xué)生,對(duì)所測知識(shí)內(nèi)容有清晰明確的界定同時(shí)測驗(yàn)項(xiàng)目也要無偏見的呈現(xiàn)。而且在測驗(yàn)設(shè)計(jì)之初就要考慮便于評(píng)量調(diào)整,具有簡單清楚和直觀的考試說明和步驟以及最大程度的實(shí)現(xiàn)易讀易懂。 3.1 包容性強(qiáng) 當(dāng)測驗(yàn)第一次被建構(gòu)時(shí),就要考慮到所有學(xué)生。(AERA, APA, NCME, 1999; National Research Council, 1999).雖然有時(shí)可以適當(dāng)限制被測群體(例如就業(yè)安置測驗(yàn)、選拔測驗(yàn)),但在公共教育問責(zé)制測驗(yàn)中并不合適,所有學(xué)生都應(yīng)該有機(jī)會(huì)獲得獎(jiǎng)學(xué)金。隨著評(píng)估的目標(biāo)群體的增加,評(píng)估需要對(duì)不斷增長的需求(多樣性的增加、普通課程中學(xué)生種類的增加、對(duì)學(xué)生更加重視和負(fù)責(zé))做出反應(yīng)。 通用測驗(yàn)設(shè)計(jì)原則第一條——(Center for Universal Design, 1997)測驗(yàn)要公平的發(fā)揮作用。當(dāng)適用于大規(guī)模測驗(yàn)時(shí),這條原則要求所有所有學(xué)生都有權(quán)參與,無論他們有什么認(rèn)知能力,還是什么文化、語言背景。評(píng)估需要測量學(xué)生在一個(gè)寬泛能力和技能上的表現(xiàn),從而確保有不同學(xué)習(xí)任務(wù)的學(xué)生在同一個(gè)考察內(nèi)容有機(jī)會(huì)展示能力。這并不意味著標(biāo)準(zhǔn)應(yīng)該放寬或者考察內(nèi)容應(yīng)該有所改變。通用標(biāo)準(zhǔn)測驗(yàn)設(shè)計(jì)必須權(quán)衡考量內(nèi)容和成績標(biāo)準(zhǔn)制定出相同深度和廣度的測驗(yàn),并且針對(duì)認(rèn)知的復(fù)雜性制定具體細(xì)節(jié)。運(yùn)用不同的格式、技術(shù)和設(shè)計(jì)涵蓋所有學(xué)生。這在測驗(yàn)設(shè)計(jì)的一開始就必須明確,為了做到公平,評(píng)估需要用同一個(gè)標(biāo)準(zhǔn)衡量所有學(xué)生的成績。1993年,Algozzine提出將全納的原則適用于評(píng)估,以避免被測組間的分離?!叭菪詮?qiáng)”明確的含義是,試測應(yīng)該提取所有希望參與到最終測驗(yàn)的學(xué)生樣本。包括有各種障礙的學(xué)生、英語不熟練的學(xué)生和不同種族、民族、社會(huì)階層的學(xué)生。試測盡可能抽取廣泛的學(xué)生樣本不僅可以確定題項(xiàng)是否含糊不清、有誤導(dǎo)性或是導(dǎo)致某些特定群體的學(xué)生無法完成,而且還能確保測驗(yàn)制作完成后適用于所有學(xué)生。 3.2 結(jié)構(gòu)界定明確 好的測驗(yàn)設(shè)計(jì)有一個(gè)重要的功能,就是確保測量到想要測量的內(nèi)容。就像Popham 和 Lindheim1980年提出:“一個(gè)測試開發(fā)項(xiàng)目開始于對(duì)所測技能和態(tài)度特征的慎重思考。”就像通用建筑設(shè)計(jì)為所有人消除公共和私人建筑的身體、感官、認(rèn)知障礙,通用測驗(yàn)設(shè)計(jì)消除測驗(yàn)中所有非結(jié)構(gòu)導(dǎo)向的認(rèn)知、感官、情緒和身體的障礙。特定評(píng)量調(diào)整的運(yùn)用是否使結(jié)構(gòu)測驗(yàn)設(shè)計(jì)無效,例如,不同的群體對(duì)于閱讀有不同的定義,有些人可能把它定義為通過書面文字建構(gòu)意思,有的則可能有更廣泛的理解,而不是針對(duì)信息是如何獲得的。后者的說法是專為視障學(xué)生提出,很少有學(xué)生學(xué)習(xí)盲文,更多的學(xué)生適用技術(shù)設(shè)備閱讀文字,可以說這是視障學(xué)生閱讀的唯一方法。解決這個(gè)問題的難點(diǎn)在于如何把理解文本的能力界定的清晰,普遍被接受。國家考試的成績往往影響一個(gè)學(xué)生是否可以晉升等級(jí)或是從高中畢業(yè)。因此有明確的界定結(jié)構(gòu)比以往更加重要。而且,一旦這些結(jié)構(gòu)被確定,就要提供給管理如何測試的人。 另一個(gè)常見的測試爭論時(shí)關(guān)于數(shù)學(xué)測驗(yàn)中需要的閱讀技能。幾項(xiàng)研究已經(jīng)發(fā)現(xiàn),如果把問題讀給閱讀困難的學(xué)生他們會(huì)取得較高成績(Calhoun, Fuchs, & Hamlett, 2000; Harker & Feldt, 1993; Koretz, 1997; Tindal, Heath, Hollenbeck, Almond, & Harniss, 1998)。這一發(fā)現(xiàn)意味著,數(shù)學(xué)測驗(yàn)的閱讀需求可能會(huì)阻止閱讀能力處于邊緣的學(xué)生在數(shù)學(xué)測驗(yàn)中展現(xiàn)能力。然而,解決問題的方法往往需要大量誦讀。數(shù)學(xué)教師對(duì)這些題目和大量的誦讀負(fù)擔(dān)百感交集。Shorrocks-Taylor and Hargreaves (1999)提出,非語言測試中的問題用語要盡量透明盡可能簡潔清楚。雖然研究人員發(fā)現(xiàn),我們很少關(guān)注語言文學(xué)測試中的語言測量,但這個(gè)問題將困擾測試開發(fā)一段時(shí)間。 3.3 無障礙,無偏見的項(xiàng)目 根據(jù)教育和心理測試標(biāo)準(zhǔn)(AERA, APA, NCME, 1999),項(xiàng)目的質(zhì)量通常是通過項(xiàng)目審查程序和試驗(yàn)測試確定的。項(xiàng)目審查既包括所測內(nèi)容的質(zhì)量,清晰度和是否歧義,也包括考察性別和文化的命干問題。據(jù)國家研究理事會(huì)(1999)公布,偏見出現(xiàn)在:測驗(yàn)自身的不足之處導(dǎo)致各樣本組在某一問題上得分不同。例如,一個(gè)測試旨在衡量口頭推理,應(yīng)該適用一般用語。如果文字涉及特定文化和地點(diǎn),那么就可能不公平的對(duì)待來自這些文化和地域的考生與其它群體考生。一種減少偏見的方法是研究項(xiàng)目是否對(duì)于來自特定亞群的學(xué)生更難。這可以通過現(xiàn)場試測來確定試題難度和不同學(xué)生在這道題上表現(xiàn)得不同能力。(AERA, APA, NCME, 1999, p. 39)