對學生進行全面的評價并在此基礎上進行人才選拔,是國際上諸多高校招生錄取的共同趨勢。綜合評價是一個經常被提及的概念,實際上就是對學生能否滿足大學學習來進行全面考查。既然要對學生進行綜合評價,就必然涉及不同的測評方式、測評主體和測評結果之間的差異。
近年來大量研究表明,這些綜合性的測評結果比單一的考試成績更能夠預測學生的未來成就。因而,很多世界知名高校在進行人才選拔中,都非常注重這些多元化的測評結果,包括學生特長、標準化考試成績、平時表現(xiàn)、興趣愛好、情感、價值觀、課外活動等。
但是,如何讓這些不同維度的特質在科學、公平的基礎上可用、可比,則是一個極其復雜的難題。一些國家的高校結合辦學定位和人才培養(yǎng)模式進行了一些探索,形成了各有特色并具有重要借鑒意義的經驗。
1.測評是個技術活
目前,國際上考試測評行業(yè)發(fā)展的一個重要趨勢就是為測評者提供各種人性化的服務,以滿足學習者學習和終身發(fā)展的需要。例如,在全球化時代,受教育者和各類人才的國際流動更加頻繁。他們在不同時間、不同地區(qū)參加測評,然后帶著這些測評結果在不同國家或地區(qū)、不同時間點來替代使用成為一種當下的迫切需要。國際上的一些大規(guī)模教育測評項目,如經濟合作與發(fā)展組織推出的國際學生評估項目(PISA),每三年就要針對全球近80個國家和地區(qū)的15歲學生進行閱讀、數(shù)學、科學等方面的測試。PISA所用的試題有很多套而且并不完全相同,但是其公布的測評結果可以直接進行比較,這對測評技術而言無疑是一個巨大的挑戰(zhàn)。
在高校人才選拔所依據(jù)的大規(guī)模標準化考試中,同樣也存在類似情況,如美國的學術能力測試(簡稱SAT)和大學入學考試(簡稱ACT),兩者都是美國很多大學人才選拔所要求的重要測試。SAT由美國大學理事會委托教育考試服務中心舉辦,SAT主要考查學生在大學學習所需的閱讀、寫作、數(shù)理等方面的技能,尤其是批判性思維能力。該考試每年提供7次考試機會,學生可以依據(jù)自己的情況,報名參加其中任何一次或者幾次考試,并且自行決定用哪次考試的成績去申請大學。ACT由專業(yè)化的考試公司主辦,每年舉行6次,與SAT一樣,主要作為大學新生選拔和獎學金發(fā)放的依據(jù)。ACT考試包括五個部分:英語、數(shù)學、閱讀、科學以及作文(選考)。與SAT不同的是,ACT關注學生對中學課程知識的掌握情況,更加突出對學科能力的考查,這些基于學科的能力和大學學習所需的能力緊密地結合在一起,受到了公立大學的歡迎。
SAT、ACT均實施一年多次考試,這給學生提供了多次考試機會,在一定程度上緩解了復習備考的壓力,但卻對考試質量提出了非常高的要求。其中最關鍵的是,各次考試的難度需要盡可能保持一致。否則,試卷難度時高時低,就會帶來考試的科學性、公平性方面的一系列問題。然而,在考試之前就命制出難度完全一樣的多套試卷是幾乎不可能的。對此,SAT和ACT的開發(fā)者設計了一整套測量與評價技術來對考試成績進行一定的處理,以消除不同次考試試題難度的影響,從而使得各次考試難度能夠保持一致性和基本穩(wěn)定。在這個過程中,等值就是一項常用的考試技術,廣泛應用于一些國際性的大型教育考試與評價項目中。
在SAT和ACT之間還面臨一個至關重要的問題,那就是兩者成績之間如何建立聯(lián)系。原因很簡單,美國很多高校在招生時會要求學生提交這兩個考試的任何一個成績。從選拔的結果來看,同一所大學所錄取的新生中,提交SAT和ACT考試成績的考生各占一定比例。而如前文所述,SAT和ACT在知識與能力考查目標上存在較大差異,可以說,它們作為兩個不同的測評工具,天然就不具備考試技術上的可比性。那又如何保證這兩個性質不同的考試可以相互比較甚至替代呢?這同樣涉及科學性和公平性的問題。對此,這兩個考試的主辦方美國大學理事會和ACT公司通力合作,通過對同時參加這兩個考試學生的追蹤和對比研究,從成績使用的角度來公布出一份SAT與ACT的分數(shù)轉換表,以明確這兩個考試結果之間的對應關系。例如,在滿分1600的SAT中得1490-1520分,就相當于在滿分36的ACT中得34分。這樣一份轉換表,實現(xiàn)了不同測評在結果使用上的等效,為高校的人才選拔和測試者都提供了極大的便利。
2.及時修正的統(tǒng)計模型
很多歐美國家的高校在進行人才選拔時,一般會要求學生提供綜合性的申請材料,包含一系列能夠證明自己學習能力的測評結果。其中一些是過程性評價的結果,比如學生在學習過程中的班級排名、階段測驗成績、GPA、校本評價結果等。在澳大利亞、新西蘭等國家,則還包括日常教學過程中任課教師對學生的學業(yè)表現(xiàn)進行的綜合判斷,涉及專題學習、實驗技能、日常課程學習狀況。這些方面的測評結果是學生在校期間學習狀況最直接的表現(xiàn),不但反映了學生在校期間各學科的學習狀況,更可以反映出學生在不同學習階段間的成長變化情況。
教育領域的研究表明:在整個學習過程中,相比較而言,最了解學生的是任課教師,最能體現(xiàn)學生水平的是能夠反映長期表現(xiàn)的學校評價結果,相比之下,任何一次性的終結性考試都必然存在測量誤差。因此,在學習過程中的各種評價,理應在高校的人才選拔中占有一席之地。但是,不同學校的學校評價結果之間缺少可比性,因為校本評價在對象、測評工具、群體上均存在極大差異,倘若盲目使用,則會造成不公平的現(xiàn)象。
為了解決上述難題,英聯(lián)邦的一些國家和地區(qū)引入了一種新的機制來對校本評價結果進行校正。這種機制的核心是一種“統(tǒng)計模型”——基于學生的平時成績、老師對學生各方面的評價,以統(tǒng)一考試的結果為基準,建立相應的統(tǒng)計模型來調整校本評價的結果,并把它統(tǒng)一到同一把量尺上,最后再納入學生的綜合評價中。這樣做則能在根本上確保不同教師、學校、地區(qū)所做出的評價結果之間具有可比性。
這種統(tǒng)計方法調整的基本思路是:測評的組織機構通過建立相應的統(tǒng)計模型,用終結性評價結果來校驗過程性的評價。參照各學生在統(tǒng)一測評中的成績來對校內評價進行修正,以達到消除校際之間評分差異的目的。在這個過程中,如果某學校的校內表現(xiàn)低于與其在終結性評價中水平相當學校的表現(xiàn),該校的評價結果就會被適當調高,相反則會被調低。需要強調的是,盡管調整后學生的評價結果會發(fā)生變化,但其在學校中的排位不會變。這種統(tǒng)計分析方法的優(yōu)點是多方面的:維持了評價結果在學校之間的可比性,以確保評價的公平;促使評價結果在年與年之間的穩(wěn)定性,提升了測評的信度、效度和精度;搜集數(shù)據(jù)回饋學校,進一步優(yōu)化校本評價的開展,提升學校和老師的評價素養(yǎng)。
3.多元錄取的新趨勢
不同國家的高校在使命、類型、辦學層次、人才培養(yǎng)目標上呈現(xiàn)多元化的特點,這對高校的人才選拔產生了深遠的影響。不同類別高校的選拔標準也各具特色。在高等教育多樣化的美國,至今仍有數(shù)百所高校在人才選拔時不強制要求學生提供標準化考試成績。除此之外,美國的其他高校一般都要求學生在申請時提供多種材料,以表明自己能夠勝任大學階段的學習。一般而言,美國高校的招生委員會會對學生的申請材料進行詳細審核??傮w來看,影響錄取與否的因素較多,重要性也不一樣,按重要程度排序的話則分別為:在中學開設的大學預備課程(AP)成績、高中課程的強度(選課的數(shù)量和難度)、SAT或ACT成績、中學全部課程的成績(GPA)、入學申請書的寫作。其他因素還包括中學年級排名、中學升學指導老師的推薦信、學生展示的興趣、教師推薦信、面試、課外活動等??梢钥闯觯陨线@些因素中很多都是綜合評價的結果,涉及對考生全方位的考查。因此,高校在具體的選拔過程中,通常會將上述綜合評價的結果進行加總并按照一定的方法折算為學業(yè)指數(shù)。
學業(yè)指數(shù)的核心在于將學生學習中的表現(xiàn)進行量化處理,形成可以用以客觀比較的數(shù)值。在具體操作上,年級排名通常轉化為對應的分數(shù),計算方法是:把學生排名乘以2減去1,然后除以當年年級總人數(shù)的2倍,這樣會得到一個小于1的數(shù)值,最后依據(jù)這個值在提前制定的表上即可查到對應的分值,這個分值就可以與其他標準化考試的成績相加,得到總的學業(yè)指數(shù)值。在選拔過程中,不同高校會對學業(yè)指數(shù)設置一定的等級要求。如達特茅斯學院和賓夕法尼亞大學把學業(yè)指數(shù)分為9等,第9等表示最好,分值為230分以上,第1等表示最差,分值在180分以下。
另外,美國其他一些高校也存在類似的情況,艾奧瓦州的部分高校也會采用計算“錄取指數(shù)”的方法來對申請者進行評價。“錄取指數(shù)”由標準化考試成績、GPA、排名以及所修的核心課程等幾部分組成。在計算過程中,高中排名和GPA這兩個過程性評價的結果分別乘以相應的系數(shù)來進行加總,高中排名一般取其百分位再乘以1,GPA通常是乘以20??傮w來說,美國大學的招生做到了對學生的綜合評價,一方面是標準的多元,包含了學習成績、興趣、面試表現(xiàn)、課外活動等多方面的因素。另一方面,即使在同一個成績維度下,也通過把校本成績、統(tǒng)一考試成績、標準化考試成績進行綜合的方式來實現(xiàn)。
韓國的大學十分重視學生的綜合表現(xiàn),具體包括高中學習成績、是否擔任過干部以及參加社團活動、競賽、科學作品展覽等情況。從2002年起,韓國大學入學考試不再計算總分,而是把各科考試成績按照一定比例轉換為9個等級,高校錄取時參考其高考成績分數(shù)等級和日常的綜合成績進行綜合評定。韓國高校的選拔標準也因此呈現(xiàn)出多樣化的特點。高校在擬定錄取標準時,至少有4種方案:僅根據(jù)高中在校的成績和綜合表現(xiàn)、高中在校成績加上“大學修學能力考試”成績、高中在校成績加上高??疾槌煽?、前3項均考慮。除此之外,高校還可根據(jù)學校與專業(yè)的特點確定不同標準的權重。韓國教育與人力資源部規(guī)定,各高校均可對綜合生活記錄簿、大學修學能力考試、大學自備考核、面試、非教學科目資料、微機科目等六類資料進行自由選擇和組合來選拔學生。其中,綜合生活記錄簿是以韓國教育與人力資源部訓令為依據(jù)而制定的表格,要求盡可能地把應該記錄的學習活動全部記錄在其中,包括獲獎經歷、資格證書獲得情況、特別活動情況、社會服務活動等。
英國政府一直積極倡導各種證書考試在高校選拔中的作用,但最近一段時間以來,很多高校的錄取政策體現(xiàn)出了從主要依據(jù)學生證書考試成績向注重對學生進行綜合評定的變化趨勢,逐步形成“證書+綜合評價”的高校錄取選拔制度。具體而言,英國高校在選拔時強調學生的A-levels證書或同等證書的成績,同時,通過學校的推薦意見、個人陳述、學習過程中的測評結果、單獨舉行的考試或者聯(lián)考(一般只有選拔性高校特定專業(yè)才需要)、面試等手段對申請人進行綜合測評,然后再決定是否錄取,是無條件錄取還是有條件錄取。這一模式為不同測評結果的使用提供了根本性的制度保障。
(作者:章建石,系教育部考試中心副研究員,本文為國家教育考試科研規(guī)劃2017年度課題的研究成果,批準號:GJK2017035)
凡本網(wǎng)注明“XXX(非現(xiàn)代青年網(wǎng))提供”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和其真實性負責。
數(shù)量多達幾百件甚至幾千件,搶注閑置、待價而沽惡意搶注囤積商標成一些企業(yè)生財之道國家有關部門表示,將從嚴審查、堅決遏制和打擊商標非正
2018-12-24 08:37
中新網(wǎng)12月21日電 12月20日,中關村在線2018年度科技大會暨產品頒獎盛典在北京舉行。作為行業(yè)領先的科技互聯(lián)網(wǎng)媒體,這是中關村在線第十一
2018-12-21 10:19
據(jù)新華社報道,安徽省公安廳近日發(fā)布的《安徽省公安機關深化放管服改革39項措施》第11條規(guī)定,國內居民忘記攜帶有效身份證件的,可以在具備
2018-12-21 09:02
中新網(wǎng)北京12月20日電 (記者 陳康亮)中國經濟數(shù)字化變革方興未艾,蓬勃發(fā)展。作為經濟重要組成部分的金融機構面對變革將何去何從?在此間
2018-12-21 08:46
中新網(wǎng)深圳12月20日電 (陳文 任冠元 蔣磊)深圳福田警方12月20日通報稱,深圳福田警方日前打掉財富中國非法集資平臺,6名犯罪嫌疑人因涉
2018-12-21 08:46
主題為新經濟·新電商·新零售的2018世界電子商務大會12月20日在北京舉行。圖為與會嘉賓出席開幕儀式。 主辦方供圖 攝中新網(wǎng)北京12月20日
2018-12-21 08:43
中新社北京12月20日電 (記者 趙建華)新修改的中國個人所得稅法將于2019年1月1日正式實施。中國國家稅務總局對居民、非居民個人預扣預繳方
2018-12-21 08:39
中新網(wǎng)12月20日電 據(jù)工信部網(wǎng)站消息,為保障我國第五代移動通信系統(tǒng)(5G)健康發(fā)展,協(xié)調解決5G基站與衛(wèi)星地球站等其他無線電臺(站)的干擾問
2018-12-21 08:39
中衛(wèi)西氣東輸互聯(lián)互通工程正式進氣投產,工作人員臉上洋溢著喜悅的笑容?!畹稀z中新網(wǎng)銀川12月20日(于翔 楊迪)12月20日,西氣東輸?shù)拇?
2018-12-21 08:36
新華社北京12月20日電(記者高亢)記者20日從中國二維碼注冊認證中心獲悉,近期成立的國內首家全球代碼發(fā)行機構——統(tǒng)一二維碼標識注冊管理中
2018-12-21 08:35