新的統(tǒng)計(jì)模型提高了標(biāo)準(zhǔn)化考試成績的預(yù)測能力?
優(yōu)秀的試卷、較高的平均分和優(yōu)秀的標(biāo)準(zhǔn)化考試成績,有時(shí)并不足以被大學(xué)錄取。
持續(xù)的高考丑聞凸顯了標(biāo)準(zhǔn)化考試分?jǐn)?shù)的影響。考試管理員現(xiàn)在正在與其他付費(fèi)家長進(jìn)行調(diào)查,以確保他們孩子的考試分?jǐn)?shù)是固定的。
大學(xué)錄取決定使用標(biāo)準(zhǔn)化考試成績作為申請人在大學(xué)表現(xiàn)的預(yù)測指標(biāo)。然而,如果有一種更好的預(yù)測學(xué)習(xí)方法,不依賴于單一的高風(fēng)險(xiǎn)測試,會(huì)怎么樣呢?
亞利桑那州立大學(xué)和丹佛大學(xué)的研究人員設(shè)計(jì)了一種預(yù)測學(xué)習(xí)成績的方法,這種方法的預(yù)測能力是單一標(biāo)準(zhǔn)化評估的三倍。研究團(tuán)隊(duì)開發(fā)并驗(yàn)證了一個(gè)統(tǒng)計(jì)模型,該模型使用隨時(shí)可用的考試分?jǐn)?shù)來預(yù)測未來的學(xué)術(shù)成就。這項(xiàng)研究將發(fā)表在《多重行為研究》上。
ASU心理學(xué)助理教授、論文第一作者Daniel McNeish表示,每個(gè)人都會(huì)在某個(gè)時(shí)候受到測試的影響——測試用于對招生甚至職業(yè)安置做出高風(fēng)險(xiǎn)的決策——我們開發(fā)的模型可以捕捉數(shù)據(jù)中的情況,比現(xiàn)有方法更好地預(yù)測未來的表現(xiàn)。
當(dāng)前的能力并不總是能預(yù)測未來的學(xué)習(xí)
許多標(biāo)準(zhǔn)化測試旨在進(jìn)行一次性評估,而不是為長期表現(xiàn)提供信息。丹佛大學(xué)助理教授、該論文的第二作者丹尼斯杜馬斯說,這些測試有時(shí)被用來預(yù)測任何參加測試的人的未來表現(xiàn),但事實(shí)上,很少有測試能做到這一點(diǎn)。認(rèn)為個(gè)別測試不能完全衡量學(xué)生未來學(xué)習(xí)潛力的想法并不是什么新想法:社會(huì)學(xué)家、歷史學(xué)家和民權(quán)活動(dòng)家WEB DuBois在大約一個(gè)世紀(jì)前就提出了這個(gè)想法。
杜馬斯補(bǔ)充道:從單個(gè)時(shí)間點(diǎn)獲得的考試成績可以很好地反映某人在考試中所了解的情況,但通常無法提供有關(guān)學(xué)習(xí)潛力的信息。考試成績通常用來表示一個(gè)人可能從未來的教育中受益多少,但這個(gè)概念與考生現(xiàn)在知道多少完全不同。
為了開發(fā)這個(gè)模型,研究小組從以色列心理學(xué)家魯本富爾斯坦的工作中獲得了靈感,他在學(xué)校和年級對大屠殺的兒童幸存者進(jìn)行了測試。基于一個(gè)考試分?jǐn)?shù)的等級等級分配通常太低,因此Feuerstein開發(fā)了一個(gè)叫做動(dòng)態(tài)評估的測試系統(tǒng),它使用在一段時(shí)間內(nèi)收集的多個(gè)考試分?jǐn)?shù)來衡量孩子的學(xué)習(xí)能力,而不是他們當(dāng)前的知識(shí)水平。動(dòng)態(tài)評估是勞動(dòng)密集型的,難以大規(guī)模實(shí)施。研究團(tuán)隊(duì)利用先進(jìn)的數(shù)學(xué)模型和計(jì)算能力解決了這個(gè)問題,從而創(chuàng)造了一種稱為動(dòng)態(tài)測量模型的新方法。
連接點(diǎn)
動(dòng)態(tài)測量模型使用一系列測試分?jǐn)?shù)來預(yù)測未來的學(xué)習(xí)能力。該模型根據(jù)考試成績隨時(shí)間的變化擬合出一條曲線,通常看起來像一個(gè)橫向字母J,通常稱為學(xué)習(xí)曲線。學(xué)習(xí)曲線上的點(diǎn)代表當(dāng)前的知識(shí)量,曲線的最大值或上限就是學(xué)習(xí)潛力。利用幼兒園到8年級的標(biāo)準(zhǔn)化考試成績,研究團(tuán)隊(duì)最近表明,動(dòng)態(tài)測量模型可以擬合學(xué)習(xí)曲線,預(yù)測學(xué)習(xí)潛力。
研究團(tuán)隊(duì)想知道該模型可以預(yù)測學(xué)習(xí)潛力的程度,從而預(yù)測其實(shí)際準(zhǔn)確性。他們使用了加州大學(xué)伯克利分校人類發(fā)展研究所的三組數(shù)據(jù)。包括20世紀(jì)20年代和30年代3歲時(shí)開始的數(shù)據(jù)集中參與者的測試分?jǐn)?shù)。參與者被研究了幾十年,直到20世紀(jì)50年代、60年代和70年代。
由于大多數(shù)標(biāo)準(zhǔn)化測試都在學(xué)校進(jìn)行,研究團(tuán)隊(duì)使用動(dòng)態(tài)測量模型來擬合20歲以下加州大學(xué)伯克利分校參與者的測試分?jǐn)?shù)。團(tuán)隊(duì)通過讓模型完成曲線來預(yù)測每個(gè)參與者未來的學(xué)習(xí)潛力。然后,他們將50-70歲的實(shí)際測試分?jǐn)?shù)與模型預(yù)測的結(jié)果進(jìn)行比較。
McNeish說:動(dòng)態(tài)測量模型捕獲的方差是其他方法的三倍,包括單個(gè)時(shí)間點(diǎn)的測試分?jǐn)?shù)。換句話說,我們的模型預(yù)測的最后得分要好三倍。如今,學(xué)生被如此頻繁地測試來衡量他們的進(jìn)步,但每個(gè)學(xué)生都可以通過獲得多個(gè)分?jǐn)?shù)來實(shí)現(xiàn)超越自己進(jìn)步的目標(biāo)。它們可以組合成一個(gè)學(xué)習(xí)潛力分?jǐn)?shù),以提高對人們的技能和能力預(yù)計(jì)將在哪里結(jié)束的預(yù)測,并且它們將在未來保持相同的軌跡。
利用標(biāo)準(zhǔn)化測試的潛力
使用動(dòng)態(tài)測量模型預(yù)測學(xué)生未來的學(xué)習(xí)潛力不需要改變政策或進(jìn)行新的測試。該模型要求的考試成績已經(jīng)存在,通過《不讓任何一個(gè)孩子落后法案》和《每個(gè)學(xué)生成功法案》獲得。
麥克內(nèi)什說:動(dòng)態(tài)測量建模可以在沒有專用計(jì)算機(jī)的情況下運(yùn)行,并且不會(huì)比該領(lǐng)域使用的標(biāo)準(zhǔn)統(tǒng)計(jì)模型花費(fèi)更長的時(shí)間。邏輯上來說,各方面明天都可以實(shí)施。
研究團(tuán)隊(duì)目前<愛尬聊_頭條百科>正在開發(fā)傳播動(dòng)態(tài)測量模型的軟件。