蘇州市教育質量監測中心(以下簡稱“監測中心”)於2015年起,啟動了麵向全市初中段學生的義務教育學業質量監測(以下簡稱“蘇州監測”),該監測覆蓋初中三個年級,監測內容分學科測試和相關因素問卷調查兩個部分。學科測試包括語文、數學、英語和科學,相關因素學生問卷包含影響學生學業成績的各種相關因素變量,包含學生背景變量、學習品質、學業負擔和學業支持這四個一級維度。
蘇州監測采取“學校全覆蓋、學生全參與、學科等比例抽樣”的方式,每個學生通過隨機抽樣的方式隻參加一門學科測試,數據分析的最小單元為學校,由於蘇州監測實現了對學校的連年追蹤,因此可以對各學校開展增值評價,從而能夠更加公正、科學、有效地對各學校學業質量的發展狀況進行精準的評估。
國內外增值評價模型簡述
“增值評價”的理念是建立在學校可以增加“價值”到學生的學習成就這一假設之上的,而“增值”表示學校所加諸學生身上、使其學習成績超過一般期望成績的額外部分[1]。自20世紀70年代以來,以“科爾曼報告”weiqidian,xuexiaoxiaonengdezengzhipingjiayanjiuzaishijiefanweineizhujianfazhanqilai。meiguoheyingguozuizaozaixuexiaopingjiazhongyinruzengzhimoshi,houchuandaoqitaguojiahediqu。woguosuiranduizengzhipingjiazuoleyidingtansuo,danguanyuzengzhipingjiadeshizhengyanjiuhaibuduojian。
在國際上,以美國的增值評價為代表的,在2015年頒布的《每一個學校成功法案》更加強調學生的“成長”,且常用的成長測量模型有3類7種。第一類是基於縱向量表的模型,包括增分模型、漸進達標模型和分類模型;第二類是預測模型,包括殘差模型、學生成長百分等級(SGP)模型和投射模型;第三類是增值模型,又稱多變量模型、教育增值評估係統、田納西增值評估係統、變量保持模型等等[2]。
在國內,增值評價研究起步較晚,在多層線性模型分析方法產生之後,“增值評價”的模型構建才有了一個新的發展和飛躍。多層線性模型更加全麵考慮學校、學生等層麵的變量,更加準確區分不同層麵、不同因素對學生學業發展所起的作用,並精確計算出各個因素所作的貢獻[3]。如北京市教育督導與教育質量評價研究中心對增值評價開展了兩個項目的研究:(1)義務教育質量評價與反饋係統項目(BAEQ),對部分連續抽測區(縣)的小學進行增值性評價分析,以學生2009年三年級數學測試為前測成績、2011年五年級數學測試成績為後測成績,分析學校數學學業增值的情況;(2)以中高考成績為數據基礎的學校增值性評價項目,采用多層線性統計模型,研究學校對學業水平的淨效應[4]。杜屏等人基於我國西部五省調研數據的實證分析,采用多層線性統計模型,來研究農村初級中學學校效能的增值性評價[5]。
蘇州市教育質量監測中心在借鑒這些學生增值評價模型的基礎上,嚐試構建適用於蘇州本土、易於一線老師理解和接受的增值評價模型。
構建追蹤監測的增值評價模型
蘇州監測設計了對同一級學生進行追蹤監測的方式。以2018年的監測為例,2018級的學生有2018年一年的監測數據,2017級的學生有2017年和2018年兩年的監測數據,2016級的學生則有2016年、2017年和2018年三年的監測數據。因此,可以通過對連續監測學校的數據進行追蹤比較,實現增值評價。
1.實現不同測試卷的等值
蘇州監測的各學科測試分為A、B卷,在難度和區分度上並不完全一致,從嚴格意義上來說,A、B卷並不可比。為了解決同一學科不同測試卷之間的可比性,監測中心采用錨題技術,將A、B卷中的部分題目組合成C卷,采用項目反應理論模型(Item Response Theory),通過Conquest軟件進行計算,將A、B卷實現等值。將Conquest軟件計算後得到的學生能力分標準化,再轉換成均分為500、標準差為100的量尺分數。
量尺分數具有不受測試題目差異和題目難度影響的特點,從而使得同一年度中以及不同年度間完成不同題本學生的分數具有可比性。
2.構建百分等級增值評價的模型
(1)模型的算法。百(bai)分(fen)等(deng)級(ji)是(shi)測(ce)量(liang)學(xue)中(zhong)應(ying)用(yong)最(zui)廣(guang)的(de)表(biao)示(shi)測(ce)試(shi)分(fen)數(shu)的(de)方(fang)法(fa)之(zhi)一(yi)。一(yi)個(ge)測(ce)試(shi)分(fen)數(shu)的(de)百(bai)分(fen)等(deng)級(ji)是(shi)指(zhi)在(zai)常(chang)模(mo)樣(yang)本(ben)中(zhong)低(di)於(yu)這(zhe)個(ge)分(fen)數(shu)的(de)人(ren)數(shu)的(de)百(bai)分(fen)比(bi)。因(yin)此(ci),百(bai)分(fen)等(deng)級(ji)85表示在常模樣本中有85%的人比這個分數要低。換句話說,百分等級指出的是個體在常模群體中所處的位置,百分等級越低,個體所處的位置越低。
因(yin)為(wei)百(bai)分(fen)等(deng)級(ji)指(zhi)的(de)是(shi)個(ge)體(ti)在(zai)常(chang)模(mo)中(zhong)所(suo)處(chu)的(de)地(di)位(wei),考(kao)慮(lv)到(dao)蘇(su)州(zhou)市(shi)各(ge)區(qu)域(yu)教(jiao)育(yu)生(sheng)態(tai)的(de)差(cha)異(yi),為(wei)了(le)讓(rang)常(chang)模(mo)穩(wen)定(ding)一(yi)致(zhi),監(jian)測(ce)中(zhong)心(xin)根(gen)據(ju)學(xue)生(sheng)的(de)量(liang)尺(chi)分(fen)數(shu)來(lai)計(ji)算(suan)學(xue)生(sheng)個(ge)人(ren)的(de)百(bai)分(fen)等(deng)級(ji),並(bing)在(zai)學(xue)生(sheng)所(suo)處(chu)的(de)同(tong)一(yi)個(ge)區(qu)域(yu)中(zhong)將(jiang)學(xue)生(sheng)個(ge)體(ti)的(de)量(liang)尺(chi)分(fen)數(shu)轉(zhuan)化(hua)為(wei)百(bai)分(fen)等(deng)級(ji)。在(zai)數(shu)據(ju)計(ji)算(suan)中(zhong),以(yi)學(xue)校(xiao)中(zhong)所(suo)有(you)學(xue)生(sheng)在(zai)該(gai)區(qu)域(yu)中(zhong)的(de)百(bai)分(fen)等(deng)級(ji)的(de)平(ping)均(jun)值(zhi)來(lai)代(dai)表(biao)該(gai)學(xue)校(xiao)的(de)百(bai)分(fen)等(deng)級(ji)。
(2)模型的科學性。為了更加客觀科學地反映初中學校的增值情況,監測中心構建並比較研究了學校增值評價的兩種模型。第一種模型采集了蘇州市從2016-2018年均參加監測且可追蹤的92所學校的數據,以這些學校各科2016年百分等級和2017年百分等級、2017年百分等級和2018年百分等級(能夠體現年度間增值情況)畫散點圖,並求出擬合直線為:y=0.8929*x+5.4544,由於此模型是基於各學校實際百分等級的變化進行的擬合,因此我們把此模型稱之為“經驗模型”。
表1 “經驗模型”和“理想模型”增值比較示例

第二種模型認為,如果參測的某校某學科百分等級保持在去年的水平上,該校該學科為“零增值”,若今年的百分等級高於去年,即為“正增值”,反之,為“負增值”,用公式表示為:y=1.00*x+0.00。由於此模型不考慮各學校之間各方麵的差異(如辦學水平、資源配備),因此,我們把此模型稱之為“理想模型”。

圖1 各年各科百分等值散點圖
比較“經驗模型”和“理想模型”,我們發現兩個模型的函數圖像非常相似,尤其是中間段成績的學校差異很小,而優質學校和薄弱學校則出現少許差異。表1選取了A校作為薄弱學校代表,B校作為優質學校代表,易見,在“理想模型”中,薄弱學校相對更容易實現高增值,而優質學校實現增值的難度相對較大。
由you於yu優you質zhi學xue校xiao集ji中zhong了le相xiang對dui較jiao為wei優you質zhi的de生sheng源yuan,所suo以yi這zhe類lei學xue校xiao理li應ying承cheng擔dan更geng多duo的de責ze任ren,理li應ying培pei養yang更geng多duo的de優you質zhi學xue生sheng。因yin此ci,綜zong合he考kao慮lv兩liang種zhong模mo型xing的de科ke學xue性xing、合理性、簡潔性和一線老師的可接受性,監測中心采用“理想模型”對學校進行百分等級增值評價,把對優質學校的增值要求提高到與對薄弱學校的增值要求一致。
(3)模型的應用。以P區域2016級為例,該區域中過去三年中均參測的學校有3年的監測數據。圖2呈現了P區域A校2016年初一、2017年初二和2018年初三的語文、數學和英語的百分等級。在計算百分等級的時候,以P區域為常模,故P區域的平均百分等級為50。從縱向看,可以看到某年各學科百分等級在P區域中的相對位置以及各學科之間的高低情況;從橫向看,可以看到某學科三年或者兩年百分等級的變化情況,以此來反映A校的增值情況。

圖2 P區A校2016級三年百分等級圓點圖
3.構建四水平增值評價的模型
(1)模型的算法。在常模中將學生個人量尺分數由高到低進行排序,按照人數占比0-25%、25%-50%、50%-75%、75%-100%,把學生分為Ⅰ、Ⅱ、Ⅲ、Ⅳ四個水平。Ⅰ水平學生表明該生量尺分數處於常模前25%,Ⅳ水平學生表明該生量尺分數處於常模後25%。同tong樣yang,為wei了le讓rang常chang模mo穩wen定ding一yi致zhi,以yi學xue生sheng所suo在zai區qu域yu學xue生sheng為wei測ce量liang總zong體ti計ji算suan學xue生sheng個ge人ren四si個ge水shui平ping。在zai數shu據ju計ji算suan中zhong,以yi學xue校xiao中zhong各ge水shui平ping人ren數shu占zhan學xue校xiao總zong人ren數shu的de比bi例li來lai代dai表biao學xue校xiao各ge水shui平ping的de百bai分fen比bi。
(2)模型的應用。從cong百bai分fen等deng級ji的de增zeng值zhi可ke以yi看kan出chu一yi個ge學xue校xiao某mou一yi學xue科ke總zong體ti的de增zeng值zhi情qing況kuang。而er通tong過guo對dui學xue校xiao四si水shui平ping占zhan比bi變bian化hua進jin行xing追zhui蹤zong,可ke以yi清qing晰xi的de看kan到dao學xue校xiao各ge科ke各ge水shui平ping人ren數shu比bi例li三san年nian的de變bian化hua情qing況kuang,可ke以yi更geng為wei精jing細xi地di診zhen斷duan出chu學xue校xiao進jin步bu或huo退tui步bu的de人ren群qun結jie構gou,便bian於yu學xue校xiao明ming確que改gai進jin方fang向xiang,抓zhua住zhu改gai進jin的de關guan鍵jian點dian。
03
構建單次監測的增值評價模型
jiancezhongxingenjuchuyixinshengdegerenxinxi,nenggouzhuizongdaoxueshengdexiaoxuebiyexuexiao,yinernenggoushixianduisuozhuizongdaodexiaoxuebiyeshengxueyezhiliangshuipingdepingjia。youyusuozhuizongdaodexiaoxuejinyouyiniandeshuju,jiancezhongxinxuyaojijitansuoshihedancijiancedezengzhipingjiamoxing。
《科爾曼報告》指出,家庭背景是影響學生學業成績的主要因素[6],有you關guan家jia庭ting背bei景jing與yu學xue生sheng學xue業ye成cheng績ji的de一yi係xi列lie研yan究jiu也ye證zheng實shi,家jia庭ting社she會hui經jing濟ji地di位wei對dui兒er童tong的de學xue業ye成cheng就jiu有you顯xian著zhu的de影ying響xiang,其qi影ying響xiang甚shen至zhi大da於yu學xue校xiao的de影ying響xiang。國guo內nei也ye有you很hen多duo學xue者zhe的de研yan究jiu表biao明ming,學xue生sheng的de家jia庭ting社she會hui經jing濟ji地di位wei對dui其qi學xue業ye成cheng績ji有you重zhong要yao影ying響xiang。
(1)模型的算法。基於國外內學者的研究,監測中心嚐試以學校為單位,用蘇州市370多所小學的家庭社會經濟地位來預測學校的學業成績(用量尺分數來表示)。監測中心以各小學家庭社會經濟地位與各科學業成績繪製散點圖,並求出擬合直線以及解釋率R方,看該模型是否達到可接受的範圍,再將其與這些學校實際的學業成績進行對比,以期在一定程度上反映小學的增值情況。
(2)模型的科學性。在計算學校家庭社會經濟地位(SES)時,參照國際上通用的以父母受教育程度、父(fu)母(mu)職(zhi)業(ye)和(he)家(jia)庭(ting)擁(yong)有(you)物(wu)來(lai)合(he)成(cheng)學(xue)生(sheng)的(de)家(jia)庭(ting)社(she)會(hui)經(jing)濟(ji)地(di)位(wei),並(bing)通(tong)過(guo)計(ji)算(suan)學(xue)校(xiao)所(suo)有(you)學(xue)生(sheng)平(ping)均(jun)的(de)家(jia)庭(ting)社(she)會(hui)經(jing)濟(ji)地(di)位(wei)來(lai)代(dai)表(biao)學(xue)校(xiao)的(de)家(jia)庭(ting)社(she)會(hui)經(jing)濟(ji)地(di)位(wei)。
其中,英語學業成績與家庭社會經濟地位的關係最為密切,回歸方程是y=51.074*x+508.88。解釋率R方為0.5808,數學學業成績與家庭社會經濟地位的關係相對最低,解釋率R方為0.3648,但解釋率也達到可以接受的程度。
(3)模型的應用。根(gen)據(ju)擬(ni)合(he)直(zhi)線(xian),可(ke)以(yi)看(kan)出(chu)各(ge)小(xiao)學(xue)的(de)增(zeng)值(zhi)情(qing)況(kuang),如(ru)某(mou)小(xiao)學(xue)某(mou)學(xue)科(ke)位(wei)於(yu)該(gai)擬(ni)合(he)直(zhi)線(xian)的(de)上(shang)方(fang),說(shuo)明(ming)該(gai)小(xiao)學(xue)該(gai)學(xue)科(ke)為(wei)正(zheng)增(zeng)值(zhi),若(ruo)位(wei)於(yu)該(gai)擬(ni)合(he)直(zhi)線(xian)的(de)下(xia)方(fang),說(shuo)明(ming)為(wei)負(fu)增(zeng)值(zhi)。此(ci)外(wai),為(wei)了(le)對(dui)各(ge)小(xiao)學(xue)提(ti)供(gong)數(shu)據(ju)預(yu)警(jing),監(jian)測(ce)中(zhong)心(xin)基(ji)於(yu)各(ge)學(xue)科(ke)增(zeng)值(zhi)情(qing)況(kuang),先(xian)計(ji)算(suan)各(ge)學(xue)科(ke)的(de)平(ping)均(jun)增(zeng)值(zhi)以(yi)及(ji)增(zeng)值(zhi)的(de)標(biao)準(zhun)差(cha),將(jiang)與(yu)平(ping)均(jun)增(zeng)值(zhi)相(xiang)差(cha)1個標準差到1.5個標準差作為1級預警,將與平均增值相差1.5個標準差以上的作為2級預警。以D小學的各科增值數據為例,英語學科正增值14分,表現較好,語文學科負增值1分,但是不在預警範圍之內,科學學科負增值29分,為1級預警,數學學科負增值49分,已經達到2級預警,需要引起重視。

04
不足與展望
在實施增值評價的過程中,家庭、社(she)會(hui)和(he)學(xue)校(xiao)自(zi)身(shen)等(deng)諸(zhu)多(duo)因(yin)素(su)均(jun)會(hui)對(dui)學(xue)校(xiao)教(jiao)育(yu)產(chan)生(sheng)影(ying)響(xiang)。因(yin)此(ci),在(zai)構(gou)建(jian)增(zeng)值(zhi)評(ping)價(jia)模(mo)型(xing)時(shi),還(hai)需(xu)要(yao)評(ping)判(pan)不(bu)同(tong)教(jiao)育(yu)生(sheng)態(tai)層(ceng)麵(mian)各(ge)種(zhong)因(yin)素(su)對(dui)學(xue)生(sheng)學(xue)業(ye)的(de)影(ying)響(xiang)程(cheng)度(du),以(yi)提(ti)高(gao)模(mo)型(xing)的(de)科(ke)學(xue)性(xing)和(he)簡(jian)潔(jie)性(xing)。
監(jian)測(ce)中(zhong)心(xin)目(mu)前(qian)構(gou)建(jian)的(de)增(zeng)值(zhi)評(ping)價(jia)模(mo)型(xing)雖(sui)然(ran)初(chu)步(bu)解(jie)決(jue)了(le)對(dui)本(ben)地(di)區(qu)學(xue)校(xiao)教(jiao)育(yu)質(zhi)量(liang)進(jin)行(xing)發(fa)展(zhan)性(xing)評(ping)價(jia)的(de)要(yao)求(qiu),但(dan)也(ye)存(cun)在(zai)一(yi)定(ding)的(de)不(bu)足(zu)。如(ru)針(zhen)對(dui)初(chu)中(zhong)學(xue)校(xiao)增(zeng)值(zhi)采(cai)用(yong)的(de)“理想模型”,雖然簡潔且容易理解,但是對數據處理相對有些粗糙,無法全麵考慮學生發展過程中學生個體、教師、學(xue)校(xiao)等(deng)不(bu)同(tong)層(ceng)麵(mian)在(zai)其(qi)中(zhong)發(fa)揮(hui)的(de)作(zuo)用(yong)。而(er)對(dui)於(yu)小(xiao)學(xue)增(zeng)值(zhi)模(mo)型(xing)的(de)探(tan)索(suo)雖(sui)然(ran)也(ye)得(de)到(dao)學(xue)校(xiao)的(de)認(ren)可(ke),但(dan)是(shi)僅(jin)考(kao)慮(lv)家(jia)庭(ting)社(she)會(hui)地(di)位(wei)對(dui)學(xue)生(sheng)學(xue)業(ye)成(cheng)就(jiu)的(de)影(ying)響(xiang)是(shi)不(bu)夠(gou)全(quan)麵(mian)的(de)。
隨著多元統計技術的迅速發展,多數學者在研究預測學生的學業成績時,采用了多水平線性模型的方法,這樣能夠區分不同層次、不同因素對學生學業發展所起的作用,比如學生層麵的變量,包括學生入學水平、家庭社會經濟地位、學習品質等,以及學校層麵的變量。
jiancezhongxinjiangzaimuqianzhengtipingjiaxuexiaozengzhiqingkuangdejichushang,gengshenrudiyanjiugezhongyinsuduixueshengxueyechengjifazhandeyingxiangchengdu,yiqinenggouqufengezhongyinsudezeren,tichuyuxuexiaowuguanyinsudeyingxiang,shixianduixuexiao“淨增值”的準確測量,從而構建更加科學公正、更加適合蘇州教育實際的發展性評價機製。

總結和展望是為了更好地未來
參考文獻:
[1] 英〕薩麗·托馬斯.運用“增值”評量指標評估學校表現[J].教育研究,2005(9).
[2]王曉平,齊森,謝小慶.美國學校“成長測量”的7種主要方法[J].中國考試,2018(6).
[3]邊玉芳,王燁暉.增值評價:學校辦學質量評估的一種有效途徑[J].教育學報,2013.
[4]北京市教育督導與教育質量評價研究中心.增值性評價評出學校的“加工力”[J].人民教育, 2016(16).
[5]杜屏,楊中超.農村初級中學學校效能的增值性評價—基於我國西部五省調研數據的實證分析[J]. 北京師範大學學報(社會科學版),2011(6).
[6]James S. Coleman et al. Equality of Education Opportunity[M].WashingtonDC:Government Printing Office,1966.
文章來源:《中小學信息技術教育》2019年第十期 34-38頁。
注:本文是江蘇省教育科學“十三五”規劃重點課題《區域初中教育質量監測結果運用的實踐研 究》階段性成果,課題批準文號:E-a/2016/04。