蘇州監測采取“學校全覆蓋、學生全參與、學科等比例抽樣”的方式,每個學生通過隨機抽樣的方式隻參加一門學科測試,數據分析的最小單元為學校,由於蘇州監測實現了對學校的連年追蹤,因此可以對各學校開展增值評價,從而能夠更加公正、科學、有效地對各學校學業質量的發展狀況進行精準的評估。
國內外增值評價模型簡述
“增值評價”的理念是建立在學校可以增加“價值”到學生的學習成就這一假設之上的,而“增值”表示學校所加諸學生身上、使其學習成績超過一般期望成績的額外部分[1]。自20世紀70年代以來,以“科爾曼報告”為(wei)起(qi)點(dian),學(xue)校(xiao)效(xiao)能(neng)的(de)增(zeng)值(zhi)評(ping)價(jia)研(yan)究(jiu)在(zai)世(shi)界(jie)範(fan)圍(wei)內(nei)逐(zhu)漸(jian)發(fa)展(zhan)起(qi)來(lai)。美(mei)國(guo)和(he)英(ying)國(guo)最(zui)早(zao)在(zai)學(xue)校(xiao)評(ping)價(jia)中(zhong)引(yin)入(ru)增(zeng)值(zhi)模(mo)式(shi),後(hou)傳(chuan)到(dao)其(qi)他(ta)國(guo)家(jia)和(he)地(di)區(qu)。我(wo)國(guo)雖(sui)然(ran)對(dui)增(zeng)值(zhi)評(ping)價(jia)作(zuo)了(le)一(yi)定(ding)探(tan)索(suo),但(dan)關(guan)於(yu)增(zeng)值(zhi)評(ping)價(jia)的(de)實(shi)證(zheng)研(yan)究(jiu)還(hai)不(bu)多(duo)見(jian)。
在國際上,以美國的增值評價為代表的,在2015年頒布的《每一個學校成功法案》更加強調學生的“成長”,且常用的成長測量模型有3類7種。第一類是基於縱向量表的模型,包括增分模型、漸進達標模型和分類模型;第二類是預測模型,包括殘差模型、學生成長百分等級(SGP)模型和投射模型;第三類是增值模型,又稱多變量模型、教育增值評估係統、田納西增值評估係統、變量保持模型等等[2]。
在國內,增值評價研究起步較晚,在多層線性模型分析方法產生之後,“增值評價”的模型構建才有了一個新的發展和飛躍。多層線性模型更加全麵考慮學校、學生等層麵的變量,更加準確區分不同層麵、不同因素對學生學業發展所起的作用,並精確計算出各個因素所作的貢獻[3]。如北京市教育督導與教育質量評價研究中心對增值評價開展了兩個項目的研究:(1)義務教育質量評價與反饋係統項目(BAEQ),對部分連續抽測區(縣)的小學進行增值性評價分析,以學生2009年三年級數學測試為前測成績、2011年五年級數學測試成績為後測成績,分析學校數學學業增值的情況;(2)以中高考成績為數據基礎的學校增值性評價項目,采用多層線性統計模型,研究學校對學業水平的淨效應[4]。杜屏等人基於我國西部五省調研數據的實證分析,采用多層線性統計模型,來研究農村初級中學學校效能的增值性評價[5]。
蘇州市教育質量監測中心在借鑒這些學生增值評價模型的基礎上,嚐試構建適用於蘇州本土、易於一線老師理解和接受的增值評價模型。
構建追蹤監測的增值評價模型
蘇州監測設計了對同一級學生進行追蹤監測的方式。以2018年的監測為例,2018級的學生有2018年一年的監測數據,2017級的學生有2017年和2018年兩年的監測數據,2016級的學生則有2016年、2017年和2018年三年的監測數據。因此,可以通過對連續監測學校的數據進行追蹤比較,實現增值評價。
1.實現不同測試卷的等值
蘇州監測的各學科測試分為A、B卷,在難度和區分度上並不完全一致,從嚴格意義上來說,A、B卷並不可比。為了解決同一學科不同測試卷之間的可比性,監測中心采用錨題技術,將A、B卷中的部分題目組合成C卷,采用項目反應理論模型(Item Response Theory),通過Conquest軟件進行計算,將A、B卷實現等值。將Conquest軟件計算後得到的學生能力分標準化,再轉換成均分為500、標準差為100的量尺分數。
量尺分數具有不受測試題目差異和題目難度影響的特點,從而使得同一年度中以及不同年度間完成不同題本學生的分數具有可比性。
2.構建百分等級增值評價的模型
(1)模型的算法。百bai分fen等deng級ji是shi測ce量liang學xue中zhong應ying用yong最zui廣guang的de表biao示shi測ce試shi分fen數shu的de方fang法fa之zhi一yi。一yi個ge測ce試shi分fen數shu的de百bai分fen等deng級ji是shi指zhi在zai常chang模mo樣yang本ben中zhong低di於yu這zhe個ge分fen數shu的de人ren數shu的de百bai分fen比bi。因yin此ci,百bai分fen等deng級ji85表示在常模樣本中有85%的人比這個分數要低。換句話說,百分等級指出的是個體在常模群體中所處的位置,百分等級越低,個體所處的位置越低。
因(yin)為(wei)百(bai)分(fen)等(deng)級(ji)指(zhi)的(de)是(shi)個(ge)體(ti)在(zai)常(chang)模(mo)中(zhong)所(suo)處(chu)的(de)地(di)位(wei),考(kao)慮(lv)到(dao)蘇(su)州(zhou)市(shi)各(ge)區(qu)域(yu)教(jiao)育(yu)生(sheng)態(tai)的(de)差(cha)異(yi),為(wei)了(le)讓(rang)常(chang)模(mo)穩(wen)定(ding)一(yi)致(zhi),監(jian)測(ce)中(zhong)心(xin)根(gen)據(ju)學(xue)生(sheng)的(de)量(liang)尺(chi)分(fen)數(shu)來(lai)計(ji)算(suan)學(xue)生(sheng)個(ge)人(ren)的(de)百(bai)分(fen)等(deng)級(ji),並(bing)在(zai)學(xue)生(sheng)所(suo)處(chu)的(de)同(tong)一(yi)個(ge)區(qu)域(yu)中(zhong)將(jiang)學(xue)生(sheng)個(ge)體(ti)的(de)量(liang)尺(chi)分(fen)數(shu)轉(zhuan)化(hua)為(wei)百(bai)分(fen)等(deng)級(ji)。在(zai)數(shu)據(ju)計(ji)算(suan)中(zhong),以(yi)學(xue)校(xiao)中(zhong)所(suo)有(you)學(xue)生(sheng)在(zai)該(gai)區(qu)域(yu)中(zhong)的(de)百(bai)分(fen)等(deng)級(ji)的(de)平(ping)均(jun)值(zhi)來(lai)代(dai)表(biao)該(gai)學(xue)校(xiao)的(de)百(bai)分(fen)等(deng)級(ji)。
(2)模型的科學性。為了更加客觀科學地反映初中學校的增值情況,監測中心構建並比較研究了學校增值評價的兩種模型。第一種模型采集了蘇州市從2016-2018年均參加監測且可追蹤的92所學校的數據,以這些學校各科2016年百分等級和2017年百分等級、2017年百分等級和2018年百分等級(能夠體現年度間增值情況)畫散點圖,並求出擬合直線為:y=0.8929*x+5.4544,由於此模型是基於各學校實際百分等級的變化進行的擬合,因此我們把此模型稱之為“經驗模型”。
表1 “經驗模型”和“理想模型”增值比較示例

第二種模型認為,如果參測的某校某學科百分等級保持在去年的水平上,該校該學科為“零增值”,若今年的百分等級高於去年,即為“正增值”,反之,為“負增值”,用公式表示為:y=1.00*x+0.00。由於此模型不考慮各學校之間各方麵的差異(如辦學水平、資源配備),因此,我們把此模型稱之為“理想模型”。

圖1 各年各科百分等值散點圖
比較“經驗模型”和“理想模型”,我們發現兩個模型的函數圖像非常相似,尤其是中間段成績的學校差異很小,而優質學校和薄弱學校則出現少許差異。表1選取了A校作為薄弱學校代表,B校作為優質學校代表,易見,在“理想模型”中,薄弱學校相對更容易實現高增值,而優質學校實現增值的難度相對較大。
youyuyouzhixuexiaojizhonglexiangduijiaoweiyouzhideshengyuan,suoyizheleixuexiaoliyingchengdangengduodezeren,liyingpeiyanggengduodeyouzhixuesheng。yinci,zonghekaolvliangzhongmoxingdekexuexing、合理性、簡潔性和一線老師的可接受性,監測中心采用“理想模型”對學校進行百分等級增值評價,把對優質學校的增值要求提高到與對薄弱學校的增值要求一致。
(3)模型的應用。以P區域2016級為例,該區域中過去三年中均參測的學校有3年的監測數據。圖2呈現了P區域A校2016年初一、2017年初二和2018年初三的語文、數學和英語的百分等級。在計算百分等級的時候,以P區域為常模,故P區域的平均百分等級為50。從縱向看,可以看到某年各學科百分等級在P區域中的相對位置以及各學科之間的高低情況;從橫向看,可以看到某學科三年或者兩年百分等級的變化情況,以此來反映A校的增值情況。

圖2 P區A校2016級三年百分等級圓點圖
3.構建四水平增值評價的模型
(1)模型的算法。在常模中將學生個人量尺分數由高到低進行排序,按照人數占比0-25%、25%-50%、50%-75%、75%-100%,把學生分為Ⅰ、Ⅱ、Ⅲ、Ⅳ四個水平。Ⅰ水平學生表明該生量尺分數處於常模前25%,Ⅳ水平學生表明該生量尺分數處於常模後25%。tongyang,weilerangchangmowendingyizhi,yixueshengsuozaiquyuxueshengweiceliangzongtijisuanxueshenggerensigeshuiping。zaishujujisuanzhong,yixuexiaozhonggeshuipingrenshuzhanxuexiaozongrenshudebililaidaibiaoxuexiaogeshuipingdebaifenbi。
(2)模型的應用。congbaifendengjidezengzhikeyikanchuyigexuexiaomouyixuekezongtidezengzhiqingkuang。ertongguoduixuexiaosishuipingzhanbibianhuajinxingzhuizong,keyiqingxidekandaoxuexiaogekegeshuipingrenshubilisanniandebianhuaqingkuang,keyigengweijingxidizhenduanchuxuexiaojinbuhuotuibuderenqunjiegou,bianyuxuexiaomingquegaijinfangxiang,zhuazhugaijindeguanjiandian。
03
構建單次監測的增值評價模型
監jian測ce中zhong心xin根gen據ju初chu一yi新xin生sheng的de個ge人ren信xin息xi,能neng夠gou追zhui蹤zong到dao學xue生sheng的de小xiao學xue畢bi業ye學xue校xiao,因yin而er能neng夠gou實shi現xian對dui所suo追zhui蹤zong到dao的de小xiao學xue畢bi業ye生sheng學xue業ye質zhi量liang水shui平ping的de評ping價jia。由you於yu所suo追zhui蹤zong到dao的de小xiao學xue僅jin有you一yi年nian的de數shu據ju,監jian測ce中zhong心xin需xu要yao積ji極ji探tan索suo適shi合he單dan次ci監jian測ce的de增zeng值zhi評ping價jia模mo型xing。
《科爾曼報告》指出,家庭背景是影響學生學業成績的主要因素[6],有(you)關(guan)家(jia)庭(ting)背(bei)景(jing)與(yu)學(xue)生(sheng)學(xue)業(ye)成(cheng)績(ji)的(de)一(yi)係(xi)列(lie)研(yan)究(jiu)也(ye)證(zheng)實(shi),家(jia)庭(ting)社(she)會(hui)經(jing)濟(ji)地(di)位(wei)對(dui)兒(er)童(tong)的(de)學(xue)業(ye)成(cheng)就(jiu)有(you)顯(xian)著(zhu)的(de)影(ying)響(xiang),其(qi)影(ying)響(xiang)甚(shen)至(zhi)大(da)於(yu)學(xue)校(xiao)的(de)影(ying)響(xiang)。國(guo)內(nei)也(ye)有(you)很(hen)多(duo)學(xue)者(zhe)的(de)研(yan)究(jiu)表(biao)明(ming),學(xue)生(sheng)的(de)家(jia)庭(ting)社(she)會(hui)經(jing)濟(ji)地(di)位(wei)對(dui)其(qi)學(xue)業(ye)成(cheng)績(ji)有(you)重(zhong)要(yao)影(ying)響(xiang)。
(1)模型的算法。基於國外內學者的研究,監測中心嚐試以學校為單位,用蘇州市370多所小學的家庭社會經濟地位來預測學校的學業成績(用量尺分數來表示)。監測中心以各小學家庭社會經濟地位與各科學業成績繪製散點圖,並求出擬合直線以及解釋率R方,看該模型是否達到可接受的範圍,再將其與這些學校實際的學業成績進行對比,以期在一定程度上反映小學的增值情況。
(2)模型的科學性。在計算學校家庭社會經濟地位(SES)時,參照國際上通用的以父母受教育程度、fumuzhiyehejiatingyongyouwulaihechengxueshengdejiatingshehuijingjidiwei,bingtongguojisuanxuexiaosuoyouxueshengpingjundejiatingshehuijingjidiweilaidaibiaoxuexiaodejiatingshehuijingjidiwei。
其中,英語學業成績與家庭社會經濟地位的關係最為密切,回歸方程是y=51.074*x+508.88。解釋率R方為0.5808,數學學業成績與家庭社會經濟地位的關係相對最低,解釋率R方為0.3648,但解釋率也達到可以接受的程度。
(3)模型的應用。根(gen)據(ju)擬(ni)合(he)直(zhi)線(xian),可(ke)以(yi)看(kan)出(chu)各(ge)小(xiao)學(xue)的(de)增(zeng)值(zhi)情(qing)況(kuang),如(ru)某(mou)小(xiao)學(xue)某(mou)學(xue)科(ke)位(wei)於(yu)該(gai)擬(ni)合(he)直(zhi)線(xian)的(de)上(shang)方(fang),說(shuo)明(ming)該(gai)小(xiao)學(xue)該(gai)學(xue)科(ke)為(wei)正(zheng)增(zeng)值(zhi),若(ruo)位(wei)於(yu)該(gai)擬(ni)合(he)直(zhi)線(xian)的(de)下(xia)方(fang),說(shuo)明(ming)為(wei)負(fu)增(zeng)值(zhi)。此(ci)外(wai),為(wei)了(le)對(dui)各(ge)小(xiao)學(xue)提(ti)供(gong)數(shu)據(ju)預(yu)警(jing),監(jian)測(ce)中(zhong)心(xin)基(ji)於(yu)各(ge)學(xue)科(ke)增(zeng)值(zhi)情(qing)況(kuang),先(xian)計(ji)算(suan)各(ge)學(xue)科(ke)的(de)平(ping)均(jun)增(zeng)值(zhi)以(yi)及(ji)增(zeng)值(zhi)的(de)標(biao)準(zhun)差(cha),將(jiang)與(yu)平(ping)均(jun)增(zeng)值(zhi)相(xiang)差(cha)1個標準差到1.5個標準差作為1級預警,將與平均增值相差1.5個標準差以上的作為2級預警。以D小學的各科增值數據為例,英語學科正增值14分,表現較好,語文學科負增值1分,但是不在預警範圍之內,科學學科負增值29分,為1級預警,數學學科負增值49分,已經達到2級預警,需要引起重視。

04
不足與展望
在實施增值評價的過程中,家庭、社(she)會(hui)和(he)學(xue)校(xiao)自(zi)身(shen)等(deng)諸(zhu)多(duo)因(yin)素(su)均(jun)會(hui)對(dui)學(xue)校(xiao)教(jiao)育(yu)產(chan)生(sheng)影(ying)響(xiang)。因(yin)此(ci),在(zai)構(gou)建(jian)增(zeng)值(zhi)評(ping)價(jia)模(mo)型(xing)時(shi),還(hai)需(xu)要(yao)評(ping)判(pan)不(bu)同(tong)教(jiao)育(yu)生(sheng)態(tai)層(ceng)麵(mian)各(ge)種(zhong)因(yin)素(su)對(dui)學(xue)生(sheng)學(xue)業(ye)的(de)影(ying)響(xiang)程(cheng)度(du),以(yi)提(ti)高(gao)模(mo)型(xing)的(de)科(ke)學(xue)性(xing)和(he)簡(jian)潔(jie)性(xing)。
監jian測ce中zhong心xin目mu前qian構gou建jian的de增zeng值zhi評ping價jia模mo型xing雖sui然ran初chu步bu解jie決jue了le對dui本ben地di區qu學xue校xiao教jiao育yu質zhi量liang進jin行xing發fa展zhan性xing評ping價jia的de要yao求qiu,但dan也ye存cun在zai一yi定ding的de不bu足zu。如ru針zhen對dui初chu中zhong學xue校xiao增zeng值zhi采cai用yong的de“理想模型”,雖然簡潔且容易理解,但是對數據處理相對有些粗糙,無法全麵考慮學生發展過程中學生個體、教師、學xue校xiao等deng不bu同tong層ceng麵mian在zai其qi中zhong發fa揮hui的de作zuo用yong。而er對dui於yu小xiao學xue增zeng值zhi模mo型xing的de探tan索suo雖sui然ran也ye得de到dao學xue校xiao的de認ren可ke,但dan是shi僅jin考kao慮lv家jia庭ting社she會hui地di位wei對dui學xue生sheng學xue業ye成cheng就jiu的de影ying響xiang是shi不bu夠gou全quan麵mian的de。
隨著多元統計技術的迅速發展,多數學者在研究預測學生的學業成績時,采用了多水平線性模型的方法,這樣能夠區分不同層次、不同因素對學生學業發展所起的作用,比如學生層麵的變量,包括學生入學水平、家庭社會經濟地位、學習品質等,以及學校層麵的變量。
監jian測ce中zhong心xin將jiang在zai目mu前qian整zheng體ti評ping價jia學xue校xiao增zeng值zhi情qing況kuang的de基ji礎chu上shang,更geng深shen入ru地di研yan究jiu各ge種zhong因yin素su對dui學xue生sheng學xue業ye成cheng績ji發fa展zhan的de影ying響xiang程cheng度du,以yi期qi能neng夠gou區qu分fen各ge種zhong因yin素su的de責ze任ren,剔ti除chu與yu學xue校xiao無wu關guan因yin素su的de影ying響xiang,實shi現xian對dui學xue校xiao“淨增值”的準確測量,從而構建更加科學公正、更加適合蘇州教育實際的發展性評價機製。

總結和展望是為了更好地未來
參考文獻:
[1] 英〕薩麗·托馬斯.運用“增值”評量指標評估學校表現[J].教育研究,2005(9).
[2]王曉平,齊森,謝小慶.美國學校“成長測量”的7種主要方法[J].中國考試,2018(6).
[3]邊玉芳,王燁暉.增值評價:學校辦學質量評估的一種有效途徑[J].教育學報,2013.
[4]北京市教育督導與教育質量評價研究中心.增值性評價評出學校的“加工力”[J].人民教育, 2016(16).
[5]杜屏,楊中超.農村初級中學學校效能的增值性評價—基於我國西部五省調研數據的實證分析[J]. 北京師範大學學報(社會科學版),2011(6).
[6]James S. Coleman et al. Equality of Education Opportunity[M].WashingtonDC:Government Printing Office,1966.
文章來源:《中小學信息技術教育》2019年第十期 34-38頁。
注:本文是江蘇省教育科學“十三五”規劃重點課題《區域初中教育質量監測結果運用的實踐研 究》階段性成果,課題批準文號:E-a/2016/04。
