一、引言:新冠疫情下的教育海啸
在发展经济学的研究范畴中,教育的供给侧质量直接关系到人力资本积累与经济长期增长。而2019年底爆发的新冠疫情,对发展中国家的教育系统而言,无异于一场“海啸”——全球超过3亿儿童因学校关闭受到影响,截至2021年9月底,仍有1.28亿学习者未能重返校园。这场持续的教育中断,并非仅造成“学习停滞”,而是对儿童学习水平产生了灾难性冲击,且这种冲击进一步加剧了发展中国家教育系统长期存在的深层矛盾。
本讲义将从疫情带来的即时影响切入,结合印度等国的实证数据,剖析发展中国家教育供给侧的核心问题,并通过一系列严谨的田野实验与研究,探索有效的干预路径,最终指向教育系统的可持续改进方向。
二、疫情对学习水平的灾难性冲击:数据见证
为清晰呈现疫情的影响,我们以印度卡纳塔克邦为样本(覆盖1.8万名儿童),对比2018年(疫情前)与2021年(疫情后)各年级儿童的算术和阅读能力,数据直观反映了学习水平的显著倒退。
(一)算术能力的普遍下滑
算术能力的评估涵盖“连1-9数字都不认识”“识别10-99数字”“减法”“除法”四个核心维度,各年级在2021年的表现均出现不同程度的退化:
- 一年级(Std I):“连1-9数字都不认识”的儿童比例从2018年的29.7%飙升至2021年的42.6%,而能完成除法的儿童比例始终仅为0.4%,未实现任何提升;
- 三年级(Std III):能完成减法的儿童比例从23.3%降至15.7%,除法能力从3.0%降至1.6%;
- 即便是高年级,退化仍明显存在:八年级(Std VIII)“识别10-99数字”的比例从1.3%升至4.0%,减法能力从26.6%小幅降至31.8%,但除法能力仅从39.0%微升至38.7%,几乎停滞。
这种退化并非“个别年级现象”,而是贯穿小学全阶段,反映出疫情导致的学习中断对基础算术技能的“侵蚀效应”——儿童不仅未能习得新知识,反而遗忘了已掌握的基础能力。
(二)阅读能力的严重倒退
阅读能力采用“渐进式评估工具”,从“连字母都不认识”到“能阅读二年级水平课文”分为五个层级,层级越高代表阅读能力越强。对比数据显示:
- 一年级(Std I):“连字母都不认识”的儿童比例从2018年的40.3%升至2021年的56.8%,而能阅读二年级水平课文的比例从1.9%降至1.7%;
- 四年级(Std IV):能阅读二年级水平课文的儿童比例从33.2%大幅降至18.3%,几乎腰斩;
- 八年级(Std VIII):尽管仍有66.2%的儿童能阅读二年级水平课文,但“连字母都不认识”的比例从2.0%升至2.4%,基础阅读能力薄弱的群体有所扩大。
需要特别说明的是,这份阅读评估工具的每个层级都是“互斥的”——每个年级的儿童被精准划分到不同能力层级,总占比为100%,因此数据的变化真实反映了儿童阅读能力的“整体下移”,而非个别层级的波动。
三、发展中国家教育的长期困境:高入学率下的低质量陷阱
疫情的冲击之所以“灾难性”,本质上是因为发展中国家的教育系统早已存在深层隐患——高入学率、低出勤率、低学习水平的“一高两低”陷阱。
(一)印度的现状:高入学率与低出勤率的矛盾
根据印度《年度教育状况报告》(ASER)2014年的数据,印度农村6-14岁儿童的入学率已达96.7%,且连续6年保持在96%以上,这一数字看似接近发达国家水平。但与之形成鲜明对比的是,随机选取9-11月的任意一天走访政府学校,会发现仅有71%的已入学儿童实际到校。更值得关注的是,各州的日均出勤率差异极大,部分地区甚至低于60%,这种“名义入学、实际缺课”的现象,使得教育资源的投入难以转化为实际学习成果。
(二)全球视角:入学率与学习成果的脱节
从全球范围看,primary school age儿童的入学率在2010年后已普遍提升,但“入学”并不等于“学会”。联合国教科文组织(UNESCO)2015年的净入学率数据显示,多数发展中国家的净入学率已超过80%,但世界银行的“统一学习数据”显示,学习成果与人均GDP之间虽有正相关,但许多中低收入国家(如印度、加纳、多哥等)的人均GDP增长并未带来学习成果的同步提升——这些国家的儿童在标准化测试中的平均得分,远低于新加坡、中国、美国等国家,甚至低于同收入水平的其他国家。
(三)长期趋势:学习水平的持续低迷
印度的长期数据更能说明问题:2011-2016年,农村五年级儿童中能达到二年级阅读水平的比例始终徘徊在50%左右,未出现明显增长;2014年的ASER数据显示,三年级儿童仅25.3%能完成减法,五年级儿童仅50.5%能完成减法、26.1%能完成除法,而八年级儿童的除法通过率也仅为44.1%。这种“低年级基础薄弱、高年级难以弥补”的趋势,在疫情前就已存在,疫情则进一步放大了这一问题。
四、问题根源探析:为何学校教不会孩子?
通过一系列田野实验与研究,我们发现,发展中国家教育质量低下的核心原因,并非“儿童不能学”,也非“资源不足”,而是学校系统未能识别和利用儿童的现有知识,且教学内容与实际需求脱节。
(一)实验一:学前儿童的数学直觉——非符号能力与学校数学的断裂
Dillon等人(2016)在德里214所普拉瑟姆(Pratham)运营的学前教育机构中,对1539名4-5岁儿童开展了随机对照试验(RCT),旨在探索学前数学教育的有效性。实验将儿童随机分为三组:
- 数学游戏组:通过“数字比较”(判断红点数与蓝点数多少)、“视觉形式分析”(找出不属于同一类的卡片)等非符号游戏开展教学;
- 社交游戏组(主动对照组):通过强调情绪感知和眼神交流的社交游戏开展教学;
- 常规课程组(无处理对照组):按照原有学前课程教学。
实验周期长达12个月以上,包含“前测(第1个月)-游戏干预(第2-5个月)-后测(第6个月、儿童入学后第2次、第3次)”三个阶段,核心发现如下:
- 印度儿童与美国儿童拥有相同的数学直觉:尽管这些印度儿童此前从未接触过类似游戏,但他们的学习速度和参与热情与美国儿童相当,证明贫困地区的儿童同样具备对数字和几何的“直觉性把握”,不存在“先天学习能力不足”的问题;
- 数学游戏对非符号数学能力有显著且持久的影响:第1次后测(EL1)中,数学游戏组的非符号数学测试得分比对照组高0.415个标准差(p<0.001,统计显著),社交游戏组比对照组高0.164个标准差(p<0.01);即便在干预结束1年后的第3次后测(EL3)中,数学游戏组的优势仍达0.287个标准差(p<0.001),未出现明显衰减;
- 非符号能力未能转化为学校数学成绩:第1次后测中,数学游戏组在符号数学(如识别阿拉伯数字、数字单词)上的表现虽比对照组高0.132个标准差,但这一优势在后续后测中逐渐消失。
这一实验揭示了第一个关键问题:学校系统未能将儿童的直觉性非符号数学能力,转化为系统性的符号数学能力——儿童在学前阶段具备的数学潜力,在进入小学后被“浪费”了。
(二)实验二:市场儿童的数学能力——实用技能与学校数学的脱节
Banerjee等人(2018)在加尔各答和德里开展了“市场数学研究”,通过“神秘购物者”与“模拟交易”的方式,对比了“工作儿童”(在市场中售卖商品的儿童)与“学校儿童”的数学能力差异,实验设计如下:
- 研究对象:加尔各答92个市场的201名儿童、德里39个市场的400名儿童,分为“工作儿童”(直接参与商品售卖)和“学校儿童”(仅上学未参与售卖)两组;
- 评估方式:
- 书面评估:采用ASER标准的学校算术测试(抽象数学题);
- 口头评估:包括“简单问题”“锚定问题”(与市场交易相关的问题)、“陌生假设交易”(不同价格、不同单位的交易场景);
- 模拟交易:让儿童完成涉及“乘法/除法+减法”的复杂交易计算(如“以特殊数量售卖两种商品,计算总金额”)。
实验的核心发现颠覆了传统认知:
- 工作儿童在实用数学场景中表现卓越:在模拟交易中,德里工作儿童的正确计算比例高达0.95-0.98,加尔各答工作儿童也达0.94-0.95,即便需要修正错误后才能得出正确答案,比例仍远高于学校儿童(德里学校儿童仅0.55-0.58);
- 工作儿童的数学能力具备灵活性:无论是按“单位”售卖还是按“千克/升”售卖,工作儿童都能熟练完成计算,适应不同的交易场景;
- 工作儿童在学校数学测试中表现糟糕:在书面算术测试中,加尔各答工作儿童的除法通过率仅0.32,德里工作儿童仅0.15,与他们在市场中的表现形成鲜明对比。
进一步分析发现,问题不在于儿童的数学能力本身,而在于学校数学的“抽象呈现方式”:当数学问题与市场交易、实际生活结合时,儿童能熟练运用算术技能;但当问题以抽象的数字、公式形式呈现时,他们便难以应对。此外,研究还发现,工作儿童在抽象问题中若能将其“转化为熟悉的交易场景”(如“四舍五入”简化计算),仍能取得较好表现,这进一步证明儿童具备数学应用能力,只是学校教学未能搭建“实用场景”与“抽象知识”的桥梁。
(三)排除无关因素:资源与激励并非核心问题
很多人认为,发展中国家教育质量差是因为“资源不足”(如教师工资低、班级规模大)或“教师缺乏激励”,但实证数据否定了这一观点:
- 教师工资与教学效果无关:印度公立学校教师的工资远高于农村儿童就读的廉价私立学校,但私立学校的教学效果并不逊色;印度尼西亚的大规模实验显示,将教师工资翻倍后,学生的学习成绩并未出现任何提升(De Ree et al. 2018);
- 班级规模并非关键:在印度、肯尼亚等国的实验中,仅缩小班级规模而不改变教学方法,对学习成果无显著影响;
- 非永久教师更有效:那些工资仅为正规教师几分之一的“非永久教师”,反而能取得更好的教学效果;
- 激励的“有限有效性”:针对性激励能带来短期改善(如印度乌代布尔给教师的“出勤激励”、安得拉邦给教师的“成绩激励”),但私立学校的“生存激励”(依赖家长满意度)并未带来全面提升——RCT实验显示,私立学校在印地语和英语教学上更有优势(这是公立学校不重视的科目),但在数学和泰卢固语教学上反而不如公立学校,且私立学校的优势主要源于“学生筛选”(家长更重视教育的家庭会选择私立学校),而非教学质量本身(Muralidharan and Sundararaman, 2015)。
(四)核心症结:“课程的暴政”
真正的核心问题,是“课程的暴政”——无论儿童的实际能力如何,学校必须按既定课程进度完成教学,完全忽视了儿童的基础差异。
以印度哈里亚纳邦四年级的数学课程为例:
- 10月:学习“圆的认识”(用手镯、绳子理解圆,用圆规画圆)、“分数”(一半、四分之一),共安排11课时;
- 11月:学习“图案”(无数字图案、数字字母图案)、“乘法表与除法”(掌握15以内乘法表,练习除法应用题),共安排14课时;
- 12月:学习“重量”(克与千克的换算,使用天平称重),安排12课时;
- 1月:学习“周长与面积”(规则与不规则图形的周长、面积计算),安排8课时。
这套课程的设计完全基于“理想化的学习进度”,假设儿童已掌握前序知识,但现实中,多数四年级儿童甚至未能掌握二年级的基础算术和阅读能力。这种“超纲教学”导致儿童无法跟上进度,逐渐产生挫败感,最终放弃学习——课程的“刚性”与儿童能力的“弹性”之间的矛盾,是教育质量低下的根本原因。
值得注意的是,这并非印度独有的问题:肯尼亚、法国等国家也存在类似的“精英化课程”,而芬兰之所以能取得优异的测试成绩,恰恰是因为其课程设计摆脱了“进度至上”的束缚,更注重儿童的实际学习能力。
五、解决方案探索:从实验到规模化干预
针对上述问题,研究者通过近20年的实验,探索出一系列有效的干预路径,核心思路是“放弃不切实际的课程进度,聚焦基础技能,利用儿童的现有知识”。
(一)路径一:“因材施教”(Teaching at the Right Level, TaRL)模式
TaRL模式的核心是“按能力分组,而非按年级分组”,通过“评估-分组-聚焦基础”三个步骤,帮助儿童补齐基础技能,其发展历程长达15年,经过多次迭代验证:
- 发展历程:
- 2001-2003年:“Balsakhi”项目——普拉瑟姆的社区志愿者在城市学校开展“课外补救教学”;
- 2005-2006年:乡村志愿者为农村小学生提供社区课堂;
- 2008年:政府教师主导的“暑期夏令营”,由乡村志愿者提供支持;
- 2008-2010年:农村学校中,政府教师主导、普拉瑟姆志愿者支持的学习改进项目;
- 2010-2013年:加纳开展“教师主导vs导师主导”的校内外对比试验;
- 2012-2013年:政府学术官员现场指导的“教师主导模式”;
- 2013-2014年:政府小学中的“学习营”——普拉瑟姆团队主导,乡村志愿者支持。
- 核心实施步骤:
- 步骤1:评估——用简单工具测试儿童的基础技能(如算术的数字识别、减法,阅读的字母识别、单词阅读);
- 步骤2:分组——按实际学习水平进行“同质分组”(如“仅能识别数字组”“能完成减法组”),而非按年级分组;
- 步骤3:聚焦基础——每天或每年安排固定时间,专门教授基础技能,而非追求课程进度。
- 实证效果:
- 北方邦2013-2014年实验:普拉瑟姆工作人员和志愿者在学校内开展“50天密集营”,每天2小时,覆盖3-5年级学生,分为“2个20天营”(T1组)、“4个10天营”(T2组)和对照组(120所学校);
- 结果:T1和T2组的学生在印地语和数学上的成绩提升了0.7个标准差,且成本极低——巨大的学习增益使其成为“成本效益极高”的干预方式。
(二)路径二:数字工具干预——Mindspark的潜力与局限
Mindspark是一款基于AI的教育软件,核心是“自适应 drills”——根据每个儿童的能力水平,提供个性化的练习内容,研究者通过“彩票分配”的方式(随机给予儿童使用Mindspark辅导的机会),评估其效果:
- 实验结果:
- 基础技能显著提升:彩票中奖组(使用Mindspark)在数学和印地语的“基础题”上表现优异,数学基础题正确率提升0.081个标准差,印地语基础题提升0.050个标准差;
- 对年级水平题目无效:在“符合年级课程的题目”上,数学正确率仅提升0.0089个标准差(统计不显著),印地语提升0.063个标准差;
- 学校考试影响有限:对学校期末考试的总成绩影响仅为0.100个标准差,其中数学仅0.059个标准差,科学0.077个标准差,均无统计显著性。
- 核心局限:
- 家长付费意愿低:尽管Mindspark能带来基础技能提升,但家长对其接受度低——实验结束后,三个Mindspark中心因 enrollment 率远低于80%的目标(无法证明家长的付费意愿),失去了慈善资助而关闭;
- 脱离学校系统:Mindspark主要用于课外辅导,而儿童的主要时间仍在学校,需要额外“说服儿童参与”,难以形成持续影响;
- 学校的“知识垄断”:学校仍掌握着考试和知识合法性的主导权,课外工具的提升难以转化为学校认可的“成绩”,进而影响家长和儿童的参与动力。
(三)路径三:学前与早期教育的游戏干预——可规模化的有效方案
基于第一份学前数学实验的教训(非符号游戏未能转化为学校数学能力),Duflo-Spelke团队开展了三次递进式实验,探索“能连接非符号与符号数学”的游戏干预模式:
实验二:混合游戏的优势
- 实验设计:在德里231所学前教育机构中,1896名儿童被随机分为四组:非符号数学游戏组、符号数学游戏组、混合数学游戏组(非符号+符号)、无处理对照组;
- 核心发现:
- 非符号与混合游戏提升直觉能力:非符号游戏组和混合游戏组在“数字感知”“几何识别”等非符号测试中,得分显著高于对照组(EL1时均达0.198以上标准差,p<0.001),且效果持续到EL3;
- 混合游戏连接符号与非符号:混合游戏组在EL1时的符号数学能力(如识别数字、完成简单运算)提升0.155个标准差(p<0.001),且在EL2、EL3时仍保持优势,成功将儿童的直觉能力转化为系统性的符号数学能力;
- 纯符号游戏无效:仅进行符号游戏的组,在非符号测试中无任何提升,说明脱离直觉的符号教学无法让学前儿童理解数字的“实际意义”。
实验三:可规模化的课堂游戏模式
- 实验设计:在141所政府学校的幼儿园和一年级,由常规教师主导,让所有儿童分组参与游戏,游戏聚焦“十进制结构”(如“1个十=10个一”)和“符号与非符号的对应”(如圆点阵列与阿拉伯数字的匹配),具体包括:
- 数字比较游戏:幼儿园聚焦1-20,一年级聚焦1-100,卡片从“双面都有圆点/数字”逐渐过渡到“仅单面有符号”;
- 形状识别游戏:区分不同边数的图形、直角/锐角、对称图形等;
- 移动游戏:在1-20(幼儿园)或1-100(一年级)的棋盘上,根据指令移动棋子,结合圆点和数字完成任务。
- 核心优势与效果:
- 教师接受度高:与难以实施的“补救教学包”不同,游戏干预深受教师欢迎,且实施频率越高,效果越好;
- 培训成本低:仅需1天培训+配套材料,教师即可独立开展;
- 效果显著:幼儿园和一年级学生的“综合数学能力”“符号数学能力”均显著提升,其中幼儿园综合数学能力提升0.112个标准差(p<0.05),一年级提升0.107个标准差,非符号数学能力也同步提升。
- 规模化前景:
- 目前已与多个邦政府沟通,计划扩大实施范围;
- 正在与游戏公司洽谈合作,希望将教学游戏商业化出版,降低推广成本。
六、总结:教育改进的长期主义视角
发展中国家的教育供给侧改革,不存在“一蹴而就的银弹”,但通过近20年的实证研究,我们已明确“什么有效、什么无效”:
(一)核心结论
- 儿童具备学习潜力:无论是学前儿童的数学直觉,还是市场儿童的实用数学能力,都证明发展中国家的儿童并非“不能学”,而是学校系统未能充分利用其潜力;
- 问题的核心是“脱节”:课程与儿童能力脱节、教学与实际需求脱节、学校与儿童现有知识脱节;
- 有效干预的共性:聚焦基础技能、按能力分组、利用游戏化/个性化方式、融入儿童熟悉的场景(如市场交易、日常游戏);
- 必须依托学校系统:课外干预(如Mindspark)虽有潜力,但学校仍掌握知识合法性和考试主导权,脱离学校的干预难以持续,改革必须“嵌入”现有学校系统。
(二)未来方向
- 利用“边际机会”:学校系统的改革难以一蹴而就,但可以从“更开放的边际”切入,包括:
- 辅导机构:作为学校教育的补充,聚焦基础技能;
- 学前教育:这是干预效果最强、阻力最小的领域;
- 低年级教育:在一、二年级补充基础技能游戏,避免儿童早期掉队;
- 暑期项目:利用假期开展密集型基础技能培训,弥补学期内的不足。
- 警惕“边际关闭”风险:随着边际干预的扩大,可能面临“过度监管”(如规范辅导机构)、“标准化”(如给学前教育设定刚性课程)等风险,需保持干预的灵活性。
- 坚持长期主义:教育改革是一个漫长的过程,需要持续与学校系统互动,不断撬动“新的改革支点”。尽管过程可能充满挫折,但每一次有效的干预,都能让数百万儿童受益——这种“乘法效应”,正是教育供给侧改革的价值所在。
参考文献
- ASER. Annual Status of Education Report (Rural). Various Reports. http://www.asercentre.org/Keywords/p/393.html
- Banerjee, A.V., Bhattacharjee, S., Chattopadhyay, R. and Ganimian, A.J., 2017. The Untapped math skills of working children in India: Evidence, possible explanations, and implications. Unpublished manuscript.
- De Ree, J., Muralidharan, K., Pradhan, M. and Rogers, H., 2018. Double for nothing? Experimental evidence on an unconditional teacher salary increase in Indonesia. The Quarterly Journal of Economics, 133(2), pp.993-1039.
- Dillon, M.R., Kannan, H., Dean, J.T., Spelke, E.S. and Duflo, E., 2017. Cognitive science in the field: A preschool intervention durably enhances intuitive but not formal mathematics. Science, 357(6346), pp.47-55.
- Duflo, E., Hanna, R. and Ryan, S.P., 2012. Incentives work: Getting teachers to come to school. American Economic Review, 102(4), pp.1241-78.
- Muralidharan, K. and Sundararaman, V., 2011. Teacher performance pay: Experimental evidence from India. Journal of political Economy, 119(1), pp.39-77.
- Muralidharan, K. and Sundararaman, V., 2015. The aggregate effect of school choice: Evidence from a two-stage experiment in India. The Quarterly Journal of Economics, 130(3), pp.1011-1066.