一、引言:新冠疫情下的教育海啸

在发展经济学的研究范畴中,教育的供给侧质量直接关系到人力资本积累与经济长期增长。而2019年底爆发的新冠疫情,对发展中国家的教育系统而言,无异于一场“海啸”——全球超过3亿儿童因学校关闭受到影响,截至2021年9月底,仍有1.28亿学习者未能重返校园。这场持续的教育中断,并非仅造成“学习停滞”,而是对儿童学习水平产生了灾难性冲击,且这种冲击进一步加剧了发展中国家教育系统长期存在的深层矛盾。

本讲义将从疫情带来的即时影响切入,结合印度等国的实证数据,剖析发展中国家教育供给侧的核心问题,并通过一系列严谨的田野实验与研究,探索有效的干预路径,最终指向教育系统的可持续改进方向。

二、疫情对学习水平的灾难性冲击:数据见证

为清晰呈现疫情的影响,我们以印度卡纳塔克邦为样本(覆盖1.8万名儿童),对比2018年(疫情前)与2021年(疫情后)各年级儿童的算术和阅读能力,数据直观反映了学习水平的显著倒退。

(一)算术能力的普遍下滑

算术能力的评估涵盖“连1-9数字都不认识”“识别10-99数字”“减法”“除法”四个核心维度,各年级在2021年的表现均出现不同程度的退化:

  • 一年级(Std I):“连1-9数字都不认识”的儿童比例从2018年的29.7%飙升至2021年的42.6%,而能完成除法的儿童比例始终仅为0.4%,未实现任何提升;
  • 三年级(Std III):能完成减法的儿童比例从23.3%降至15.7%,除法能力从3.0%降至1.6%;
  • 即便是高年级,退化仍明显存在:八年级(Std VIII)“识别10-99数字”的比例从1.3%升至4.0%,减法能力从26.6%小幅降至31.8%,但除法能力仅从39.0%微升至38.7%,几乎停滞。

这种退化并非“个别年级现象”,而是贯穿小学全阶段,反映出疫情导致的学习中断对基础算术技能的“侵蚀效应”——儿童不仅未能习得新知识,反而遗忘了已掌握的基础能力。

(二)阅读能力的严重倒退

阅读能力采用“渐进式评估工具”,从“连字母都不认识”到“能阅读二年级水平课文”分为五个层级,层级越高代表阅读能力越强。对比数据显示:

  • 一年级(Std I):“连字母都不认识”的儿童比例从2018年的40.3%升至2021年的56.8%,而能阅读二年级水平课文的比例从1.9%降至1.7%;
  • 四年级(Std IV):能阅读二年级水平课文的儿童比例从33.2%大幅降至18.3%,几乎腰斩;
  • 八年级(Std VIII):尽管仍有66.2%的儿童能阅读二年级水平课文,但“连字母都不认识”的比例从2.0%升至2.4%,基础阅读能力薄弱的群体有所扩大。

需要特别说明的是,这份阅读评估工具的每个层级都是“互斥的”——每个年级的儿童被精准划分到不同能力层级,总占比为100%,因此数据的变化真实反映了儿童阅读能力的“整体下移”,而非个别层级的波动。

三、发展中国家教育的长期困境:高入学率下的低质量陷阱

疫情的冲击之所以“灾难性”,本质上是因为发展中国家的教育系统早已存在深层隐患——高入学率、低出勤率、低学习水平的“一高两低”陷阱。

(一)印度的现状:高入学率与低出勤率的矛盾

根据印度《年度教育状况报告》(ASER)2014年的数据,印度农村6-14岁儿童的入学率已达96.7%,且连续6年保持在96%以上,这一数字看似接近发达国家水平。但与之形成鲜明对比的是,随机选取9-11月的任意一天走访政府学校,会发现仅有71%的已入学儿童实际到校。更值得关注的是,各州的日均出勤率差异极大,部分地区甚至低于60%,这种“名义入学、实际缺课”的现象,使得教育资源的投入难以转化为实际学习成果。

(二)全球视角:入学率与学习成果的脱节

从全球范围看,primary school age儿童的入学率在2010年后已普遍提升,但“入学”并不等于“学会”。联合国教科文组织(UNESCO)2015年的净入学率数据显示,多数发展中国家的净入学率已超过80%,但世界银行的“统一学习数据”显示,学习成果与人均GDP之间虽有正相关,但许多中低收入国家(如印度、加纳、多哥等)的人均GDP增长并未带来学习成果的同步提升——这些国家的儿童在标准化测试中的平均得分,远低于新加坡、中国、美国等国家,甚至低于同收入水平的其他国家。

(三)长期趋势:学习水平的持续低迷

印度的长期数据更能说明问题:2011-2016年,农村五年级儿童中能达到二年级阅读水平的比例始终徘徊在50%左右,未出现明显增长;2014年的ASER数据显示,三年级儿童仅25.3%能完成减法,五年级儿童仅50.5%能完成减法、26.1%能完成除法,而八年级儿童的除法通过率也仅为44.1%。这种“低年级基础薄弱、高年级难以弥补”的趋势,在疫情前就已存在,疫情则进一步放大了这一问题。

四、问题根源探析:为何学校教不会孩子?

通过一系列田野实验与研究,我们发现,发展中国家教育质量低下的核心原因,并非“儿童不能学”,也非“资源不足”,而是学校系统未能识别和利用儿童的现有知识,且教学内容与实际需求脱节。

(一)实验一:学前儿童的数学直觉——非符号能力与学校数学的断裂

Dillon等人(2016)在德里214所普拉瑟姆(Pratham)运营的学前教育机构中,对1539名4-5岁儿童开展了随机对照试验(RCT),旨在探索学前数学教育的有效性。实验将儿童随机分为三组:

  1. 数学游戏组:通过“数字比较”(判断红点数与蓝点数多少)、“视觉形式分析”(找出不属于同一类的卡片)等非符号游戏开展教学;
  2. 社交游戏组(主动对照组):通过强调情绪感知和眼神交流的社交游戏开展教学;
  3. 常规课程组(无处理对照组):按照原有学前课程教学。

实验周期长达12个月以上,包含“前测(第1个月)-游戏干预(第2-5个月)-后测(第6个月、儿童入学后第2次、第3次)”三个阶段,核心发现如下:

  1. 印度儿童与美国儿童拥有相同的数学直觉:尽管这些印度儿童此前从未接触过类似游戏,但他们的学习速度和参与热情与美国儿童相当,证明贫困地区的儿童同样具备对数字和几何的“直觉性把握”,不存在“先天学习能力不足”的问题;
  2. 数学游戏对非符号数学能力有显著且持久的影响:第1次后测(EL1)中,数学游戏组的非符号数学测试得分比对照组高0.415个标准差(p<0.001,统计显著),社交游戏组比对照组高0.164个标准差(p<0.01);即便在干预结束1年后的第3次后测(EL3)中,数学游戏组的优势仍达0.287个标准差(p<0.001),未出现明显衰减;
  3. 非符号能力未能转化为学校数学成绩:第1次后测中,数学游戏组在符号数学(如识别阿拉伯数字、数字单词)上的表现虽比对照组高0.132个标准差,但这一优势在后续后测中逐渐消失。

这一实验揭示了第一个关键问题:学校系统未能将儿童的直觉性非符号数学能力,转化为系统性的符号数学能力——儿童在学前阶段具备的数学潜力,在进入小学后被“浪费”了。

(二)实验二:市场儿童的数学能力——实用技能与学校数学的脱节

Banerjee等人(2018)在加尔各答和德里开展了“市场数学研究”,通过“神秘购物者”与“模拟交易”的方式,对比了“工作儿童”(在市场中售卖商品的儿童)与“学校儿童”的数学能力差异,实验设计如下:

  1. 研究对象:加尔各答92个市场的201名儿童、德里39个市场的400名儿童,分为“工作儿童”(直接参与商品售卖)和“学校儿童”(仅上学未参与售卖)两组;
  2. 评估方式:
    • 书面评估:采用ASER标准的学校算术测试(抽象数学题);
    • 口头评估:包括“简单问题”“锚定问题”(与市场交易相关的问题)、“陌生假设交易”(不同价格、不同单位的交易场景);
    • 模拟交易:让儿童完成涉及“乘法/除法+减法”的复杂交易计算(如“以特殊数量售卖两种商品,计算总金额”)。

实验的核心发现颠覆了传统认知:

  1. 工作儿童在实用数学场景中表现卓越:在模拟交易中,德里工作儿童的正确计算比例高达0.95-0.98,加尔各答工作儿童也达0.94-0.95,即便需要修正错误后才能得出正确答案,比例仍远高于学校儿童(德里学校儿童仅0.55-0.58);
  2. 工作儿童的数学能力具备灵活性:无论是按“单位”售卖还是按“千克/升”售卖,工作儿童都能熟练完成计算,适应不同的交易场景;
  3. 工作儿童在学校数学测试中表现糟糕:在书面算术测试中,加尔各答工作儿童的除法通过率仅0.32,德里工作儿童仅0.15,与他们在市场中的表现形成鲜明对比。

进一步分析发现,问题不在于儿童的数学能力本身,而在于学校数学的“抽象呈现方式”:当数学问题与市场交易、实际生活结合时,儿童能熟练运用算术技能;但当问题以抽象的数字、公式形式呈现时,他们便难以应对。此外,研究还发现,工作儿童在抽象问题中若能将其“转化为熟悉的交易场景”(如“四舍五入”简化计算),仍能取得较好表现,这进一步证明儿童具备数学应用能力,只是学校教学未能搭建“实用场景”与“抽象知识”的桥梁。

(三)排除无关因素:资源与激励并非核心问题

很多人认为,发展中国家教育质量差是因为“资源不足”(如教师工资低、班级规模大)或“教师缺乏激励”,但实证数据否定了这一观点:

  1. 教师工资与教学效果无关:印度公立学校教师的工资远高于农村儿童就读的廉价私立学校,但私立学校的教学效果并不逊色;印度尼西亚的大规模实验显示,将教师工资翻倍后,学生的学习成绩并未出现任何提升(De Ree et al. 2018);
  2. 班级规模并非关键:在印度、肯尼亚等国的实验中,仅缩小班级规模而不改变教学方法,对学习成果无显著影响;
  3. 非永久教师更有效:那些工资仅为正规教师几分之一的“非永久教师”,反而能取得更好的教学效果;
  4. 激励的“有限有效性”:针对性激励能带来短期改善(如印度乌代布尔给教师的“出勤激励”、安得拉邦给教师的“成绩激励”),但私立学校的“生存激励”(依赖家长满意度)并未带来全面提升——RCT实验显示,私立学校在印地语和英语教学上更有优势(这是公立学校不重视的科目),但在数学和泰卢固语教学上反而不如公立学校,且私立学校的优势主要源于“学生筛选”(家长更重视教育的家庭会选择私立学校),而非教学质量本身(Muralidharan and Sundararaman, 2015)。

(四)核心症结:“课程的暴政”

真正的核心问题,是“课程的暴政”——无论儿童的实际能力如何,学校必须按既定课程进度完成教学,完全忽视了儿童的基础差异。

以印度哈里亚纳邦四年级的数学课程为例:

  • 10月:学习“圆的认识”(用手镯、绳子理解圆,用圆规画圆)、“分数”(一半、四分之一),共安排11课时;
  • 11月:学习“图案”(无数字图案、数字字母图案)、“乘法表与除法”(掌握15以内乘法表,练习除法应用题),共安排14课时;
  • 12月:学习“重量”(克与千克的换算,使用天平称重),安排12课时;
  • 1月:学习“周长与面积”(规则与不规则图形的周长、面积计算),安排8课时。

这套课程的设计完全基于“理想化的学习进度”,假设儿童已掌握前序知识,但现实中,多数四年级儿童甚至未能掌握二年级的基础算术和阅读能力。这种“超纲教学”导致儿童无法跟上进度,逐渐产生挫败感,最终放弃学习——课程的“刚性”与儿童能力的“弹性”之间的矛盾,是教育质量低下的根本原因。

值得注意的是,这并非印度独有的问题:肯尼亚、法国等国家也存在类似的“精英化课程”,而芬兰之所以能取得优异的测试成绩,恰恰是因为其课程设计摆脱了“进度至上”的束缚,更注重儿童的实际学习能力。

五、解决方案探索:从实验到规模化干预

针对上述问题,研究者通过近20年的实验,探索出一系列有效的干预路径,核心思路是“放弃不切实际的课程进度,聚焦基础技能,利用儿童的现有知识”。

(一)路径一:“因材施教”(Teaching at the Right Level, TaRL)模式

TaRL模式的核心是“按能力分组,而非按年级分组”,通过“评估-分组-聚焦基础”三个步骤,帮助儿童补齐基础技能,其发展历程长达15年,经过多次迭代验证:

  1. 发展历程:
    • 2001-2003年:“Balsakhi”项目——普拉瑟姆的社区志愿者在城市学校开展“课外补救教学”;
    • 2005-2006年:乡村志愿者为农村小学生提供社区课堂;
    • 2008年:政府教师主导的“暑期夏令营”,由乡村志愿者提供支持;
    • 2008-2010年:农村学校中,政府教师主导、普拉瑟姆志愿者支持的学习改进项目;
    • 2010-2013年:加纳开展“教师主导vs导师主导”的校内外对比试验;
    • 2012-2013年:政府学术官员现场指导的“教师主导模式”;
    • 2013-2014年:政府小学中的“学习营”——普拉瑟姆团队主导,乡村志愿者支持。
  2. 核心实施步骤:
    • 步骤1:评估——用简单工具测试儿童的基础技能(如算术的数字识别、减法,阅读的字母识别、单词阅读);
    • 步骤2:分组——按实际学习水平进行“同质分组”(如“仅能识别数字组”“能完成减法组”),而非按年级分组;
    • 步骤3:聚焦基础——每天或每年安排固定时间,专门教授基础技能,而非追求课程进度。
  3. 实证效果:
    • 北方邦2013-2014年实验:普拉瑟姆工作人员和志愿者在学校内开展“50天密集营”,每天2小时,覆盖3-5年级学生,分为“2个20天营”(T1组)、“4个10天营”(T2组)和对照组(120所学校);
    • 结果:T1和T2组的学生在印地语和数学上的成绩提升了0.7个标准差,且成本极低——巨大的学习增益使其成为“成本效益极高”的干预方式。

(二)路径二:数字工具干预——Mindspark的潜力与局限

Mindspark是一款基于AI的教育软件,核心是“自适应 drills”——根据每个儿童的能力水平,提供个性化的练习内容,研究者通过“彩票分配”的方式(随机给予儿童使用Mindspark辅导的机会),评估其效果:

  1. 实验结果:
    • 基础技能显著提升:彩票中奖组(使用Mindspark)在数学和印地语的“基础题”上表现优异,数学基础题正确率提升0.081个标准差,印地语基础题提升0.050个标准差;
    • 对年级水平题目无效:在“符合年级课程的题目”上,数学正确率仅提升0.0089个标准差(统计不显著),印地语提升0.063个标准差;
    • 学校考试影响有限:对学校期末考试的总成绩影响仅为0.100个标准差,其中数学仅0.059个标准差,科学0.077个标准差,均无统计显著性。
  2. 核心局限:
    • 家长付费意愿低:尽管Mindspark能带来基础技能提升,但家长对其接受度低——实验结束后,三个Mindspark中心因 enrollment 率远低于80%的目标(无法证明家长的付费意愿),失去了慈善资助而关闭;
    • 脱离学校系统:Mindspark主要用于课外辅导,而儿童的主要时间仍在学校,需要额外“说服儿童参与”,难以形成持续影响;
    • 学校的“知识垄断”:学校仍掌握着考试和知识合法性的主导权,课外工具的提升难以转化为学校认可的“成绩”,进而影响家长和儿童的参与动力。

(三)路径三:学前与早期教育的游戏干预——可规模化的有效方案

基于第一份学前数学实验的教训(非符号游戏未能转化为学校数学能力),Duflo-Spelke团队开展了三次递进式实验,探索“能连接非符号与符号数学”的游戏干预模式:

实验二:混合游戏的优势

  1. 实验设计:在德里231所学前教育机构中,1896名儿童被随机分为四组:非符号数学游戏组、符号数学游戏组、混合数学游戏组(非符号+符号)、无处理对照组;
  2. 核心发现:
    • 非符号与混合游戏提升直觉能力:非符号游戏组和混合游戏组在“数字感知”“几何识别”等非符号测试中,得分显著高于对照组(EL1时均达0.198以上标准差,p<0.001),且效果持续到EL3;
    • 混合游戏连接符号与非符号:混合游戏组在EL1时的符号数学能力(如识别数字、完成简单运算)提升0.155个标准差(p<0.001),且在EL2、EL3时仍保持优势,成功将儿童的直觉能力转化为系统性的符号数学能力;
    • 纯符号游戏无效:仅进行符号游戏的组,在非符号测试中无任何提升,说明脱离直觉的符号教学无法让学前儿童理解数字的“实际意义”。

实验三:可规模化的课堂游戏模式

  1. 实验设计:在141所政府学校的幼儿园和一年级,由常规教师主导,让所有儿童分组参与游戏,游戏聚焦“十进制结构”(如“1个十=10个一”)和“符号与非符号的对应”(如圆点阵列与阿拉伯数字的匹配),具体包括:
    • 数字比较游戏:幼儿园聚焦1-20,一年级聚焦1-100,卡片从“双面都有圆点/数字”逐渐过渡到“仅单面有符号”;
    • 形状识别游戏:区分不同边数的图形、直角/锐角、对称图形等;
    • 移动游戏:在1-20(幼儿园)或1-100(一年级)的棋盘上,根据指令移动棋子,结合圆点和数字完成任务。
  2. 核心优势与效果:
    • 教师接受度高:与难以实施的“补救教学包”不同,游戏干预深受教师欢迎,且实施频率越高,效果越好;
    • 培训成本低:仅需1天培训+配套材料,教师即可独立开展;
    • 效果显著:幼儿园和一年级学生的“综合数学能力”“符号数学能力”均显著提升,其中幼儿园综合数学能力提升0.112个标准差(p<0.05),一年级提升0.107个标准差,非符号数学能力也同步提升。
  3. 规模化前景:
    • 目前已与多个邦政府沟通,计划扩大实施范围;
    • 正在与游戏公司洽谈合作,希望将教学游戏商业化出版,降低推广成本。

六、总结:教育改进的长期主义视角

发展中国家的教育供给侧改革,不存在“一蹴而就的银弹”,但通过近20年的实证研究,我们已明确“什么有效、什么无效”:

(一)核心结论

  1. 儿童具备学习潜力:无论是学前儿童的数学直觉,还是市场儿童的实用数学能力,都证明发展中国家的儿童并非“不能学”,而是学校系统未能充分利用其潜力;
  2. 问题的核心是“脱节”:课程与儿童能力脱节、教学与实际需求脱节、学校与儿童现有知识脱节;
  3. 有效干预的共性:聚焦基础技能、按能力分组、利用游戏化/个性化方式、融入儿童熟悉的场景(如市场交易、日常游戏);
  4. 必须依托学校系统:课外干预(如Mindspark)虽有潜力,但学校仍掌握知识合法性和考试主导权,脱离学校的干预难以持续,改革必须“嵌入”现有学校系统。

(二)未来方向

  1. 利用“边际机会”:学校系统的改革难以一蹴而就,但可以从“更开放的边际”切入,包括:
    • 辅导机构:作为学校教育的补充,聚焦基础技能;
    • 学前教育:这是干预效果最强、阻力最小的领域;
    • 低年级教育:在一、二年级补充基础技能游戏,避免儿童早期掉队;
    • 暑期项目:利用假期开展密集型基础技能培训,弥补学期内的不足。
  2. 警惕“边际关闭”风险:随着边际干预的扩大,可能面临“过度监管”(如规范辅导机构)、“标准化”(如给学前教育设定刚性课程)等风险,需保持干预的灵活性。
  3. 坚持长期主义:教育改革是一个漫长的过程,需要持续与学校系统互动,不断撬动“新的改革支点”。尽管过程可能充满挫折,但每一次有效的干预,都能让数百万儿童受益——这种“乘法效应”,正是教育供给侧改革的价值所在。

参考文献

  1. ASER. Annual Status of Education Report (Rural). Various Reports. http://www.asercentre.org/Keywords/p/393.html
  2. Banerjee, A.V., Bhattacharjee, S., Chattopadhyay, R. and Ganimian, A.J., 2017. The Untapped math skills of working children in India: Evidence, possible explanations, and implications. Unpublished manuscript.
  3. De Ree, J., Muralidharan, K., Pradhan, M. and Rogers, H., 2018. Double for nothing? Experimental evidence on an unconditional teacher salary increase in Indonesia. The Quarterly Journal of Economics, 133(2), pp.993-1039.
  4. Dillon, M.R., Kannan, H., Dean, J.T., Spelke, E.S. and Duflo, E., 2017. Cognitive science in the field: A preschool intervention durably enhances intuitive but not formal mathematics. Science, 357(6346), pp.47-55.
  5. Duflo, E., Hanna, R. and Ryan, S.P., 2012. Incentives work: Getting teachers to come to school. American Economic Review, 102(4), pp.1241-78.
  6. Muralidharan, K. and Sundararaman, V., 2011. Teacher performance pay: Experimental evidence from India. Journal of political Economy, 119(1), pp.39-77.
  7. Muralidharan, K. and Sundararaman, V., 2015. The aggregate effect of school choice: Evidence from a two-stage experiment in India. The Quarterly Journal of Economics, 130(3), pp.1011-1066.