饭饭TXT > 学习管理 > 《化学教学论（出书版）》作者：刘知新【完结】 > 《化学教学论》书香门第.txt

第六章化学教学测量和评价

作者：刘知新当前章节：15516 字更新时间：2026-6-23 02:38

化学教学测量和评价是化学教学系统的重要组成部分，是检查化学教学效果、提高化学教学质量的重要途径。

§6-1 化学教学测量

化学教学测量主要是通过测验或考试这种方式来检查学生学习化学的效果、质量和水平，并以数量化的指标，用分数作为学业成绩来定量地反映学生的学习状况的过程；化学教学评价是在化学成绩测量的基础上，确定所得到的数量化指标（例如分数）的价值，并给予应有的解释。例如，某校进行的一次高一化学期末考试，某学生得到 60 分，这表示对某学生学习效果的测量，是对该生学习化学状况的一种描述，但是，这 60 分有什么意义？在相同班级中处于何种位置（即是班级中的第几名），就需要通过教学评价，才能判断和解释这 60 分的价值和意义。

测量和评价化学成绩对化学教学质量的提高具有很大的作用，具体表现在：了解教和学的具体情况，为今后的教学决策提供可靠的数据；使教师调整和强化化学教学过程做到心中有数；对提高学生学习化学的积极性起到刺激和促进的作用；为选拔或淘汰学生提供依据。从系统论的观点看，化学教学测量和评价是通过教学系统中的信息传递和反馈形成教和学的控制过程来实现的，从而发挥其教学诊断作用，教学调节作用和教学反馈作用等功能。教学测量和评价的基本设想是：无论什么时候，学生在阅读能力、知识广度、学识水平以及学习兴趣、专业思想、集体观念、意志坚定性等各方面都存在着个别差异，而个别差异的鉴别要通过测量和评价来实现；在进行测量和评价时，往往是将个人的行为与他人比较并加以归类，同时使用一定的量表（例如百分制、标准分制等）来完成的。

一、测量的方式

化学教学测量的方式主要包括：口头方式、书面方式、实验方式和课外作业方式等。

（1）口头方式主要是课堂教学中的提问、谈话和口试，前二种已被广泛采用，后一种比较难以进行，可结合实验操作技能的考查进行口试。

（2）书面方式这是当前最主要、最常用的测量方式，例如书面作业、实验报告以及书面测验（含考试）等。其中书面测验和考试能较全面地检查学生独立解答问题的能力和对化学知识的掌握程度。书面测验可以分为闭卷测验和开卷测验。依测量的要求可分为：单元测验、期末考试、学年考试、毕业考试，以及地区性的会考或统考等。

（3）实验方式这是比较真实、有效地测量学生化学知识和技能掌握程度的一种方式。一般是通过学生动手做化学实验，记录实验数据，解释实验现象等实验过程，来测量学生的化学知识和技能的水平。这种方式需要进行个别实验操作考核，花费的人力和物力较多，从而限制了这种方式的使用范围。

（4）课外作业方式主要通过布置课后化学习题，让学生回家作答的方式，来测量学生的表达能力和综合思维能力，以及对化学基础知识的理解和运用，个别的也可让学生设计实验、写小论文或调查报告（参观化工厂和研究单位的体会）等。教师通过批改作业来了解这种方式的考核效果。批改作业时视学生水平的不同，采取全批改、半数批改或批改 1/4 的做法，建立平时学习效果的教学档案，有利于全面的、系统地了解学生的学识水平。

上述各种测量方式，各有各的功用，书面测验和考试被公认为是测量和评价学生化学知识与技能掌握程度的最常用、最可靠的方法。

二、测量的程序

这里主要讨论以书面测验和考试的方式进行的测量程序。

1.确定考试目标和要求年级不同、学生的学习水平不同、考试的内容和要求不同，必然导致考试目标的不同。例如，升学考试和高考，成年教育考试，自学考试等等，各属于不同类型和不同水平的考试，为此就要确立相应的考试目标和要求，以保证正确评价其考试质量。我国化学考试目标，在常规教学中常把教育目标作为考试目标，由于会考和高考属于水平和选拔性考试，考试目标的层次要求要稍高些。在这方面，我国学者结合我国化学教学实际，借鉴布卢姆关于认知领域的教育目标分类或总结我国广大教师的经验，设计和编制了一些考试目标和实施方案。在一个地区或在高等学校招生标准化考试试验中试行。拟定的考试目标分类大体上有：

（1）常识性介绍、了解、理解、掌握1。

（2）识记、理解、应用、分析综合、探究②。

（3）识记、理解、简单应用、综合应用、创见③。

（4）识记、理解、掌握，综合运用。实验操作领域的目标分类有：

（1）练习、初步学会、学会。

（2）初步掌握、掌握、熟练、设计。

（3）见识、学会、技能、技巧、设计。

（4）见识、模仿、学会、熟练、技巧、创造。

2.命题它是考试能否达到期望目的要求的关键所在。命题工作包括试题设计和试卷的编制。命题要切实做到科学性、守纲性、严密性、准确性和艺术性相结合。命题中的科学性是试题内容的叙述必须准确而科学；守纲性是要切实按照教学大纲要求来命题；严密性是，命题要极其认真、细致、加强保密，不能有半点疏忽；准确性是试题内容和难度的分布必须切合学生的实际水平，必须注意考试的稳定性；艺术性是命题技巧要讲究，要能运用技巧来控制好试题和试卷的难度。

首先要设计试题编制要求和编制蓝图，决定试题抽样内容，然后才来设计试题。在编制试题的基础上来进行试卷编制，就能较顺利、较完整地考虑试题的难度分布、分数分配和题型的安排顺序等，还要根据学生考试心理，编排试题难易的顺序，以及难度的控制等工作。试卷编制完毕以后，最好能1 ①中华人民共和国国家教育委员会颁发.九年制义务教育全日制初级中学化学教学大纲（试用）.北京：人民教育出版社，1992.

② 曾灼先等.广东省 1987 年化学高考标准化的设想和做法.化学教育，1987（5）：③ 北京市朝阳区化学教研室中学化学教学目标课题研究组.明确教学目标改进评价方法提高教学质量.化学教育，1986（6）：在保密的情况下，找人做一做，看试题分量和考试时间是否基本吻合，过深、过浅、超时、剩时都不利于提高考试的信度。

3.考试考试属于考务管理范围，必须制订和遵守考试规范程序和考场规则，注意试卷的保密性，统一考试时间和要求，防止各种干扰才能尽可能减少随机误差，让学生考出真实的水平。

4.成绩评定首先制订准确的评分标准，然后组织评卷教师学习和熟悉评分标准，例如要补充或修改标准，必须按一定的手续统一大家的认识，所有的标准答案必须是符合科学性和教材规定的要求，要注意评分进度，评卷质量检查，防止各种误差因素的产生，如果应试人数在百人以上时，采用流水作业固定试题评卷法较能准确给分，减少主观随意性。

5.考试总结和分析考试总结重在进行试卷分析，结合平时成绩和学习表现，定量（分数）

和定性（学生学习表现）相结合地来评价考试质量。常规考试的总结侧重在统计出高分和低分，平均分和及格率以及分数分布，以平均分高、及格率高、高分人数多作为考试质量高的标志，同时也对试题答卷情况作些分析，指出哪些题答得好，哪些题答得不好，原因在哪里？同时也会表扬取得高分和成绩提高幅度大的学生。

标准化考试的总结，着重对考试质量指标的分析，例如，试题难度和区分度，试卷的标准差，区分度，信度、效度以及分数的正态分布，同时也十分重视考试内容效度的分析以及综合分析。

三、考试的类型

由于考试（含测验）的目标要求的不同，或者因考试对象和功能的差异，考试有各种类型，从教学进程来看，考试类型主要有：1.诊断性考试

在新学期、新学年开始，或一门课程、一个知识单元教学开始之前举行的测验。目的在于摸清学生对于即将学习的新内容具有的预备知识状况和认知能力状况。这种测验或考试（指内容较完整、时间较长的测验）被称为诊断性考试。通过这种考试，可以了解学生的认识倾向：例如哪部分预备知识掌握得较好，哪部分较差；又如认识的主要方式有的学生以抽象思维为主，有的则偏重于形象思维，从中能寻找出学生的认识特点，有针对性地采取与之相适应的方法来解决学习问题就容易了，否则虽是同样课题却难于对付，所以，要重视诊断性考试的实施。诊断性考试还可以诊断学生学习化学的持续能力（即能承受困难和积极主动地集中注意力于学习化学课程的情意特征）。以上几点也是提高学生学习效果的主要因素。所以，在常规教学中，这种考试被经常采用来了解一个教学方案实施前学生的学习状况，以便能及时设计出排除学习障碍的补救措施。

2.形成性考试在执行事先编制好的教学计划和方案的教学进程中进行考试，常被称为形成性考试。目的在于：检查具体的单元知识教学是否有效地进行；学生对所学教材内容的掌握程度；教学目标是否达到，达到的程度如何。以便从中收集适当的证据，为今后调整和修改课程计划作好准备。所以，形成性考试可以系统地收集测试数据，为继续执行和修改教学计划提供可靠的信息。例如，化学单元知识的测试（一般是 45 分钟）或中段考试等，它是一种以检查化学单元教学或阶段性教学目标达到何种程度为目的的考试（测验），要求测试题内容与化学教学内容和教学目标一一对应。这种形式和要求的考试与过去常规教学中的练习或测验在形式上是相似的，不同的是，它往往是有计划、有目的、系统性的测试。

3.终结性考试当一学期或一学年的化学教学计划执行终结时，为了总结这个教学阶段的学习成就，给学生和家长报告学习成绩，常要进行一次考试，这种考试就是终结性考试。例如期末考试、学年考试和毕业考试等。旨在检查学生在学期（年）终结时的学习质量和水平达到何种程度，以及学业成就（也称为成就考试）。测试题就要与整个教学阶段（学期或学年等）的教学目标相对应，才能达到测试的目的。

4.学能倾向考试这种考试的特点是以考查学生能力发展倾向，对某一学科的学习是否特别有前途、有效果为宗旨的考试。例如，设计测试某年级学生化学实验能力和解决化学问题的能力等的试题，可以考查这一年级某些学生学习化学的发展前途和潜力，以便探索未来并对个人可能的化学成就作出预计。一般来说，学生对学习化学感兴趣，学校实验条件又较好，本人又下了功夫去学习化学的话，定能取得较好的成绩，这个学生将来有可能在化学专业学习或学术上取得较大的成效和贡献。当前的高考目标要求常含有学能倾向考试的成分，各类型的化学竞赛的考试主要就是学能倾向考试。

5.目标参照测验和常模参照测验

由于测验要求和量表使用的不同，常把上述几种考试分成两类参照点不同的考试。所谓目标参照测验，是以达到教学目标为标准参照点。它提供的信息是完成教学目标的情况，旨在检查学生的成绩与教学之间的差异，不比较个人之间成绩的差异。测验试题，必须完全能代表教学目标要求才能发挥作用，考试成绩就代表学生掌握教学目标要求达到的程度。例如，某考生得70 分，则表示掌握 70%的目标要求。目前，单元的、期末的教学测验基本上是目标参照测验。所谓常模参照测验，就是每一学科都设立一个考试常模（以某一次标准化考试为参照标准）。当进行相同水平的考试时，某一学生所得的分数，可在参加测验的学生群体的名次分配中确定相对位置，看他是在平均分之上还是在平均分之下的某一位置，如果得分和平均分相近，则表示居于中等位置；如果比平均分高出较多时，则表示居于中上水平。所以，一个学生的测验分数只有在与所属考生群体平均成绩相比较之下才有意义。可见，常模参照测验着重在个人间的比较，主要用于区分和选拔不同水平的学生，希望考生之间得分从高到低，范围要广，得分的范围越广，即变异性越大，则越能显示个别差异，这种测验要求，预期的成绩应呈钟形的正态分布，即在平均分附近两侧的考生人数占绝大部分，高分与低分的两端的人数越来越少。目标测验则要求得分范围稍窄，达标的人数越多越好，理想的成绩应是负偏态分配，则表示大部分学生成绩都较集中在中等以上，这是常规教学所要求的及格率问题，及格率越高，表明达标人数越多，教学效果越好（在试题难度比较稳定、试题数量和性质以及所要测定的内容和范围一致的条件下）。如果在测验中发现多数学生都不能正确解答的试题时，一是要检查该试题是否偏离了教学目标，二是要考虑教学方法是否得当，而不是简单地删除试题。以上两种测验各有长短，但都能为我们提供有用的信息，可以考虑把两者配合使用，即使在一次测验中，也可以同时用两种测验分数来解释一个学生的成绩。

除上述考试类型外，还可以从不同侧面将考试分为：成就（成绩）测验、水平测验和选拔性测验；客观性测验（答案是唯一的）和主观性测验；选择性测验和论文题测验；以及常规考试、标准化考试和模拟标准化考试等等。这些考试各有特点，常常是交互为用，相互补充的。

目前，我国仍然以采用主观性常规的成就考试为主，客观性的常模参照的标准化考试还处于试行阶段。模拟标准化考试已在各年级会考和毕业统考中试行。

四、常规考试

常规考试是当前课堂教学中最常用的测量学生学业成绩的方法，也是由来已久的考试法，故有的著作称它为传统考试法。

常规考试的特点是，以目标参照考试为主，兼有水平考试的因素。即以掌握化学教学大纲所规定的课程目标和要求来组织的考试，学生所获得的卷面成绩就代表他所掌握的课程内容的程度，取得 60 分以上的成绩就算达标（合格）。班级成绩的及格率常被看作达标率，分数越高，说明达标水平越高。

常规考试的命题，主要靠教师的个人经验和水平，以主观性题型为主。这类题一般是以多个答案的试题为基础，题目数量较少，题分较多，偏重于考查学生的理解、逻辑思维能力和文字表达等能力。

常规考试的程序包括：确定考试目标和要求（应与课程目标相一致）；设计试题（要考虑题型、题量、试题难度和知识覆盖面等）；编制试卷（要考虑题型的顺序，选择题和填空题一般排在前面，简答题、计算题和实验题一般放在后面，还要考虑答卷时间与题量要相适应）；施考（要考虑试卷的保密、考场环境的安静、考场的规则等）；评分和讲评（按预先制定好的标准评分，力求准确可靠，考试结果要向全班学生讲评）。

随着现代教育测量中客观成绩测验的推行，常规考试多受到批评。主要是：常规考试凭教师个人经验命题，不易掌握试题的难易度和区分度；命题目标不够明确、题型主观性大，造成评分标准不易统一，评分误差大；试题知识覆盖面窄，容易造成学生猜题和押题，卷面成绩难以代表学业的真实水平；用百分制表示常规考试的成绩难以比较学生的水平，学生成绩缺乏可比性；评分花费人力和物力较多，难于实现电脑阅卷。客观地讲，常规考试也有很大优点，即能检查学生对知识的理解，以及思维能力和表达能力。为此，我国高等学校招生考试是在总结传统考试经验的基础上，吸收国外标准化考试的长处，结合我国国情进行改革，以逐步实现标准化的①。

五、标准化考试

在现代教育测量中的成绩测验，常常以常模作参照标准，并按科学的系统程序严格控制考试误差，以保证考试的准确性、可靠性和可比性。这样的客观成绩测验就叫做标准化考试。所谓“标准化”，具体包括试题编制的标准化、施测过程的标准化、评分记分的标准化、分数合成的标准化以及分数

① 杨学为.高考应逐步实现标准化.人民教育，1987（1）：解释的标准化等等②。实行标准化考试，主要有 4 点好处③：（1）减少无关因素对考试目的的影响，使测量准确可靠；（2）使不同的考试分数具有可比性；

（3）同一套测验有多个复本可以反复使用，较为经济；

（4）可用来校准其它考试。近年来，我国在高考和其它大型统一考试中，已开始逐步试行标准化考试。

实行标准化考试必须做好各个环节的工作，从实施过程看，主要包括：建立考试常模、严格执行标准化考试的程序以及对考试质量进行统计和分析等。现结合实例分别作些介绍。

1.建立考试常模理想的考试常模是对极大规模的同类（同年龄、同年级、同程度）学生群体，使用标准化试卷，在严格控制的条件下（使考试过程标准化），进行测试，所得到的考试分数的平均值和标准差的具体数值，并按成绩的高低将学生分成若干等级，而且分数分布接近正态分布。这样得到的考试常模，可以为以后的同值考试作为参照标准。例如，我国在化学高考标准化试验中采用的分数常模，一般为平均分 55 分左右，标准差 14～17；一般每隔 10 分左右为一级，可以将学生成绩分成六等或九等。

考试常模的建立为考试成绩的可比性、考试质量指标的统计分析提供了科学的依据。

2.标准化考试的程序标准化考试有一套科学的规范化的程序。严格执行这一程序是保证标准化考试顺利实施的前提。

我国高考招生中试行的标准化考试程序，大体上如图 6-1 所示。为了主持和推动工作，首先要成立标准化考试命题研究室，成员包括大、中学化学和化学教育方面的专家以及教育测量和统计方面的专家。命题研究室的任务主要是：

（1）编制命题双向细目表和知识技能纲目依据中学化学教学大纲、教材和近年来化学高考和当前大、中学学生的情况，综合考虑制定纲目和双向细目表。

② 中华人民共和国国家教育委员会.标准化考试简介.北京：高等教育出版社，1985.

③ 中华人民共和国国家教育委员会.标准化考试简介.北京：高等教育出版社，1985.

命题双向细目表，是考试目标和考试内容的双向列联表（见表 6-1）。命题时，原则上都要根据表中各项要求和比例来确定试题的内容和分量；命题完成后，要根据双向细目表来评价试题，检查其对所学知识内容的覆盖面和内容效度是否符合命题的期望要求。还要根据中学阶段所学的化学知识，按知识结构的逻辑顺序与教学顺序相结合的原则，编制化学知识和技能的纲目，作为考试命题时掌握知识点的依据。

表 6-1 化学高考标准化命题双向细目表

考试目标

分数分配考试内容

识记

理解

应用

分析

综合

探究

总分

基本概念、基础理论元素化合物

有机化合物

化学计算化学实验

总分

100

（2）制定考试大纲或考试指南考试大纲是教学大纲具体化、系统化和简明化的结果。所谓“具体化”是指使知识纲目更详细，“系统化”指按知识结构将教材的知识点归类，“简明化”指对考试的深度、广度和要求给予简要的说明。考试大纲包括规定考试的目标、范围、内容、方式、规格和评分、记分的方法等。使学生和任教老师明确要求，熟悉应答方式，以利于考生积极自觉地参加考试。

（3）建立考试题库将按标准化程序命题并经过测试的试题，以及与高考有同质性效果的化学试题搜集起来，加以整理分类储存，这就是建立高考题库的过程。这是实现标准化考试不可缺少的重要环节。应当指出，根据各地的实际情况来搜集有价值的各种试题，并进行保密性的预测，然后，在此基础上筛选试题是建立题库的一种好办法。

（4）命题和测试命题标准化是实施考试标准化的核心。命题过程是将抽样的化学知识点按命题双向细目表进行设计、筛选和编制试题和试卷的过程。

在编制试题和试卷时，一般把选择题、填空题排在前面，问答题和计算题排在后面；试题顺序常按先易后难，或者按易——难——更难——难—— 较难的顺序，尽量考虑考生答卷时的心理状态和精神负担，使整份试卷难度适中（例如，高考常以平均分为 50～60 为适中），区分性能好，使考生群体的成绩基本上处于正态分布。

测试工作要严格保密，并有专人到“常模测试观察点”进行指导。这样坚持实施，每年测试要求与方式要保持统一，保证测试条件、进程和规格基本不变。这样方能通过测验检验试题质量、试题的稳定性以及学生的适应性等。经过实测，把难度太低、区分度差的试题进行修改或者淘汰，保留合格试题编卡或储存输入电脑，以逐步丰富题库的容量。

3.考试质量统计和分析

考试质量分析一般包括 3 方面的内容：考试质量指标的统计和分析、考试内容分布的分析和综合分析。

考试质量指标，按标准化考试所提供的参数主要是效度、信度、难度、区分度和标准差等。

（1）考试的效度表示考试的正确性和有效性。它是评判试卷质量的最重要的指标。按化学教学的要求来说，主要考虑内容效度和效标相关效度。

内容效度表示试题内容能反映课程内容的程度。因为教学内容的测量是通过试题所包含的内容的测试来实现的，考试内容越能代表教学内容，内容的效度就越高。内容效度的统计方法是要将试题所包含的内容按教学内容的特点进行分类。例如，化学高考试题是按化学概念和理论、元素化合物知识、有机化合物知识、化学计算和实验操作技能等来分类。如果试卷内容分布和命题双向细目表的内容分布一致时，则内容效度就高，相反则效度低。实测统计数值见表 6-2。

表 6-2 1987 年广东化学高考试题内容效度统计

内容

分数项目

概念

和理论

24.7

元素

和化合物

15.7

有机

化合物

10.7

化学

计算

6.5

化学

实验

12.4

合计

第一

卷

题数分数

折算分

第

二卷

小题数

分数

7.0

6.0

4.0

8.0

5.0

合计

31.7

21.7

14.7

14.5

17.4

100

命题细目表内容

100

从表 6-2 可知，试题内容分布十分接近命题细目表中内容的分布。若用具体数值来表示考试效度时，常采用效标相关效度（r）来衡量一种考试的有效程度。这里所谓的效标，就是要寻找一个能反映考试内容符合教学要求的客观标准，也就是要寻找或编制符合教学要求的样题，向某一学生群体进行测试，进而再编制与样题在考试方向、内容分布和难度分布等相近水平的待测试题，向同一学生群体进行第二次测试，然后考察第 1 次和第 2 次（样题和待测试题成绩）之间的相关程度是否密切①。相关程度越大，效度就越高，效度系数就越接近 1。

效度系数最高为 1，表示考试完全反映了要考的内容。效度为 0 时，表示考试完全与要考的内容无关。一般要求效度要在 0.30 以上，超过 0.5 则属于很好的效度。

（2）考试的信度它表示试卷质量的可靠性、稳定性和可信程度。信度最高为 1，表示考试完全稳定，知识水平相当的一类学生每次测试所得成绩是一样的、完全不受偶然因素的干扰，例如，学生的情绪、身体状况，评分标准的不统一等。信度为零，表示学生的成绩完全是随机的、不稳定的，受偶然因素影响的结果，与学生水平无关。

① 这样测试得到的效度也称为预测效度。

对于较大型的考试，例如考生在 500 人以上，信度要求在 0.80 以上；对于年级考试，信度在 0.60 以上就可以了，低于 0.50 则是不好的。

（3）难度和区分度在现代教育测量和统计中，倾向于采用得分率或答对率来表示试题的难易程度。一般考试的难度分布要求多数题在 0.3～0.8 之间，少量题在其它两侧，总难度要适中，而且视考试目的要求来拟定。例如，及格率要达到 90%以上，则试题总难度就要控制在 75～80 之间，一般有如下的半经验性数据：试卷难度

80 分左右

75 分左右

70 分左右

60 ～ 65 分

考生及格率（%）

95 左右

85 ～ 90

80 ～ 85

70 ～ 80

区分度是衡量试题质量的重要指标。区分度高，表示这道试题或这份试卷能区分不同水平的学生，即水平高的学生得高分，水平低的学生得低分。一般要求试题的区分度在 0.30 以上，低于 0.20 的试题在大型考试中就被认为不合格，必须进行修改或淘汰。但是，在常规班级教学测验中仍可保留少量区分度较低的试题。

试题的区分度与难度有关，难度太大或太小的试题，其区分度都较低，难度适中的试题，例如，难度为 0.30～0.80 其区分度一般都较高。在现代教育统计中，常采用“27%的两端分组法”来计算试题的难度和区分度。①其计算程序是：

①将全班学生的考试分数从高到低按顺序排列，然后从最高分开始向下取 27%的考生作为高分组，再从最低分开始向上取 27%的考生作为低分组。

②求高分组和低分组的平均分（得分率），然后查“弗拉南根”②数据表，从上端 27%答对率数值和下端 27%答对率数值两者纵横直线相交点所代表的数值则为区分度数值，如果是试题分数则为试题区分度，如果是试卷分数，则为试卷区分度。

例如一个实例：

高分组（15 人）平均分 82.1；

低分组（14 人）平均分 46.3。由此，得到的区分度为 0.391。难度的计算采用下述公式：难度

上端答对率

下端答对率

（6 - 1）

0.821

0.463

=0.64

（4）标准差标准差表示学生得分的离散程度。标准差值如果大，表示①

陈梁波等.关于化学考试命题的科学化初探.化学教育，1985（5）：51；本书附录Ⅰ。

② 弗拉南根（J.C.Flanagan）发现从测验所得全部最高分的 27%与最低的 27%的比率迅速估计二列相关系数（γb）的方法，简称为弗拉南根方法。数据见附录Ⅰ。

学生分数参差不齐，高低分相差较大，也就是学生的分数分散程度较大；若标准差小，表示学生分数比较集中在平均分附近，学生成绩比较均匀，亦即分数的离散程度小，这样的班级学生容易组织教学。对于一个教学班来说，如果考试的标准差随着考试次数的发展而不断减少的话，则说明成绩差的学生可能进步快，学生之间的分数差距不断缩小，这是当前提高教学质量所希望达到的。

标准差的计算公式：

X) 2

式中，s——考试的标准差

（6 - 2）

X——某种考试的原始分数

X——同次考试的平均分

∑——求和号 N——参加考试的考生人数

例如，某次考试的标准差计算式为：

(92

66) 2

(89

66)2 (35

66) 2

=12.4

这个数值对于中学化学常规教学来说，还是可以的。一般标准差在 5～10 的范围内对于中学化学教学来说是比较适宜的。以上讨论的是考试质量指标的分析。下面，简要介绍考试内容分析和综合分析。

考试内容分析，是指根据试题所包含的内容，以正确答案的要求为标准，统计一下有关化学用语和基础理论、元素化合物知识、化学实验操作技能和化学计算等各占多少比例；然后分析一下哪些题答得较好，好的原因何在？哪些答得较差，差的原因何在？今后改进教与学的意见和措施，对考得好、进步快的给予肯定。

当在学期开始或初高中学生刚开始学习化学知识的时候，就要有意识拟定一个教学测试和统计分析计划，第一次实施测试时，最好是以了解学生的学习程度为测试目的（诊断性测验），然后将测试成绩按高低顺序排列，并分成若干等级（一般分为 5～6 级），例如：分数段

90 ～ 100

80 ～ 89

70 ～ 79

60 ～ 69

50 ～ 59

以下级别

把学生成绩按分数段来分等级，建立教学档案，每次测试以后都跟前几次排队比较一下，就可发现哪些学生成绩提高快，哪些比较慢，哪些是退步了，哪些学生成绩不稳定等，从中找出适合的机会对各个等级的学生进行针对性的因材施教。

综合分析，是指将考试质量指标分析和考试内容分析结合起来，参照学生平时的学习表现、考试的目标和要求，对教学质量进行全面的、定性和定量相结合的综合分析和评价。

§6-2 化学教学评价

化学教学评价主要是，通过化学成绩的评定和解释，对学校化学教学效果、质量和水平进行定量地、客观地以及科学地判定的过程。

一、化学教学评价的依据

1.化学教学大纲和教材内容规定的教学目的要求是进行成绩评定的标准《全日制中学化学教学大纲》指出：“要根据中学化学教学的目的和要求，各章的教学要求和教学内容，全面地正确地评价学生掌握基础知识、基本技能和能力的程度。”①为此，对于化学教学中的各类考试，不论是从定量的角度、定性的角度，还是两者结合的角度来描述成绩或能力的评定，都要以教学大纲和教材所规定的、相应的教学目的和要求作为评价的标准。

2.要有真实、可信的考试成绩作为评价的依据考试成绩的真实性、可信性和可靠性从定量上代表了学生学习质量和水平的真实性、可靠性。因为，卷面成绩越真实、可信，通过成绩的评定从定量上评价教学质量水平就会越准确、越科学、越符合客观要求。

3.平时的考评和期终考评组成系统的教学评价体系随着现代教育测量的评价理论和实践的发展，成绩的评定和解释要符合系统论思想，从学期开始到结束的一个过程，就应预先订好各个阶段评定成绩的要求，以及整个系统评定的设想，然后有计划、有目的、有步骤地把单元考评和期终考评有机地结合起来，也就是要把诊断性考试、形成性考试和终结性考试结合起来，才能从成绩评定中看到学生学习质量的变化情况，从而考察教师的教学效果和教学水平。

4.教与学相结合进行全面评价

过去的成绩评定往往偏重于给学生一个分数当做给家庭报告的成绩单的内容，没有充分发挥教学评价作为教学信息反馈对提高教学质量的重大作用。今后，要结合平时对学生的学习态度、兴趣和爱好等的观察、调查资料，以及教师备课、施教的情况与考试成绩一起进行综合、全面的评价。

二、化学成绩评价的标准和方法

正如前面所说，通过测验和考试等可以搜集化学教学效果的数量资料，而分数只表示学生学习化学达到教学目标程度的数量化的反映，并不说明它具有多大的教育价值，只有通过评价对分数加以解释之后，才能充分表明数量资料的涵义，方可作为教学反馈信息的可靠数据。

评价必先确定标准，标准不同，解释的方法也会不同。按照评价所依据的不同标准和解释方法可将评价分为：相对评价、绝对评价和个人内差异评价。

（一）化学成绩的相对评价

1.相对评价的意义相对评价是以一个学生的化学成绩与同一群体的平均成绩或标准样组的成绩（即常模）相互比较，从而确定该生的化学成绩的适当程度或水平的评价方法。因此，相对评价又称常模参照评价或相互参照评价。这种评价方法重视的是个人在群体中的相对位置，只要相对位置不变，即使他的成绩实质上提高了，其评价仍然不变。

①

中华人民共和国国家教育委员会制订.北京：人民教育出版社，1986.5～应用相对评价的好处在于确定个人在考生群体中的位置和名次，可以避免教师主观印象的影响，评价比较公正客观。这种评价有利于甄别性强的考试目标的实现。可以作为编班、分组、升级或择优录取或淘汰、决定人选的依据。不足之处是只凭卷面成绩作相对比较，而不顾及个人的智力、性格、兴趣、健康等因素，因此，有人批评说这是抹煞个性的评价方法。另外对才能低下者的努力也缺少适当的评价，缺乏激励的作用。

2.相对评价对化学成绩的解释标准在一班学生的成绩中，如果用百分制表示卷面成绩（原始分数）最多只能表示分数的高低，并不能表示他在班中的地位。例如，某生化学考了 60 分，如果全班平均分在 80 分以上，那该生在班中属于差生，如果全班平均分仅为 40 分，那该生就可能是优等生，或者，从名次上说，该生列为全班第20 名，这要看全班人数多少才能确定该生的水平。如上所述，不适宜用原始分数作为相对评价的比较标准，需要将原始分数转换为标准数值才能与全体考生的水准进行比较，以便确定该生分数的真正价值（班中第几名、学习水平高低）。标准数值的表示方法主要有标准分数法、五级评定法和百分等级法等。

设置

手机

书架

书页

第六章 化学教学测量和评价

第六章化学教学测量和评价