在信息处理技术员考试中,经常会考到数据统计知识,除了像图表、抽样调查等知识,还会考查到众数、中位数等内容。另外,还有方差、标准差的概念考查。因此,这一次我们来看下这些概念和常见的题型。
众数
概念
众数:一组数据出现次数最多的数据。
如:{1,1,3,7,10,10,10}这组数中,1出现了2次,3和7均只出现1次,10出现了3次,出现次数最多的是10,故众数是10。
在Excel中,用Mode函数来求解在某一数组或数据区域中出现频率最多的数值。如:输入“=mode(1,1,3,7,10,10,10)”返回的结果是10。
在求解众数时,要注意以下几点:
- 一组数的众数一定在这组数中;
- 众数可能不唯一,有可能有多个数值出现的次数是一样的,如:{1,1,1,3,7,10,10,10}这个时候得到的众数是1,10。
ps:excel中,mode函数的结果只有一个值。如果是多个值,可以用MODE.MULT函数求解一组数据或数据区域中出现频率最高或重复出现的数值的垂直数组。如果是水平数组,再配合transpose函数一起使用。例题
2013年下半年试题47
在Excel 2003中,A1到E6单元格的值如下图所示,若在A7单元格中输入计 算众数的函数“=MODE(A1: E6)”,按回车键后,则A7单元格显示的值为( )。
A.92
B.77
C.72
D.60
点击查看答案和解析
分析:mode是求众数,即出现次数最多的数值,可以直接从选项中来进行判断,其中A选项92总共出现了3次;B选项77总共出现了7次;A选项72总共出现了1次;A选项60总共出现了1次。故选择B选项。
答案:B
中位数
概念
中位数:一组数据从小到大的顺序依次排序,处于中间位置的一个数或最中间两个数的平均数。
如:{1,1,3,7,10,10,10}这组数中,中位数是7。
在Excel中,用Median函数来求解在某一数组或数据区域中的中位数。如:输入“=median(1,1,3,7,10,10,10)”返回的结果是7。
但是在求解中位数时,要注意以下几点:
- 一定要先按照大小顺序排序,可以从小到大,可以从大到小。如:{1,1,3,7,10,10,10}这组数如果写成:{1,10,10,10,1,3,7},也要记得先排序,而不是直接取处于中间位置的数值。
- 中位数有可能是排序后最中间位置的数,也可能是排序后中间位置两个数的平均数。
- 当这组数的个数是奇数个时,中位数是排序后最中间位置的数,如:{1,1,3,7,10,10,10}的中位数是7,此时这个中位数在这组数当中;
- 当这组数的个数是偶数个时,中位数是排序后最中间位置两个数的平均数,如:{1,1,3,7,9,10,10,10的中位数是(7+9)/2=8,此时这个中位数不在这组数当中。
- 一组数的中位数有可能是在这组数字中,也有可能不在这组数当中,返回结果是一个值。
例题
2011年上半年试题27
下面记录的是某班36人期末考试的数学成绩:
| 97 | 100 | 95 | 96 | 100 | 87 |
| 96 | 100 | 89 | 100 | 93 | 69 |
| 99 | 89 | 100 | 81 | 88 | 91 |
| 100 | 87 | 98 | 75 | 85 | 89 |
| 84 | 92 | 86 | 100 | 100 | 61 |
| 87 | 51 | 81 | 92 | 95 | 97 |
这些成绩的中位数为( )。
A. 90
B. 91
C. 92
D. 93
点击展看答案和解析
分析:求中位数,则要找从小到大排序后处于最中间位置的那个数或中间位置两个数的平均数。在这里,总共的个数是36个,最中间位置的数是排序后第18个、第19个数的平均数。一种方式就是先排序,然后去找到,再去求平均值。
然后也可以用下面这种办法,因为题目给出的数目比较多,要找的是18、19号,所以前面一些小的值可以不用排序,靠近的才排。可以按照从大到小来看,100的个数是8,接下来,90多分的个数有12个,这两个加起来就是20个了,说明中位数在90多分里面,我们将90~99段的数从大到小为:99,98,97,97,96,96,95,95,93,92,92,91。因此,整批36个数按从大到小顺序排列后,前面100是8个,要找第18、19个就是90~99分段的从大到小排在第10、11个。故,位于中间那两个数是92和92, 从而其中位数就是92。
答案:C
方差和标准差
概念
方差和标准差: 测算离散趋势最重要、最常用的指标。
- 当数据分布比较分散时,各个数据与平均数的差的平方和较大,方差就较大;
- 当数据分布比较集中时,各个数据与平均数的差的平方和较小。
因此方差越大,数据的波动越大;方差越小,数据的波动就越小。
方差是各个数据与平均数之差的平方的和的平均数。其计算公式:

其中,x表示样本的平均数,n表示样本的数量,xi表示个体,而s2表示方差。
此外,标准差是方差算术平方根,因此在上述表达式中,s是标准差。 很多同学对方差表示离散趋势和波动情况不是很理解,我们看两组数:
第一组:{0,50,100}
第二组:{49,50,51}
大家首先判断一下,那一组数据更接近呢?应该不难判断判断,第二组的值比较接近,波动情况小,离散程度小一些。
然后可以计算下方差,可以不用计算,也可以看出来两者的平均值是一样的,然后将每个数减去平均值后的平方和,前者大很多,故而方差和标准差第一组>第二组的值。
在信息处理技术员考试中,不需要掌握标准差和方差的计算,只需要了解其表达的含义即可。
例题
2011年上半年试题26
在统计学中,用来衡量一个样本中各个数据波动大小的量是( )。
A. 样本方差
B. 样本中位数
C. 样本平均数
D. 样本众数
点击展看答案和解析
分析:在统计学中,用来衡量一个样本中各个数据波动大小的量是样本方差。通俗地说,样本方差体现了样本中各个个体的离散程度。样本的方差等于样本中各个个体与样本平均值之间的距离平方的平均值。样本方差为0时,样本中各个个体的值相同。样本方差越大,样本中的各个个体与样本平均值之间的离散程度越大。
答案:A
极值
概念
另外,在信息处理技术员中还会出现极值的概念,主要有极大值、极小值和极差。
极大值/最大值:是一组数的最大值,在Excel中用函数Max来求。如:max(1,2,3,4,5,10)=10;
极小值/最小值:是一组数的最大值,在Excel中用函数Min来求。如:min(1,2,3,4,5,10)=1;
极值:是最大值和最小值之间的差值,如{1,2,3,4,5,10}的极值就是10-1=9。
例题
2017年上半年试题43
在Excel中,若要计算出B3:E6区域内的数据的最小值并保存在B7单元格中,应在B7单元格输入( )。
A. =MIN(B3:E6)
B. =MAX(B3:E6)
C. =COUNT(B3:E6)
D. =SUM(B3:E6)
点击展看答案和解析
分析:求最小值为函数Min函数。
答案:A
综合练习
试题 1
2016年下半年试题11
一批数据可以有多个指标。以下指标中,( )不宜作为这批数据的代表值。
A. 中位数
B. 众数
C. 平均数
D. 方差
点击展看答案和解析
分析:本题考察初等数学基础知识。中位数、众数和平均数都可以作为数据的代表值,而方差代表这组数据的离散程度。
答案:D
试题 2
2011年下半年试题14
最能反映小型企业内大多数职工工资状况的统计指标是全体职工工资的( )。
A. 平均值
B. 中位数
C. 极差
D. 方差
点击展看答案和解析
分析:样本数据的统计指标有多种。方差反映了全体数据之间的离散程度,极差是最大数与最小数之差,这两种指标都只反映差异,而不能反映整体状况或多数状况。
小企业内职工工资的平均值虽然大体上反映了企业工资水平,但如果负责人工资特别高,普通员工工资普遍很低时,平均值不能正确反映大多数职工的工资状况。而中位数更能反映大多数职工的工资状况,因为工资比中位数高的人数与比中位数低的人数相等。频数则大体反映了全体数据的分布状况。
答案:B
试题 3
2012年下半年试题4
小王求出了一批数据的均值和方差,则( )。
A.均值可作为这批数据的代表,方差体现了这批数据的离散程度
B.均值位于这批数据的正中,方差反映了这批数据的误差
C.均值左右两边的数据一样多,方差是两两数据之差的平方和
D.均值必是这批数据中的某一数,方差是离均值最远的数
点击展看答案和解析
分析:均值(通常指算术平均值)可作为这批数据的代表。方差体现了这批数据的离散程 度(相对于均值的分散程度),用“各数与均值之差的平方和”来表示。
均值不一定位于正中(例如1、2、3和100)。方差在某种程度上反映了这批数据相 对于均值的误差,如果所有数据都大大偏离了目标值,那么即使方差很小,其误差也很大。均值左右两边的数据个数通常是不等的,均值通常不是这批数据中的某一数(如上例)。
答案:A
这个知识点讲到这里啦,谢谢大家!