平均以外的各种代表值
代表数学能力平均分数、月平均气温等诸多数据中,被广泛使用的就是平均。“平均(mean)”在大多数情况下充分发挥着代表值的作用,但是有非常高或低的值时其影响就非常敏感。
假设,某公司有月薪1500元的职员6名,2000元的职员5名,10000万元的高级职员2名,它们的平均月薪是3000元。
(1 500元×6名)+(2 000元×5名)+(10 000元×2名)13名=3000元
但是,把3000元称做代表值似乎有点不太恰当,因为由于月工资10 000元的原因平均值上升了很多。在这种情况下,如果按大小顺序排列值,则有可能位于中间的“中央值(median)”2000元才是最恰当的代表值。
还有表示最高频率的“最频值(mode)”。假设,调查大众最喜欢的音乐类型,结果为①叙事曲18名,②嬉哈9名,③狐步舞曲3名。这时计算平均值为1.5。
(①×18名)+(②×9名)+(③×3名)30名=1.5
但是,此处平均值1.5没有任何意义。这种情况下,选择显示最高频率的最频值①作为代表值是最恰当的。因此,根据资料的性质和求代表值的目的恰当地选择平均值、中央值、最频值是非常必要的。
“山葡萄”并不是在山上长的
和平均一样需要注意的是表示资料分布的“分散度”。曾经有这样一件趣事,某中学的数学课中出现了分散度这一词,学生们都误以为是“山上长的葡萄”。分散度是用来表示分散的程度,它经常使用的是范围、分散、标准公差等。
在某次战役中,率领战士们冲向敌阵的一个将帅遇到了一条河。从这个村子的老人那里了解到此河的平均水深为140cm,而战士们的平均身高为165cm,从此判断出战士们可以行军过河,于是将帅下令让战士们攻击敌军。但是,谁都可以想象得出河的水深有比战士们的身高更深的地方,所以将帅遭受了极大的挫败。在这一故事中,重要的不是平均水深而是水深是怎样分布的。
去海外旅行时,为了准备适合当地气温的衣服而确认当地的平均气温,但是这时候光考虑平均(气温)就肯定会弄得很狼狈。假设平均气温为20度,根据最高气温是15度和25度还是5度和35度,需要带的衣服是不一样的。
另外,患病者的平均生存期限也是一样的。假设平均生存期限是3年,那么有分布成2.5年到3.5年的情况和分布成1年到5年的情况,所以根据这一情况患者的心情也是不一样的。