
之前我在计算2014,2010年学生质调研数据的时候,我把每个省的数据,直接算术平均,得出来的数据,和学生体质调研公布全国总表的数据是差不多的。(帖子标题《学生体质调研按照全人口加权平均数和算术平均数对比》)
但是这次2019年的数据,我把每个省的数据》直接算术平均以后,得出来的数据,和学生体质调研公布的全国总表数据对不上。
后来我才把问题搞清楚,因为2014年和2010年的每个省,基本上每个年龄段,城,乡分别150样本,17-18男生基本是600样本,女生16-18岁900样本。
但是2019年每个省,每个年龄段,样本波动很大,样本都不一样,但是最终公布出来的数据,是所有人的算数平均,举个例子,比如这个数据的城市男生18岁,样本4239,身高173.31,是这4239样本的直接算术平均,那么在计算的时候,因为分省样本不一样,必须要先按照分省样本加权平均才行。我把所有分省数据,按照样本加权以后,最终计算出来数据,和公布出来的是完全一样的。这样就完全符合了。
下面我把分省数据发出来。男生是17-18岁,女生16-18岁。