一、统计图的种类与构造
统计图种类很多,常用的有:条图、圆图、百分条图、线图(包括半对数线图)、直方图和统计地图等。
统计图由以下各部份构成:
(一)标题 每个图都应有标题。标题要简明确切,通常包括内容、时间和地点。其位置在图域之外,一般放在图域的下面。
(二)图域 图域的长宽之比一般 7:5为美观,圆图除外。
(三)标目 纵横两轴应有标目,即纵标目和横标目,并注明度量衡单位。
(四)尺度 纵横两轴都有尺度,横轴尺度自左至右,纵轴尺度自下而上,数值一律由小而大。尺度间隔要宽松。用算术尺度时,等长的距离应代表相等的数量。
(五)图例 用不同线条或颜色代表不同事物时,需用图例说明。
二、资料性质与图形选择
统计资料的性质决定于统计表的主辞。主辞可分为品质的和数量的两类。主辞是品质的,如单位名称、性别、病型等为品质资料;主辞为数量的,如年龄、时间、脉搏等称为数量资料。数量资料又可分为连续性资料和间断性资料。连续性资料是指任何两个小的数值之间可以有无限个数值存在,如时间可依次分为年、月、日、时、分、秒、十分之一秒……等,所以时间是连续性资料。至于家庭人口数,在原始记录上不可能找到有4.3或5.8人口的家庭,所以人口数是间断性资料。
各类资料宜用何种图形表达示意如下:
三、常用统计图的绘制方法及注意事项
(一)条图 又名长条图 ,以条的长度表示事物的数量。可用以表示绝对数、也可用以表示相对数或平均数,常用的有单式条图、复式条图和分段条图。
1.单式条图:如图2.1,为某医院十年来六种疾病住院患者死亡人数。其资料见表2.6。
2.复式条图:用以比较两种或两种以上有关事物的数量。如图2.2表示某师各团菌痢和肠炎的发病人数,其资料见表2.7。
3.分段条图:用以比较事物的全部与其中一部分的数量。如图2.3表示某师各团传染病总人数及菌痢人数,其资料见表2.8。
绘制条图时应注意以下各点:
(1)图中各条要有同一基线,其尺度必须从“0”开始,否则会改变条间的比例关系。
(2)条的排列顺序由高到低,如事物有自然顺序者,也可按自然顺序排列。
(3)各条的宽度要一致,条间的空隙要相等,条间空隙一般不要大于条宽。
(4)尽量避免用折断或回转的条。
表2.6 某医院十年来六种疾病住院患者死亡人数
病名 | 瘤(癌) | 脑外伤 | 心脏病 | 白血病 | 脑溢血 | 肺炎 |
死亡人数 | 187 | 44 | 42 | 38 | 32 | 29 |
图2.1 某医院十年来六种疾病住院患者死亡人数
表2.7 某师各团菌痢、肠炎发病人数 19××年
病种 | 一团 | 二团 | 三团 | 炮团 |
菌痢 | 41 | 43 | 61 | 34 |
肠炎 | 26 | 23 | 38 | 35 |
图2.2 某师各团菌痢、肠炎发病人数(19××年)
表2.8 某师各团传染病部人数及菌痢发病人数19××年
一团 | 二团 | 三团 | 炮团 | |
传染病发病总人数 | 81 | 148 | 179 | 128 |
其中菌痢发病人数 | 41 | 43 | 61 | 34 |
图2.3 某师各团传染病总人数及菌痢发病人数(长条全段表示传染病发病人数,下段表示菌痢发病人数)
(二)圆图 圆图用扇形的面积,也就是圆心角的度数来表示数量。它用来表示组数不多的品质资料或间断性数量资料的内部构成,各部份百分比之各和必须是100%。如图2.4表示某医院用10%明矾液治疗面部深层海绵状血管瘤的疗效构成,其资料见表2.9。
圆心角(度)的计算方法是将百分数乘以3600,如表2.9中的特效百分比所占的圆心角度数为69.5%×3600=250.20,余类推,见表2.9最后一栏。
绘制圆图时应注意:各扇形应按大小或自然顺序自时钟9时或12时处开始,顺时针方向排列;各扇形内要注明简要的文字和百分比。
表2.9 10%明矾液治疗面部深层海棉状血管瘤疗效
疗效 | 病例数 | 百分比(%) | 绘图用圆心角(度) |
特效 | 66 | 69.7 | 250.0 |
显效 | 14 | 14.7 | 52.9 |
有效 | 11 | 11.6 | 41.8 |
无效 | 4 | 4.2 | 15.1 |
合计 | 95 | 100.0 | 360.0 |
图2-4 10%明矾治疗面部深层海绵状血管瘤疗效
(三)百分条图 凡能画圆图的资料,也可用百分条图表示,绘制方便。尤其在比较几个组的内部构成时,可绘制长宽相同的几个直径,各直条内相应构成部分的排列顺序、花纹或图案应一致,并附一百分尺度。如图2-5,资料来源见表2-10。
表2-10 某医院用脊电针治疗慢性支气管炎的结果19××年
病型 | 总例数 | 人 数 | 百分比(%) | ||||||
近控 | 显效 | 好转 | 无效 | 近控 | 显效 | 好转 | 无效 | ||
单纯型 | 834 | 525 | 180 | 103 | 26 | 62.9 | 21.6 | 12.4 | 3.1 |
喘息型 | 179 | 93 | 38 | 34 | 14 | 52.0 | 21.2 | 19.0 | 7.8 |
图2-5 某医院用脊电针治疗慢性支气管炎的结果
(四)线图 线图适用于连续性数量资料,常用以表示事物或现象在时间上的发展变化,如图2-6。从图中可看出7~10月份为菌痢发病的高峰期。资料见表2-11。
绘制线图时,通常以横轴表示时间或变量,纵轴表示指标,两轴的尺度均可不从“0”点开始。图内线条一般不超过四、五条,可分别以不同的线段或颜色表示,并附图例说明。
表2-11 某部队1970年逐月菌痢发病人数
月份 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 合计 |
发病人数 | 4 | 4 | 6 | 5 | 7 | 8 | 28 | 75 | 97 | 49 | 27 | 14 | 324 |
图2-6 某部队1970年逐月菌痢发病人数
半对数线图 用于比较两种或两种以上率的变化速度。它是将线图绘在半对数坐标纸(纵轴为对数尺度,横轴为算术尺度)上。如果将表2-12中的三组数据时间从A到B分别绘在算术格纸(图2-7)与半对数格纸(图2-8)上,将呈现两种不同的结果。
表2-12 绝对差与相对差比较
A→B | 绝对差(A-B) | 相对比(A/B) | 对数差(1gA-1gB) |
(1)1000→100 | 1000-100=900 | 1000/100=10 | 1g1000-1g100=3-2=1 |
(2)100→10 | 100-10=90 | 100/10=10 | 1g100-1g10=2-1=1 |
(3)10→1 | 10-1=9 | 10/1=10 | 1g10-1g1=1-0=1 |
图2-7 三组数据绘在算术格纸上
图2-8 三组数据绘在半对数格纸上
在算术格纸上三条直线的坡度相差悬殊,这是由 于三组数据的绝对差相差悬殊。在半对数格纸上三条直线平行,这是由于三组数据的对数差相等,图上反映出三组数据下降的幅度相同。
例如从表2-13可看到细菌性痢疾的发病率最大值(45.37‰)为最小值(14.62‰)的3倍多,肺结核的最大值(3.65‰)为最小值(0.52‰)的7倍多。所以前者下降速度较慢,而后者较快,如果画在普通方格纸上,如图02-9,将给人以错觉,而画在半对数纸上如图2-10,就能正确地表达两种疾病发病率下降速度的快慢。
绘制半对数线图时,横轴为算术尺度(是等距的),用来表示时间;而纵轴为对数尺度(是不等距的),用来表示被比较事物的某种率,纵轴尺度的标法,自1-10为一组,上一组各数为下一组相应数的10倍。
表2-13 某部二十年来细菌性痢疾与肺结核的发病率 1958-1977
年份 | 发病率(‰) | 年份 | 发病率(‰) | ||
细菌性痢疾 | 肺结核 | 细菌性痢疾 | 肺结核 | ||
1958 | 30.22 | 3.65 | 1968 | 18.06 | 1.10 |
1958 | 45.37 | 2.32 | 1969 | 14.06 | 1.24 |
1960 | 38.84 | 2.12 | 1970 | 16.06 | 1.30 |
1961 | 28.41 | 2.31 | 1971 | 17.89 | 1.06 |
1962 | 24.33 | 2.59 | 1972 | 16.71 | 0.94 |
1963 | 28.20 | 2.30 | 1973 | 15.29 | 0.76 |
1964 | 19.41 | 1.86 | 1974 | 19.11 | 0.66 |
1965 | 24.26 | 1.31 | 1975 | 21.69 | 0.57 |
1966 | 25.24 | 1.27 | 1976 | 17.56 | 0.53 |
1967 | 22.30 | 1.26 | 1977 | 19.96 | 0.52 |
图2-9 某部二十年来细菌性痢疾与肺结核的发病率1958-1977
图2-10 某二十年来细菌性痢疾与肺结核的发病率 1958-1977
(五)直方图 直方图用矩形面积表示频数.如图2-11为我军某校部份同年龄同性别学员的身高分布,资料见表2-14.
表2-14 我军××学校部分学员的身长分配
身长(厘米) | 152- | 156- | 160- | 164- | 168- | 172- | 176- | 180- | 184- | 188- | 合计 |
人数 | 1 | 10 | 28 | 56 | 52 | 34 | 12 | 5 | - | 1 | 199 |
图2-11 我军××学校199学员的身长分配
当频数表的组距不等时,不能直接用各组频数绘制直方图,应先将组距化为相等,得出组距相等的各组的频数,再绘图,如表2-15的组距不等,若用各组的患者人数绘制直方图,得图2-12,给人以错觉,好象10~20岁组的患者人数最多,其实这是组距不等造成的,因为10岁以前各组的组距为1,而10岁以后各组的组距为10岁。因此,图2-12不能正确反映真实情况,应先将组距化为1,得出每岁平均患者人数,以此为矩形的高作图,如图2-13,才能正确表达出资料的实际情况。
绘制直方图的注意事项:
(1)直方图的的纵轴应从“0”开始,而横纵可以不从“0”点开始。
(2)直方图中各矩形之间可划直线隔开,也可以不划。
(3)当各组的组距不等时,不能直接用各组频数绘图,需要象表2-15那样处理(通常是将频数除以组距作高度)后再作图,否则会给人以错误印象或概念。
表2-15 ×年×市流行性乙型脑炎患者的年龄分布
年岁 | 0- | 1- | 2- | 3- | 4- | 5- | 6- | 7- | 8- | 9- | 10- | 20- | 30- | 40- | 50- | 合计 |
人数 | 3 | 3 | 9 | 11 | 23 | 22 | 11 | 14 | 8 | 6 | 36 | 13 | 11 | 4 | 1 | 175 |
每岁患者人数 | 3 | 3 | 9 | 11 | 23 | 22 | 11 | 14 | 8 | 6 | 3.6 | 1.3 | 1.1 | 0.4 | 0.1 | - |
图2-12 ×年×市流行性乙型脑炎患者的年龄分布
图2-13 ×年×市流行性乙型脑炎患者的年龄分布
7.统计地图
统计地图用以表示事物(或现象)在地域上的分布情况,多用点、线、颜色、符号等在地图上表示某种现象的数量,图图2-14为我军某部队一次痢疾流行时的患者分布情况。
图2-14 某部队一次痢疾流行时的患者分布