第一节 统计工作的基本步骤

作者:徐荣祥 出版社:中国科学技术出版社 发行日期:2009年7月

烧伤资料统计可分为统计设计、收集资料、整理资料和分析资料四个步骤。即在周密的统计设计的指导下,正确、完整地收集资料,整理资料,以此进行合理准确地分析、推断。这四个步骤虽先后有序,但却密不可分,如果在任何步骤上出现问题或缺陷,都会影响到统计分析结果。
一、统计设计(design statistics)
在烧伤临床研究中,有许多资料或数据需要收集、整理及分析,从中得出符合临床实际的结论,这一过程称为统计设计。统计设计的意义在于保证统计结果准确可靠。主要内容包括:①明确研究目的;②确定数据的采集范围,如划分观察对象的全体、选定观察指标、确定调查方法等;③规定质量控制方法,如校正仪器,统一测量时间和方法、数据记录精度等;④拟定专题调查、调查问卷、登记表格格式,如果数据要录入计算机,则要规定数据格式;⑤确定资料的归纳和分组方法;⑥确定统计分析指标和统计分析方法;⑦制订人员培训计划及组织工作安排、时间进程、经费预算等。
鉴于烧伤疾病存在许多复杂的因素,统计工作必须经过科学的周密设计,否则不能以较少的人力、物力和时间,获得准确可靠的结论。当研究比较复杂的问题时,应先在小范围内进行预试验,以便及时发现问题,完善设计方案,为大规模实验积累资料。预实验是选择和确定临床研究课题的第一步,也是确保科研达到一定目的,解决一定问题,获得一定成果的重要步骤。假如研究课题不明确,统计工作也就无从谈起。因此,选题一定要经过慎重考虑,用科学的思想、方法立题,同时应请有关人员予以科学论证,使选题的目的更加明确。选题起点一定要高,具有一定的先进性、创新性,使研究成果能在某一个范围内,或在某一个方面,某一个层次上具有较先进的水平。除此之外,选题的科学性尤为重要,要使选题具有充足的理论根据,有科学原理的指导,有实践基础,论据要充分、合理,同时要有可行性,具有完成课题的必要条件等。关于临床研究课题的选择,首先应把功夫放在选题上,不要盲目从事。有人可能会问,课题从哪里来?首先来源于实践,其次来源于书本。
二、收集资料(collection of data)
收集资料就是通过合理可靠的手段与渠道,按照统计设计的要求,及时获得研究所需的、准确完整的原始数据。资料收集的方式根据研究目的与设计要求确定,可通过专门手段收集,如专题调查、专项实验。在许多情况下,也可通过统计报表、统计年鉴、经常性的工作纪录和数计库收集资料。应当指出,只有原始资料可靠,方能得出可靠的结论。烧伤资料统计与其他医学资料统计一样,资料来源于以下几个方面:
1统计报表
根据国家规定的报表制度,各级组织或医疗中心机构应根据所需要的内容制定自己的统计表,令其下级单位定期逐级上报。如烧伤资料的多中心研究,欲获得资料单位的总中心首先应制定统计表,发至各分中心,各分中心及时如实上报。这种做法的主要意义在于它能为总中心提供宏观控制依据,为拟定医疗、课题设计、检查与总结工作提供科学根据,同时也为科学研究提供基础资料。但报表项目一般较少,不便据以进行深入细致的分析。假如调查或填报者对调查项目的理解和执行过程不尽一致,便会影响到各单位之间指标的可比性。其中最常见的问题是医院对某病的治愈标准不统一,或是虽有统一标准,因为医师在程度掌握上有宽有严,也会影响到治愈率的可比性。假如各个分中心的治愈率相差悬殊,在汇总统计时应进行标准化处理,否则不能反映其真值。
2医疗工作记录和报告卡
包括病历卡、医学检验记录卡及疾病报告卡等。这些资料常会出现漏填、重复或项目填写不清等现象,欲使资料能够用于科研分析,必须使医务人员认识到原始记录的正确性、完整性的重要意义,根据每项的目的要求认真填写。特别提出的是不论调查研究,还是临床研究,总中心都应首先制订出一个完整、切实可行的研究或调查计划,这个计划要做到周密详细,而且贯穿于整个科研过程中。假如研究或调查方法是错误的,课题设计自然不会合理、也不严密,结果会使整个研究徒劳无功。故调查研究的前提必须是课题设计要有科学性、严密性、合理性,高效性,确保科研达到预期水平。
3专题调查或试验
用统计表或记录卡进行调查研究,有时并不能满足研究需要,此时需要进行专题调查或实验研究,这种情况常见于回顾性调查。回顾性研究具有许多固有的缺陷,最常见是原始资料不齐全或不正确,给整理资料及分析资料造成困难,甚至得出错误的结论。因为回顾性研究的这种缺陷很难用统计方法弥补,故除做好调查设计和实验设计工作以外,应在调查设计和实验设计过程中及时对资料作出以下检查:①完整性检查原始资料是否有遗漏或重复,各项目是否已填写;②正确性检查资料是否准确,能否反映事物的真实性,各项目之间有无矛盾,各数字之间是否合理等。上述问题一旦被发现,遗漏资料应当补充,重复资料必须剔除,错误资料予以更正。
三、整理资料(sorting data或gata processing)
整理资料是将原始资料按统计设计要求去伪存真、归类整理进行分组的过程。人们习惯把去伪存真的方法叫数据净化(data cleaning),即对原始数据进行检查、校对、纠错、改正。检查与核对一般按照逻辑检查(logical check)和统计检查(statistical check)方法进行。在资料整理过程中,通过逻辑检查和统计检查,能够及时发现、更正或剔除错误的原始记录,以保证下一步统计分析的正确性。
(一)统计归纳
1汇总列表
将原始记录按名称排列后汇总到整理表上,如根据门诊、巡诊和疾病患者登记簿中的初诊登记,逐日汇总为初诊人数;根据门诊和疾病患者登记簿中的诊断登记,逐日汇总各种疾病的发病人数,并记录在初诊患者分类逐日登记表上。
2资料归纳
是将原始记录按顺序排列后汇总到整理表上,在形式上该方法与按名称归纳的方法相同,但原始记录不能像“名称”那样严格定义,它只有程度、等级的差别。例如治疗结果有“治愈”、“好转”、“无效”、“死亡”、“转院”和“其他”等登记结果。前四种结果只有等级的区别,故属于等级资料。
3根据资料性质重新制表
当原始记录为连续型变量或散布范围较广的间断变量时,要把数据的散布区间分为若干组段排列在整理表上,然后再分别填入各组的汇总数字。对于住院人数,可用划分组段后归纳的方法,如某医院某科室2006年l月不同年龄段住院患者的例数(见表321),这种表又叫频数表,以10~15岁年龄段为例,住院人数为16,最后合计数(248)为2006年1月份住院总人数。

年龄组段为等级资料,相应组段的人数为该等级住院人数的频数。

(二)统计分组
统计分组是根据研究目的将原始记录按照对比因素分组后,再进行统计归纳。常用的对比因素有单位间的对比、地区间的对比、不同时间的对比、试验组和对照组的对比等。
示例:一组深Ⅱ度烧伤创面(50个)采用甲种方法治疗,另一组(50个)采用乙法治疗,一年后随访其瘢痕发生情况(表322)。

(三)归组方法
1分类计数法
该法适用于卡片登记资料的分组归纳,如将医院住院卡片按疾病编码分别排放,最后分别清点各组卡片数,获得各种疾病的住院人数。
2划记计效法
该法适用于表格式登记资料的分组归纳(表323中)。它的来源经过以下过程,即在统计表上用划“正”字方法分组归纳,将发生瘢痕的病例创面用正字形式逐一划在表333中,最后根据各组的观察人数整理成表323的形式。

3频数表法
主要用于连续型数据和散布范围广的间断型数据的归纳。频数表本身不包括对比分组因素,如果原始记录需要分组归纳,要分别制作频数表。频数表不仅是数据的归纳整理表,在统计分析中也有重要作用,它是一种常见的统计数据的表达形式,如表321。
4计算机汇总法
适用于纪录项目较多,汇总归纳复杂的数据整理。常见于项目较多与复杂的资料,如带有医院、科室、研究起止时间、病人性别、年龄、疾病名称、病情程度、住院天数等因素的资料。根据多因素资料的要求,有许多分组表达方式。以住院天数的分析为例,可以按科室分组,也可以按疾病名称分组,或按疾病名称及病程进行因素交叉分组。上述资料若按手工方法分组相当麻烦且困难,最好的方法是用计算机汇总。常用的软件为数据库软件,如FoxPro、VB等。有时对特定的资料汇总时,如对病例首页资料进行汇总,可用SAS、SPSS特定的统计专用软件处理。
四、分析资料(analysis of data)
分析资料是在分组归纳的基础上对资料的统计分析,计算有关的统计指标,然后结合专业研究背景和业务知识,对统计指标的大小和差别作出合理的分析或解释。分析资料主要分以下三个步骤。
1选择正确的统计指标
如对表321的统计资料计算其平均住院人数,这种资料应当选择中位数计数法。表322中的资料为计数资料,比较两组的差别需要计算其瘢痕发生率。关于统计指标与方法详见后面相关章节。
2表达方式
为了便于分析和比较,需要将分组计算的统计指标列统计表或作统计图,予以表达。
3资料比较
对经常性的资料和普查资料,可直接比较统计指标的大小和组间差别,并作出合理的分析或解释。如果是根据抽样调查资料推理全体观察对象的特征,则需要估计统计指标的抽样误差,并对组间差异作假设检验。
各种资料经过上述方法处理之后,尚需进行理性概括。所谓理性概括就是将经过统计加工的研究资料,由感性认识上升到理性认识的逻辑思维过程。它通过归纳、演绎、类推、论证、分析、综合、抽象、概括等逻辑思维深化,经过判断、推理而获得科学的结论,最终写出科学报告与科学论文。有人说“科学就在于用理性方法去整理感性材料”,对所获得的感性材料应首先进行抽象概括,建立概念,再用概念进行判断和推理,从而建立科学假说或科学理论。上述过程必须以科学方法为导向,归纳、综合、演绎、类推、论证、分析等每个步骤都需要科学方法指导。科学研究假如没有正确的方法和方法论,所得到的结论必然是不符合实际的。由此可见,一份既不准确也不科学的资料(如实验误差相当的大),统计处理不但不能解决问题,反而造成一种错觉,得出某种错误的结论。