第一章 医学统计中的几个基本概念

作者:徐荣祥 出版社:中国科学技术出版社 发行日期:2009年7月

第一节 总体与样本


  在医学研究中,经常通过对一定数量的人或动物进行科学研究,从中推论出同一性质中的全体对象的某些情况,其中被观察者称为样本(sample),而样本所代表的全体被称为总体(population)。因此,可以给总体下这样一个概念:总体是根据研究目的确定的同质研究总体,更确切地说,是性质相同的所有观察单位某种变量值的集合。譬如,研究某地、某年、正常成人的血压值,其研究对象是该地该年的正常成年人,观察单位是每个人,变量是血压,变量值是测得的血压值,该地该年全部正常成人的血压值就构成了一个总体。这个总体的同质基础是同一地区、同一年份、同为正常成年人。
  总体分为有限总体(finite sample)和无限总体(infinite sample)。上述例子属于有限总体,因为所观察的单位是有限的,即某个单位。无限总体是所设想的所有高血压病人,这个研究单位是庞大的,观察人数是不确定的,无限的。在烧伤临床研究中,所研究的结果很多情况都能代表无限总体,如观察某药治疗深Ⅱ度烧伤病人创面的疗效,因为我们不可能同时对所有烧伤病人的深Ⅱ度创面进行直接治疗和观察,故常在实验性治疗中只观察其中一部分深Ⅱ度病人的创面。临床所研究的这一部分深Ⅱ度创面就是我们要研究的那个庞大总体,即凡是有深Ⅱ度创面的病人,或者说所有病人的深Ⅱ度创面都是我们研究的总体。
  科学研究的目的是要阐明总体特征和规律,然而,在实际工作中的多数情况下没有必要或不可能对总体中的每一个个体进行研究。对有限总体来说,若观察的单位过多,直接研究总体耗费人力、物力也很大,这也是不可能和不必要的。打个比方,国家食品检验机构要检查某种食品的质量,不可能将所有的这种食品一一检查,而常常是从某些样本的信息中抽取部分来推断总体的性质。
二、样本(sample)
  在总体中已提到,科学研究的目的是要阐明总体的特征和规律,具体方法是进行抽样(sam-pling)研究,从总体中抽取一部分有代表性的个体。这些个体的观察值就构成样本,即样本就是烧伤临床资料归纳与“示例”统计分析从总体中随机抽取(random samping)的部分观察单位,所测定的某指标变量实测值便构成样本,而对样本性质的研究就是推断总体性质的基础。例如,只观察用某药治疗100 例(处)烧伤创面的疗效,则这100 例(处)创面即为样本。但是,研究的目的不仅只是限于说明这100 例(处)创面的疗效,而是要说明这种药物能够治疗所有的深Ⅱ度烧伤创面。进而说明所有深Ⅱ度创面都是我们研究的总体,并为今后在临床相同条件下用此药治疗其他病人的深Ⅱ度创创提供依据。为了使样本对总体具有足够的代表性,要求样本必须是从总体中随机抽取的,且样本中的个体要足够多。统计学上把刻画总体特征的指标称为参数(parametic),把刻画样本特征的指标称为统计量(statistic)。上例应用某药治疗全部深Ⅱ度烧伤创面的效果水平,如果观察的是愈合天数的平均值,总体均数就是参数;而样本的平均水平(均数)就是统计量。
三、烧伤样本的特性
  烧伤是一种全身性疾病,但变异性较大,有的病人烧伤面积可能小到不足1% (TBSA)体表面积,有的可达到100%体表面积,有的为Ⅱ度烧伤,有的为Ⅲ度烧伤。在临床研究时一定要充分考虑到这些因素,如果把1% TBSA 烧伤患者和100% TBSA 烧伤患者放在一起研究,则失去了样本的同质性,当然也就失去了代表性。故在样本选择上必须注意以下两点:
1 样本的同质性
  在课题设计时,首先应当考虑的是总体的同质性(homogeneity),也就是确定被研究对象的同质基础,包括时间、空间、条件等。如观察某药治疗深Ⅱ度烧伤创面的效果,首先确定被研究对象必须是深Ⅱ度烧伤创面,而且应当把深Ⅱ度烧伤创面的面积控制在相同或相近的范围内,其他因素如患病年龄、烧伤原因、伤后接受治疗时间、院外治疗情况等都应控制在相近范围内。总之,被研究对象的各种因素均应具有一定的同质性。然而,同质是个相对的概念,如深Ⅱ度烧伤创面的诊断本身就是一个估计值,再说,烧伤创面(包括深Ⅱ度创面)属于立体式损伤,上下都有一个界面,被研究的创面一定会有深有浅。故对深Ⅱ度创面与其上下相邻的浅Ⅱ度与浅Ⅲ度创面比较时,它们既有各自的特点,也存在一些相似的表现。所以,在进行研究时要充分考虑到这一点,无论临床研究还是实验研究,其被试样本的各个受试条件都应在一个层面上。如创面都是深Ⅱ度创面,相似的烧伤面积,统一的伤因,统一的年龄段,统一的治疗与观察方法等,这就是科研设计的总体概念。在观察“某药治疗深Ⅱ度烧伤创面的疗效”时,如把浅Ⅱ度创面也混在其内,势必会夸大该药的治疗效果;相反,若把Ⅲ度创面混在其内,则会缩小治疗效果,更重要的一点是不能正确地表露该药对深Ⅱ度烧伤创面的总体治疗效果。
2 样本的代表性
  如前所述,总体是根据研究目的而确定的、全部同质个体(indivdual)的某个(或某些)变量值,它代表被研究对象的全体;而样本就是从总体中随机抽取的某些个体(一部分),这样的样本才具有代表性。研究深Ⅱ度烧伤创面时,必须从众多的深Ⅱ度烧伤创面中随机抽取某些个体作为被试对象,所得结果才能说明总体。假如我们要研究深Ⅱ度创面的愈合时间,选择的样本有些是糖尿病合并烧伤的烧伤创面,必然会影响到研究结果的可靠性,因为糖尿病本身愈合能力差,所得出的结果就没有代表性,更不能说明欲要研究的总体。研究其他病变也是一样,褥疮按损伤程度分为四个等级,如把四个等级的创面放在一起研究,所得结果既不能说明褥疮这个总体情况,也不能说明哪一级褥疮的真实情况。由此可见,样本是个十分复杂和多变的指标,尤其在烧伤医医学统计中的几个基本概念学中,故在研究或统计时要充分考虑这些问题。
3 烧伤样本的确定
  根据“样本是从总体内随机抽取一部分”的含义,烧伤样本应视两种情况而定:作为局部研究来说,病损处是被研究的对象,病损个数就是样本;作为全身研究来说,如观察全身性症状体征,观察单位应为病人,病人就是样本。如果研究的是创面变化,应以创面个数为单位表示,不能以例数为单位表示。因为同一病人往往不止有一个创面,尤其是在大宗资料中。通常的表述方法为× ×例× ×个创面,如30 例病人120 个创面。全身有两个对称器官被烧伤者,除了注明左右外,还应注明单侧或双侧,如40 例60 只耳烧伤,读者一定会知道40 例中有20 例为双侧耳烧伤。在此顺便介绍与此有关的两个资料概念,一是封顶资料,二是保底资料。40 例病人最多为80只耳,80 即为封顶资料,40 则为保底资料,否则不属于正常人的情况。体表烧伤面积最大为100% ,这是封顶资料,因为事先人们已把人体的体表面积作为100% 。患病年龄不能封顶,它属于开口资料,假如今年收治了一位百岁烧伤老人,将来可能会收治大于百岁的烧伤患者。同理,一个病人可能有许多创面,创面也可视为开口资料。