| 欢迎来到医学会议网! 请登录   免费注册
主页 > 保健 > 生理疾病 > 医学课堂 > 拿到原始数据就直接统计分析?慢着!听说过数

拿到原始数据就直接统计分析?慢着!听说过数

2020-08-01 09:25 | 来源:未知 | 责任编辑:本站编辑

我们在进行临床研究时,通常会收集大量不同的指标变量,每个指标的性质、量纲、数量级等特征,均存在一定的差异。针对涉及多个不同指标综合起来的评价模型,由于各个指标的属性不同,无法直接在不同指标之间进行比较和综合。


例如,假设各个指标之间的水平相差很大,此时直接使用原始指标进行分析时,数值较大的指标,在评价模型中的绝对作用就会显得较为突出和重要,而数值较小的指标,其作用则可能就会显得微不足道。


因此,为了统一比较的标准,保证结果的可靠性,我们在分析数据之前,需要对原始变量进行一定的处理,即我们本期内容将向大家介绍的数据的标准化处理,将原始数据转化为无量纲、无数量级差异的标准化数值,消除不同指标之间因属性不同而带来的影响,从而使结果更具有可比性。


数据的标准化


数据的标准化,是通过一定的数学变换方式,将原始数据按照一定的比例进行转换,使之落入到一个小的特定区间内,例如0~1或-1~1的区间内,消除不同变量之间性质、量纲、数量级等特征属性的差异,将其转化为一个无量纲的相对数值,也就是标准化数值,使各指标的数值都处于同一个数量级别上,从而便于不同单位或数量级的指标能够进行综合分析和比较。


数据标准化处理的类型


数据标准化处理主要包括指标一致化处理和无量纲化处理两种类型。


一、指标一致化处理


指标一致化处理,主要解决的是数据之间不同性质的问题。例如我们在评价多个不同指标的作用时,某一类指标,数值越大越好,我们称之为正指标,例如诊断符合率、病床平均周转次数等指标;


另有一类指标,数值越小越好,我们称之为逆指标,例如平均住院日、围产期婴儿死亡率等指标。


在这种情况下,如果同时评价这两类指标的综合作用,由于他们的作用方向不同,将不同性质的指标作用直接相加,并不能正确反映不同作用方向产生的综合结果,此时我们就需要对逆指标进行一致化处理,改变逆指标的性质和作用方向,使所有指标作用方向一致化,从而得出适宜的结果。


针对逆指标一致化处理的方法主要有两种:


1.倒数一致化,即对原始数据取倒数,X’= 1 / x(x>0)


2.减法一致化,即利用该指标允许范围内的一个上界值(M),依次减去每一个原始数据,X’ = M - x


注意:倒数一致化常常会改变原始数据的分散程度,这种改变会夸大或缩小原始数据的实际差异,对于进行综合评价是不利的。而减法一致化则不改变数据的分散程度,因此结果较倒数一致化而言会更加稳定。


二、无量纲化处理


数据无量纲化处理,主要解决数据之间可比性的问题,这也是我们对数据进行标准化处理的最主要的一个目的。


在实际的应用中,由于不同变量自身的量纲不同,数量级存在较大差异,在进行综合评价时,不同变量所占的作用比重也会有所不同。例如,某个变量的数值在1-10之间,而另一个变量的数值范围在100-1000之间,此时若进行综合评价,从数值的角度,很有可能数值变化范围大的变量,它的绝对作用就会较大,所占的比重较大。


因此,为了消除量纲、变量自身变异和数值大小的影响,比较不同变量之间的相对作用,就需要对数据进行无量纲化处理,将其转化为无量纲的纯数值来进行评价和比较。


常用的数据标准化方法


一、极差标准化法


极差标准化法,是消除变量量纲和变异范围影响最简单的方法。


具体的操作方法为:首先需要找出该指标的最大值(Xmax)和最小值(Xmin),并计算极差(R = Xmax - Xmin),然后用该变量的每一个观察值(X)减去最小值(Xmin),再除以极差(R),即:


X’= (X-Xmin) / (Xmax-Xmin)


经过极差标准化方法处理后,无论原始数据是正值还是负值,该变量各个观察值的数值变化范围都满足0≤X’≤1,并且正指标、逆指标均可转化为正向指标,作用方向一致。但是如果有新数据加入,就可能会导致最大值(Xmax)和最小值(Xmin)发生变化,就需要进行重新定义,并重新计算极差(R)。


二、Z-score标准化法


当我们遇到某个指标的最大值和最小值未知的情况时,或者有超出取值范围的离群数值的时候,就不再适宜计算极差了,此时我们可以采用另一种数据标准化最常用的方法,即Z-score标准化,也叫标准差标准化法。


具体的操作方法为:

1596188456216350.png



经过Z-score标准化后,数据将符合标准正态分布,即将有约一半观察值的数值小于0,另一半观察值的数值大于0,变量的均值为0,标准差为1,变化范围为-1≤X’≤1。


在SPSS中,默认的标准化方法就是Z-score标准化法。操作步骤如下:


1.Analyze → Descriptive Statistics → Descriptives


2.将需要标准化的变量Y选入Variable(s)框中,并勾选Save standardized values as variables,点击OK完成


1596188477239164.png


3. 变量列表中生成一列新变量ZY,即Zscore(Y),也就是经过Z-score标准化转化后生成的新变量。


 1596188508883411.png


三、线性比例标准化法


1.极大化法


对于正指标,取该指标的最大值Xmax,然后用该变量的每一个观察值除以最大值,即:X’=X / Xmax。(X≥0)


2.极小化法


对于逆指标,取该指标的最小值Xmin,然后用该变量的最小值除以每一个观察值,即:X’ = Xmin / X。(X>0)


注意,以上两种方法不适用于X<0的情况。对于逆向指标使用线性比例法进行标准化后,实际上是进行了非线性的变换,变换后的指标无法客观地反映原始指标的相互关系,转换时需要注意。


四、log函数标准化法


首先对该变量的每一个观察值取以10为底的log值,然后再除以该指标最大值(Xmax)的log值,即:


X’=log10X / log10 Xmax


注意,此方法要求X≥1。


五、反正切函数标准化法


通过三角函数中的反正切函数(arctan)也可以实现数据的标准化转换,计算方法如下:


X’=arctan(X)*2 / π


注意,如果原始数据为正、负实数,则标准化后的数据区间为-1≤X’≤1,若要得到0≤X’≤1区间,则原始数据应该保证X≥0。


当然,数据标准化的处理还有其他方法,最常用的还是前两种:极差标准化法和Z-score标准化法。


上一篇:家族史及运动负荷试验阴性的CPVT患者,该如何诊
下一篇:64岁COPD患者,药物治疗后仍持续呼吸困难……│

启示:本站所刊部分图文来源于网络,作者姓名及地址不详,请相关作者与本站编辑部联系,以便奉寄稿酬。
投稿、删稿及商务合作,请致电:0791-83888888、qq:2096788888、邮箱:tougao@jthysh.com。

寻医问药,问问邵大夫就知道!(只需注册,10分钟即可回答)



患友交流

13,865篇看病经验

更多>>
小孩5岁了经常不拉大便
2017-07-22 回复() | | 评论
手起倒刺指甲变形是什么原因?宝宝可能是存在缺锌、缺钙的情况,建议及时给宝宝检查一下微量元素看看。在进行微量元素的检查之后,根据情况适当的进行补充,此外出现倒刺时需要注意避免经常的使用手指牵拉,以免造成皮肤的损伤,导致出现炎症感染
2017-07-22 回复(1) | | 评论
包皮过长要怎么办呢?必须要手术吗?包皮过长易引起包皮垢存留,可能引起龟头炎,也是很多妇科疾病的诱发因素之一。包皮过长一般建议手术治疗,包皮环切术操作简单,恢复较快,是常用手术。或者用环切缝合器,手术效果也较好。如果暂时不手术可经常翻开
2017-07-22 回复(1) | | 评论
经常流鼻血是不是上火?根据您所说的情况来看,流鼻血,中医叫鼻衄病,除了因肺火、肝火、胃火上逆引起以外,另外气虚不摄,气不摄血也可能引起此病。建议作一下鼻腔镜、血常规等相关检查排除器质性疾病后经中医师把脉看舌等检查并诊断为气
2017-07-22 回复(1) | | 评论
宝宝吃奶粉大便不成形要怎么办呢?孩子出现的症状可能是患有乳糖不耐症,由于母乳中含得乳糖浓度太高,导致孩子的大便次数多,且不成形等,但孩子的食欲、睡眠、精神等一般情况都好。建议你将孩子的大便或母乳带去医院化验,以确诊。可以给孩子喝低乳
2017-07-22 回复(1) | | 评论
每天早上刷牙的时候都会恶心与呕吐,是什么原因?根据你的描述初步考虑为咽炎的可能性较大,建议注意饮食,禁食辛辣生冷食物。
2017-07-22 回复(1) | | 评论
胃寒能不能吃萝卜、吃了有什么害处吗?吃萝卜可起到一个顺气,健胃,清热解毒的我,日常可用猪排骨,年肉炖萝卜汤喝,不管是白萝卜,还是红萝卜都适合女性多吃,但因为白萝卜属寒凉之物,因此对于有胃寒的女性不要多吃、有胃寒要注意的是平时要注意保暖、
2017-07-22 回复(1) | | 评论
咳嗽时有小便憋不住要怎么办呢?咳嗽小便会夹不住这种情况属于应力性尿失禁,是由于尿道括约肌松弛,当患者咳嗽、大笑、打喷嚏等使腹压突然升高时,尿液可不自主排出,多见于中老年人尿道括约肌退行性变引起,可以进行骨盆底肌肉训练来缓解。另外可
2017-07-22 回复(1) | | 评论
乳房感觉有肿块需要做什么检查呢?你这种情况考虑为乳腺增生的可能,建议你去医院乳腺科做个乳腺B超检查,根据结果再对症治疗。最好是在月经后的3-7天去检查,这样结果更精确点。另外要保持心情愉悦,避免生气发怒。
2017-07-22 回复(1) | | 评论
远视散光弱视按摩有效果吗?远视散光弱视按摩有效果,不过还需要验光配镜的,儿童有视疲劳,不管散光度数大小,都需要散瞳验光,配戴适宜的矫正眼镜。原则上全部散光度数都要矫正。
2017-07-22 回复(1) | | 评论

我来说两句

对《拿到原始数据就直接统计分析?慢着!听说过数》进行评论已有条评论,查看评论

验证码:
看不清?点击更换
点击图片更换
匿名?
 发表评论后需要审核才可显示

权威专家观点

关注家人健康,远离烟草危害

家庭医生报

专题精选