先简单的明确两个基本概念:均数和标准差。举个实际例子:平均收缩压138±7 mm Hg。这里的“138”就是均数;“7”就是标准差。均数代表一组数据的平均值;标准差代表一组数据的离散程度;换句话说,标准差越大,一组数据越参差不齐。统计学上对一组数据都以“均数±标准差”表示。
均数±标准差的计算有一个极其复杂繁琐的公式。我们也并不需要去记住这个公式。现在市面上五花八门的统计学软件,都带有计算“均数±标准差”的功能。我们只需要输入一串原始数据,软件就会自动计算出均数和标准差。我们只需要记住:标准差越小,代表这组数据越整齐;标准差越大,代表这组数据越参差不齐。
当面对大量的数据,该如何开展数据统计分析?选择什么样的方法?我们需要将变量资料与分析方法关联、对应起来。流程如下:
一、 两组或多组计量资料的比较
1.两组资料:
1)大样本资料或服从正态分布的小样本资料
(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验
2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验
2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、 分类资料的统计分析
1.单样本资料与总体比较
1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;
(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。
2. 四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2
2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正 c2或用Fisher’s 确切概率法检验
3)n£40或存在理论数<1,则用Fisher’s 检验
3. 2×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验
3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
4. R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验
2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2
3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析
4)列变量和行变量均为无序多分类变量,
(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、 Poisson分布资料
1.单样本资料与总体比较:
1)观察值较小时:用确切概率法进行检验。
2)观察值较大时:用正态近似的U检验。
2.两个样本比较:用正态近似的U检验。 配对设计或随机区组设计
四、 两组或多组计量资料的比较
1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验
2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验
2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、 分类资料的统计分析
1.四格表资料
1)b+c>40,则用McNemar配对 c2检验或配对边际c2检验
2)b+c£40,则用二项分布确切概率法检验
2.C×C表资料:
1)配对比较:用McNemar配对 c2检验或配对边际c2检验
2)一致性问题(Agreement):用Kap检验
六、 两个变量之间的关联性分析
1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析
2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析
2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析
3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析
七、 回归分析
1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。
2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)非配对的情况:用非条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
2)配对的情况:用条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
八、 生存分析资料:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)
1.用Kaplan-Meier方法估计生存曲线
2.大样本时,可以寿命表方法估计
3.单因素可以用Log-rank比较两条或多条生存曲线
4.多个因素时,可以作多重的Cox回归
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
内容比较硬核,建议收藏使用~https://t.cn/A6bMCIZ2 #酸谈超话##医学生#
均数±标准差的计算有一个极其复杂繁琐的公式。我们也并不需要去记住这个公式。现在市面上五花八门的统计学软件,都带有计算“均数±标准差”的功能。我们只需要输入一串原始数据,软件就会自动计算出均数和标准差。我们只需要记住:标准差越小,代表这组数据越整齐;标准差越大,代表这组数据越参差不齐。
当面对大量的数据,该如何开展数据统计分析?选择什么样的方法?我们需要将变量资料与分析方法关联、对应起来。流程如下:
一、 两组或多组计量资料的比较
1.两组资料:
1)大样本资料或服从正态分布的小样本资料
(1)若方差齐性,则作成组t检验
(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验
2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验
2.多组资料:
1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、 分类资料的统计分析
1.单样本资料与总体比较
1)二分类资料:
(1)小样本时:用二项分布进行确切概率法检验;
(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。
2. 四格表资料
1)n>40并且所以理论数大于5,则用Pearson c2
2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正 c2或用Fisher’s 确切概率法检验
3)n£40或存在理论数<1,则用Fisher’s 检验
3. 2×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验
2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验
3)行变量和列变量均为无序分类变量
(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
4. R×C表资料的统计分析
1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验
2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2
3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析
4)列变量和行变量均为无序多分类变量,
(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson c2
(2)n£40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验
三、 Poisson分布资料
1.单样本资料与总体比较:
1)观察值较小时:用确切概率法进行检验。
2)观察值较大时:用正态近似的U检验。
2.两个样本比较:用正态近似的U检验。 配对设计或随机区组设计
四、 两组或多组计量资料的比较
1.两组资料:
1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验
2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验
2.多组资料:
1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。
五、 分类资料的统计分析
1.四格表资料
1)b+c>40,则用McNemar配对 c2检验或配对边际c2检验
2)b+c£40,则用二项分布确切概率法检验
2.C×C表资料:
1)配对比较:用McNemar配对 c2检验或配对边际c2检验
2)一致性问题(Agreement):用Kap检验
六、 两个变量之间的关联性分析
1.两个变量均为连续型变量
1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析
2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析
2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析
3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析
七、 回归分析
1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。
2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)非配对的情况:用非条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
2)配对的情况:用条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
八、 生存分析资料:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)
1.用Kaplan-Meier方法估计生存曲线
2.大样本时,可以寿命表方法估计
3.单因素可以用Log-rank比较两条或多条生存曲线
4.多个因素时,可以作多重的Cox回归
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
内容比较硬核,建议收藏使用~https://t.cn/A6bMCIZ2 #酸谈超话##医学生#
川普染疫住院,传呼吸困难,非常疲劳!
川普总统夫妇确诊新冠肺炎后,均出现轻微症状;
在白宫先接受实验性鸡尾酒抗体疗法后,川普在2日傍晚现身,登机前往马里兰州华特里德军医院,虽然川普说这是安全起见,但随即传出川普出现呼吸困难、非常疲劳;
白宫一天内多次出面说明川普病情,格外引人关注。
这将是川普任内首度因病住院。
华邮引述官员说法,指川普周五身体状况恶化,出现低烧、咳嗽和鼻塞。
民主党总统候选人白登一天内两度接受病毒检测,均为阴性;副总统潘斯与民主党副总统候选人贺锦丽检测结果也是阴性。
川普2日凌晨宣布自己确诊新冠肺炎,一整天没露面,连推文都不发了,直到傍晚在推特贴出一段18秒的视频,视频中的他没有戴口罩,发表简短谈话,感谢各界强烈支持,我将前往华特里德军医院(Walter Reed National Military Medical Center)我感觉状况很好,但(去医院)确保事情(指治疗)一切顺利,第一夫人状况很好,非常感谢大家,我衷心致谢且难忘。
白宫幕僚长梅杜斯(Mark Meadows)2日上午在白宫外未戴口罩对媒体表示川普有轻微症状,但充满活力,精神状况良好,且积极投入工作。
但川普原定参加白宫的电话会议,谈协助脆弱的高龄者抵御新冠肺炎,福斯新闻记者罗伯兹(John Roberts)推文指,会议在下午12时15分举行,主持会议的是副总统潘斯(Mike Pence)。
白宫医师康利(Sean Conley)下午发布备忘录表示川普出现发烧、咳嗽、鼻塞等症状,正在接受实验性鸡尾酒抗体疗法,接受抗体治疗,轻微不适(fatigued)但精神状况良好;
另外,川普还服用锌、维生素D、抑制胃酸分泌的法莫替丁、褪黑激素和阿斯匹灵。
康利说,第一夫人梅兰妮亚(Melania Trump)仅轻微咳嗽和头痛,其余第一家庭成员病毒检测结果均为阴性。
白宫发言人麦肯内尼(Kayleigh McEnany)表示川普精神奕奕,症状轻微,且一整天都在工作;
基于谨慎,且医师团队建议,川普将在华特里德军医院医院待上几天,会在院内办公。
感谢来自各界的关心。
川普戴着自己随身携带的特制深色口罩,穿着西装,没有陪护或搀扶,越过白宫南草坪登上直升机,大批戴着口罩的工作人员也随同川普登机,包括梅杜斯;
川普并未停下脚步,只对在白宫守候的媒体竖起大拇指,简单打招呼。
川普约29分抵达马里兰州,改搭专车前往医院就医。
白登发推文表示这不是一个分政党的时刻,而是一个「与全美相关的时刻」呼吁民众必须要以一个国家的姿态来团结面对。
前总统欧巴马在推特表示希望总统和第一夫人,以及全美那些受新冠病毒感染者,都能得到必要的治照顾,且尽速康复。
我们都是美国人、我们都是人类;
我们希望每个人都健康,无论党派。欧巴马说。
川普确诊新冠肺炎后,白宫记者协会发布声明表示,有3名白宫记者确诊染疫,另有数名记者仍在等待检验结果并进行自我隔离;
这3名确诊记者上周均在白宫采访,白宫现在正在追查感染源。
共和党籍参议员提里斯(Thom Tillis)和李麦克(Mike Lee)双双确诊,都是参与周六在白宫的大法官提名会。
川普总统夫妇确诊新冠肺炎后,均出现轻微症状;
在白宫先接受实验性鸡尾酒抗体疗法后,川普在2日傍晚现身,登机前往马里兰州华特里德军医院,虽然川普说这是安全起见,但随即传出川普出现呼吸困难、非常疲劳;
白宫一天内多次出面说明川普病情,格外引人关注。
这将是川普任内首度因病住院。
华邮引述官员说法,指川普周五身体状况恶化,出现低烧、咳嗽和鼻塞。
民主党总统候选人白登一天内两度接受病毒检测,均为阴性;副总统潘斯与民主党副总统候选人贺锦丽检测结果也是阴性。
川普2日凌晨宣布自己确诊新冠肺炎,一整天没露面,连推文都不发了,直到傍晚在推特贴出一段18秒的视频,视频中的他没有戴口罩,发表简短谈话,感谢各界强烈支持,我将前往华特里德军医院(Walter Reed National Military Medical Center)我感觉状况很好,但(去医院)确保事情(指治疗)一切顺利,第一夫人状况很好,非常感谢大家,我衷心致谢且难忘。
白宫幕僚长梅杜斯(Mark Meadows)2日上午在白宫外未戴口罩对媒体表示川普有轻微症状,但充满活力,精神状况良好,且积极投入工作。
但川普原定参加白宫的电话会议,谈协助脆弱的高龄者抵御新冠肺炎,福斯新闻记者罗伯兹(John Roberts)推文指,会议在下午12时15分举行,主持会议的是副总统潘斯(Mike Pence)。
白宫医师康利(Sean Conley)下午发布备忘录表示川普出现发烧、咳嗽、鼻塞等症状,正在接受实验性鸡尾酒抗体疗法,接受抗体治疗,轻微不适(fatigued)但精神状况良好;
另外,川普还服用锌、维生素D、抑制胃酸分泌的法莫替丁、褪黑激素和阿斯匹灵。
康利说,第一夫人梅兰妮亚(Melania Trump)仅轻微咳嗽和头痛,其余第一家庭成员病毒检测结果均为阴性。
白宫发言人麦肯内尼(Kayleigh McEnany)表示川普精神奕奕,症状轻微,且一整天都在工作;
基于谨慎,且医师团队建议,川普将在华特里德军医院医院待上几天,会在院内办公。
感谢来自各界的关心。
川普戴着自己随身携带的特制深色口罩,穿着西装,没有陪护或搀扶,越过白宫南草坪登上直升机,大批戴着口罩的工作人员也随同川普登机,包括梅杜斯;
川普并未停下脚步,只对在白宫守候的媒体竖起大拇指,简单打招呼。
川普约29分抵达马里兰州,改搭专车前往医院就医。
白登发推文表示这不是一个分政党的时刻,而是一个「与全美相关的时刻」呼吁民众必须要以一个国家的姿态来团结面对。
前总统欧巴马在推特表示希望总统和第一夫人,以及全美那些受新冠病毒感染者,都能得到必要的治照顾,且尽速康复。
我们都是美国人、我们都是人类;
我们希望每个人都健康,无论党派。欧巴马说。
川普确诊新冠肺炎后,白宫记者协会发布声明表示,有3名白宫记者确诊染疫,另有数名记者仍在等待检验结果并进行自我隔离;
这3名确诊记者上周均在白宫采访,白宫现在正在追查感染源。
共和党籍参议员提里斯(Thom Tillis)和李麦克(Mike Lee)双双确诊,都是参与周六在白宫的大法官提名会。
有点虎头蛇尾,前面两首歌给我太多期待,王天琦离开太可惜了,春春太追求实验性音乐要我就淘汰那个小众原唱,但是天琦今天应该把苏州歌谣先唱后唱大家没了新鲜感,除非有周深那样的唱功不然确实挺吃亏,但春风吹过万物复苏和爆竹声中一岁除挺有感觉,今天潘虹表现不错气质和唱功都可以只是有一些许重复的时候意气用事也谈不上失误就是说不上好也挑不出坏,一周又有五首歌可以开心一阵,但讲真我学歌这么快一天几十首都可以,满足不了我啊,歌坛好作品太少了@中国好声音 https://t.cn/R2WxYv5
✋热门推荐