ROC曲线是由二战中的电子工程师和雷达工程师发明的,用来侦测战场上的敌军载具(飞机、船舰),也就是信号检测理论,二战后被引入统计领域,尤其广泛应用于医学统计中,用来做疾病诊断方法的比较。

ROC曲线(Receiver operating characteristic curve),即受试者工作特征曲线,主要用来评价某个指标对两类测试者(如患者和正常人)分类或诊断的效果,并寻找最佳的指标临界值,进而确定此种评价指标的cutoff值。

在理解ROC曲线图之前,我们先来了解几个基本的概念:
1)真阳性率(TPR, Truepositive rate):所有实际为阳性的样本被正确地判断为阳性的个数与所有实际为阳性的样本个数之比(也就是真的是真的),TPR又称为Sensitivity(灵敏度);
2)假阳性概率(FPR, Falsepositive rate):所有实际为阴性的样本被错误地判断为阳性的个数与所有实际为阴性的样本个数之比(即假的误认为是真的,被误报了),FPR等于1-Specificity(特异度)。
3)约登指数(Youden Index):也称正确指数,是在假定假阴性(漏诊率)和假阳性(误诊率)的危害性有同等意义时常用的方法,其反映了真正的患者与非患者的总能力。约登指数=灵敏度+特异度-1(也就是ROC曲线的Y轴减去X轴),约登指数越大说明真实性越大。约登指数最大值也就对应着该方法的最佳诊断临界值,即cutoff值。

ROC曲线其实就是以FPR为横坐标,TPR为纵坐标绘制出来的曲线。

ROC曲线图是反映敏感性与特异性之间关系的曲线。横坐标X轴为 1 – 特异性,也称为假阳性率(误报率),X轴越接近零准确率越高;纵坐标Y轴称为敏感度,也称为真阳性率(敏感度),Y轴越大代表准确率越好。

根据曲线位置,把整个图划分成了两部分,曲线下方部分的面积被称为AUC(Area Under Curve),用来表示预测准确性,AUC值越高,也就是曲线下方面积越大,说明预测准确率越高。曲线越接近左上角(X越小,Y越大),预测准确率越高。
#生物信息学##生信分析##生物信息学[超话]#
原文节选自:医学僧的科研日记(ID:zzudoctor)

解读文献里的那些图——误差棒

文章中的柱状图、折线图中我们经常会看到一条条的横线竖线,这其实就是误差棒(error bar)。(图1)

简单来说,误差棒就是一组数据误差的可视化表达方法,可以一眼看出这组数据的离散程,所以在处理实验数据时我们经常需要添加误差棒来展示实验的误差范围。

提到误差我们就要了解误差有哪些表示方法,即怎样表达误差的大小。

标准差(Standard Deviation ,SD)和标准误(Standard Error ,SE)这两个通常是用来描述抽样误差大小的指标。
SD实际上反映的是数据点的波动情况,而SE则是均值的波动情况。(图2)

还有一个间接表达误差的指标是置信区间(Confidence Interval,CI),我们最常用的95%CI=(均值-1.96SE,均值+1.96SE)

那么,误差棒对应的到底是标准差(SD)、标准误(SE)还是置信区间(CI)呢?其实……都可以,作者都会在论文中明确写明用的是哪一种。

很多的文献图表中,误差棒的长短通常等同于1.96个SE,这样做可以传递的信息更多,有两方面的好处。首先这个方法能显示95%的CI。其次能让我们用眼睛检验差别的显著性,如果下面bar的顶部和上面bar的底部没有重叠,两个实验组的差异必定是显著的(5%的显著水平)。因此我们会说,这2个组间存在显著差别。如果我们做t-test,结果会验证这个发现。这种方法对超过2个组的情况就不那么精确了。因为需要多次比较(比如,组1和组2,组2和组3,组1和组3),但是至少能提示粗略的差别。

读图过程中,如果误差棒明显过长,甚至超过柱状图的长度,那么这个实验数据就存在明显的变异性,可重复性较差(如图3:WE JUST CAN’T TRUST YOU)。反之,误差棒长短都比较均一,则误差较小,实验数据较为稳定,离散性小,可信度高。#生信分析##生物信息学##生信分析[超话]#

原文参考自:医学僧的科研日记(ID:zzudoctor)

解读文献里的那些图——误差棒

文章中的柱状图、折线图中我们经常会看到一条条的横线竖线,这其实就是误差棒(error bar)。(图1)

简单来说,误差棒就是一组数据误差的可视化表达方法,可以一眼看出这组数据的离散程,所以在处理实验数据时我们经常需要添加误差棒来展示实验的误差范围。

提到误差我们就要了解误差有哪些表示方法,即怎样表达误差的大小。

标准差(Standard Deviation ,SD)和标准误(Standard Error ,SE)这两个通常是用来描述抽样误差大小的指标。
SD实际上反映的是数据点的波动情况,而SE则是均值的波动情况。(图2)

还有一个间接表达误差的指标是置信区间(Confidence Interval,CI),我们最常用的95%CI=(均值-1.96SE,均值+1.96SE)

那么,误差棒对应的到底是标准差(SD)、标准误(SE)还是置信区间(CI)呢?其实……都可以,作者都会在论文中明确写明用的是哪一种。

很多的文献图表中,误差棒的长短通常等同于1.96个SE,这样做可以传递的信息更多,有两方面的好处。首先这个方法能显示95%的CI。其次能让我们用眼睛检验差别的显著性,如果下面bar的顶部和上面bar的底部没有重叠,两个实验组的差异必定是显著的(5%的显著水平)。因此我们会说,这2个组间存在显著差别。如果我们做t-test,结果会验证这个发现。这种方法对超过2个组的情况就不那么精确了。因为需要多次比较(比如,组1和组2,组2和组3,组1和组3),但是至少能提示粗略的差别。

读图过程中,如果误差棒明显过长,甚至超过柱状图的长度,那么这个实验数据就存在明显的变异性,可重复性较差(如图3:WE JUST CAN’T TRUST YOU)。反之,误差棒长短都比较均一,则误差较小,实验数据较为稳定,离散性小,可信度高。#生信分析##生物信息学##生物信息学[超话]#

原文参考自:医学僧的科研日记(ID:zzudoctor)


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • “当然是努力赶完工作回来陪你啦~”她慵懒的挂在他身上,拉长了语调,漫不经心的回答。冷韵月光下的我竟然迷失,不知道,今夜的冷意与心事,哪一个更凉一点?
  • 최근 한국에는 중국 문화를 많이 도둑질하고 있다. 최근 화가가 중국 명나라 바람을 띤 그림을 그려 한국 네티즌들에 의해 경찰에 출경됐다.그리고
  • ②互动榜只计算30天之内的转发、评论和点赞,所以古早的微博就不用挖了。②互动榜只计算30天之内的转发、评论和点赞,所以古早的微博就不用挖了。
  • 第二题:漫画题(如图)第三题:单位有一个活动,你去找相关部门寻求帮忙,明明是举手之劳,对方却不能帮忙,推脱说没时间没人力。第二题:漫画题(如图)第三题:单位有一
  • 我们不可能去追寻那些被时间规定了不可能的东西,我们对世界的理解不是浪漫的崇高,而是现实的庸人气息。我们在不知不觉中失去了精神的根基,没有了天下千秋的承担情怀,没
  • 最近日常工作挺多的,拍视频的频率比以前低了不少,不过我趁着这个机会搞起了“研发”哈哈哈,把网上流行的懒人吃法试了试因为很爱吃零食,所以家里常备沃隆坚果~坚果+
  • 回力旗舰店官方2022夏季新款女鞋休闲鞋低帮板鞋情侣帆布鞋小白鞋【包邮】【现价】 99 元【券后价】 42 元【优惠券】 57 元 【55凑单后32.1】回力弥
  • (摘自邓晓芒《中国当代启蒙的任务和对象》)放弃所谓的空间形式与严谨的设计范式,而是以一种“随感而应,无物不照”的自觉性,一点点滋养着空间的形成。因为我们没有把自
  • 店内有人在打扫卫生,有人在上货,有人查验进店顾客的双码,还有人在准备食材,制作美食……生活回归正轨 还是熟悉的味道8时许,在城北区盐庄西路开超市的刘统英,早早来
  • 【ODG电子竞技俱乐部人员变动公告】在充分尊重选手个人意愿的前提下,经过双方友好的协商与沟通,即日起,原ODG选手李朝晖(ID:ODG.Muqiu)正式退役。暮
  • 而在《小飞侠》中,反派却以红色这种鲜艳的颜色来呈现,表现手法相当独特,从而达到意想不到的效果~#约会博物馆##文博热展##早安成博#【重磅上新】#米奇[超话]#
  • 有所不同的是,坦克500运动版和坦克500商务版在第二排豪华感营造方面具有一定差异。后包围还采用了更为壮观的银色后护板设计,并采用隐藏式排气布局,以增强整体感觉
  • 央视著名女主持人李梓萌因为播报蓝天野去世时,嘴角上扬的事情上了热搜其实这是喜丧,在我老家,年龄大了下世,儿孙们没有太多的悲哀,跟人说话面带笑容。说句公道话:这不
  • 长这么好看的一定是神仙吧,不过时樱怎么那么像盏盏… 刚才还笑着的时樱露出不耐烦的表情,他在水袖下伸出一只白皙的小手,拉着陈烁的脸往右边扯,嗔道:我是神仙,但别
  • 感情这件事,以前我认为只要两个人都足够忠诚,便可以天长地久,现在我才知道,每天为了琐事争吵,性格不合,不能好好沟通,才是对大的问题,我能付出的,我已经尽力了,既
  • 更进一步,当一个混合编队出现在达尔文港附近时,国际铁矿石的价格就该应声而落;当出现在波斯湾附近时,国际油价就会大幅上扬;当出现在横须贺附近时,中日韩自贸区协议就
  • 可真的缩短时间横向对比起来,狼崽走过的每个年纪,都觉得自己好像比他哥那时候差一步,他总会在比,总会着急长大,偏偏他哥想的是小孩儿不吃苦多吃糖,总想着“耀文儿啊,
  •   小小一粒米 可做大文章  开荒种地,挖沟引渠,他们沿着先辈走过的路,让小站稻重现在马厂减河河畔,重现在小站稻的故乡。  复种小站稻,村里的一些老人高兴了,他
  • #我親愛的媽媽和外婆#*願上天保佑我親愛的媽媽和外婆,我朋友阿姮的媽媽天天都健康平安!感恩!
  • 一瞬间想起平芜尽处是春山哈哈哈哈哈,屈原为《离骚》有江山之助,是楚地盛行的巫文化以及地域环境赋予了离骚更多浪漫主义色彩,景观也有自然之助吧,在四季轮转中变化多端