发布日期:2025-07-03 14:38 点击次数:92
💡专注R谈话在🩺生物医学中的使用日韩成人影片
设为“星标”,精彩可以过
BMJ在2020年发表了一篇对于预计模子样本量诡计的著作(10.1136/bmj.m441,这篇著作是免费下载的,铭记把补充文献也下载下来),算是现在样本量诡计的指南性文献。
况兼作家还提供了一个R包(pmsampsize)用于诡计样本量,使用起来也相配通俗,有点肖似于pwr包诡计样本量
图片
然则要珍惜该文献的样本量诡计是针对设备临床预计模子需要的样本量,也便是窥探集的样本量,不是外部考证集的样本量。若是是考证集的样本量,作家成心又写了3篇著作,永诀针对讲究、二分类、活命数据:
Riley R D, Collins G S, Ensor J, et al. Minimum sample size calculations for external validation of a clinical prediction model with a time-to-event outcome[J]. Statistics in Medicine, 2022, 41(7): 1280–1295. DOI:10.1002/sim.9275.Riley R D, Debray T P A, Collins G S, et al. Minimum sample size for external validation of a clinical prediction model with a binary outcome[J]. Statistics in Medicine, 2021, 40(19): 4230–4251. DOI:10.1002/sim.9025.Archer L, Snell K I E, Ensor J, et al. Minimum sample size for external validation of a clinical prediction model with a continuous outcome[J]. Statistics in Medicine, 2021, 40(1): 133–146. DOI:10.1002/sim.8766.另外,该文献的样本量诡计顺次是针对3大讲究模子的:线性讲究、逻辑讲究、cox讲究。若是是一些机器学习顺次(比如立地丛林、复古向量机等)则需要更多的样本。
经典顺次Harrell老爷子在他的书《Regression Modeling Strategies》中先容的设备模子的样本量诡计顺次是:
在设备数据集(也便是窥探集)中,联贯型效果的有用样本量由沟通参与者的总和决定(有若干用若干)。对于二分类效果,有用样本量延续被以为大致等于事件(有用果的事件)和非事件(莫得用果的事件)的最小值; time-to-event数据中,样本量可以和粗略等于阳性事件的数目。
图片
在为二分类或time-to-event数据设备预计模子时,所需要的样本量常用的诡计顺次是10EPV法,即阳性事件的数目至少是预计变量个数的10倍(10 events per variable,10EPV)。
然则“variable”一词具有误导性,因为在模子中一个预计变量可能有多个β(即讲究整个),举例,具有三个类别的分类型预计变量就会有两个β(举例肿瘤品级1、2、3,那么就会有β(2和1比)、β(3和1比),因为分类变量在讲究分析中需要进行哑变量编码)。还有便是在建模经由中使用了多项式调遣和样条变换等也会使得归拢个变量有多个β,若是变量之间有交互项也会产生不异的效果。
由于预计模子的参数(也便是讲究整个β)延续多于本体的预计变量个数,是以最佳使用10EPP(10 events per candidate predictor parameter)法,即阳性事件的数目至少是“候选预计变量的参数”的10倍。“候选”一词很迤逦,因为模子过拟合的进度与预计变量参数的数目干系,而不是最终模子方程中的参数数目。
然则10EPP原则现在也有一些争议,也有大佬提出5EPP或者15、20、50EPP。这些数目的使用王人是和具体的情况干系的,也没个金圭臬,不仅取决于相对于候选预计变量参数数目的事件数目,还取决于参与者总和、沟通东谈主群中的效果比例(发生率)以及模子的预期预计性能等。
4步法Van Smeden等和Riley等东谈主最近的使命面容了如何诡计预计模子设备所需的样本量,使用条款是用户指定标的东谈主群中的总体效果风险或平均效果值、候选预计变量参数的数目以及总体模子拟合方面的预期模子性能。具体现实起来总结为4个顺次:
第一步是细则需要若干样本智商准确臆测平均风险(也便是平均概率,对应二分类或者活命数据)或者平均值(对应联贯型数据);第二步是细则需要若干样本智商让模子的预计值和信得过值之间的谬误更小;第三步是细则有宽裕的的样本量以防范过拟合;第四步是细则有宽裕的的样本量使模子的名义性能和信得过性能的谬误更小。第一步样本大小必须让预计模子的截距能被精准臆测,以确保设备的模子可以准确预计平均效果值(对应联贯型数据)或总体效果比例(对应二分类或者活命数据)。一个粗略的顺次是诡计:简略准确臆测“莫得预计变量的空模子(null model)的截距”所需要的样本量。
这里触及一个粗略的数学学问,便是线性模子的截距反馈了模子预计的平均值。
这个“准确臆测”一般要求谬误在0.05以内日韩成人影片,也便是说预计值最佳不要特出均值的95%委果区间。
下图是诡计公式和一个例子。假如一个二分类数据,它的阳性事件比例是0.5,为了遗弃谬误在0.05以内,左证以下公式诡计,需要的样本量最少是385个。
图片
第二步预计值和信得过值之间的谬误可以用好多蓄意掂量,比如平均统统百分比谬误(Mean Absolute Percentage Error MAPE),这个蓄意其实是掂量讲究模子的常用蓄意,对于二分类数据若是使用的是概率的话也能用这个蓄意掂量。
底下是诡计公式和一个例子。假如一个二分类数据,它的阳性事件比例是0.3,预计变量有10个,为了遗弃谬误(MAPE)在0.05以内,左证以下公式诡计,需要的样本量最少是461个。
图片
第三步样本量越少且预计变量数目越多,则越容易过拟合,因此需要宽裕的样本量防范过拟合。
建模经由中延续会使用减弱法(Shrinkage,或者被称为刑事包袱(penalisation)或正则化(regularisation))来裁汰过拟合的风险。Riley等东谈主提出使用一个较小的减弱值(≤10%),并诡计此时所需要的样本量。况兼还需要指定候选预计变量参数的个数以及一个模子性能蓄意,比如Cox-Snell R2(记为CS-R方,属于伪R方的一种)。CS-R方可以反应信噪比(signal:noise),从而反应模子是否过拟合。
对于联贯型数据来说,CS-R通俗是决定整个,反应模子所能阐扬的方差(或者叫变异)百分比,范围是0到1之间,越接近1越好,证明模子简略准确识别数据里面的模式,不会被噪声(谬误)干豫,若是CS-R方接近0则证明模子很有可能过拟合。
对于二分类数据和活命数据来说,CS-R方的范围是0到max(CS-R方)。对于逻辑讲究模子来说,若是阳性事件发生率为0.5,0.4,0.3,0.2,0.1,0.05,0.01,那么对应的max(CS-R方)永诀是0.75,0.74,0.71,0.63,0.48,0.33,0.11。是以即使模子的预期性能相配好,这个CS-R方的值也一般会选拔相比小的值。
以下是二分类和活命数据的样本量诡计公式和一个示例。对于一个逻辑讲究模子,若是有20个候选预计变量参数(EPP),CS-R方选拔0.1,那么为了使减弱值保合手在10%,最少的样本量是1698。
图片
Cox-Snell R2(也便是CS-R方)的选拔有多种顺次,以下是作家相比保举的几种:
径直使用别东谈主文献里报谈的值使用其他蓄意近似,比如使用C指数、AUC值、其他伪R方等左证max(CS-R方)诡计图片
本文献的附件5提供了详确的公式用于诡计max(CS-R方),感敬爱的我方稽查一下吧。
第四步应该有宽裕多的样本量保证模子的名义蓄意和信得过蓄意之间的互异宽裕小。
名义蓄意(apparent values),假如咱们用窥探集设备了一个模子,然后让这个模子对窥探集进行预计,这么得到的蓄意便是名义蓄意,这种诡计模子蓄意的顺次叫作念重代入法(resubstitution)。信得过蓄意是指模子在其他数据中(便是模子设备时没用过的数据)得到的更信得过、更接近模子信得过性能的蓄意。
本篇文献中罗致的蓄意是另外一种调整的R方,即:Nagelkerke-R方(亦然伪R方的一种),Nagelkerke-R方=CS-R方/max(CS-R方)。
底下是二分类和活命数据的样本量诡计公式。对于一个逻辑讲究模子,假定阳性事件的比例是0.05(此时对应的max(CS-R方)是0.33),指定CS-R方为0.2,那么为了使信得过的Nagelkerke-R方和名义Nagelkerke-R方的互异保合手在0.05,至少需要的样本量是1079。
图片
总结底下是一个总结,对于联贯型数据,保举使用4步法(C1-C4),对于二分类数据保举使用4步法(B1-B4),对于活命数据保举使用3步法(T1-T4)。
图片
除此以外作家成心写了一个R包用于诡计临床预计模子的样本量:pmsampsize,这个R包可以诡计以上每一个顺次(除了B2这个顺次不行,这一步是通过网页诡计的,网址是:https://mvansmeden.shinyapps.io/BeyondEPV/)所需要的样本量,并选拔最大的一个算作设备模子所需要的最少样本量。
R包使用顺次底下用3个实例演示这个R包的使用顺次。
library(pmsampsize)二分类数据
假如咱们要左证妊娠15周时测定的各式蓄意预计妊妇发生子痫前期的风险,这是一个二分类数据,效果变量是发生子痫/不发生子痫。
假定该数据中,发生子痫的比例是0.05(阳性事件的比例),候选预计变量的参数数目是30(EPP是30),max(CS-R方)是0.33。若是咱们预期模子简略阐扬15%的变异,左证第3步中先容的CS-R方的诡计顺次,可以得到CS-R方=0.15*0.33=0.05。
有了这几个数据,就可以诡计样本量了:
pmsampsize( type = "b", # 二分类数据 csrsquared = 0.05, # CS-R方 parameters = 30, # EPP的数目 prevalence = 0.05, # 阳性事件发生率 seed = 123 # 建造立地数种子) NB: Assuming 0.05 acceptable difference in apparent & adjusted R-squared NB: Assuming 0.05 margin of error in estimation of intercept NB: Events per Predictor Parameter (EPP) assumes prevalence = 0.05 Samp_size Shrinkage Parameter CS_Rsq Max_Rsq Nag_Rsq EPP Criteria 1 5249 0.900 30 0.05 0.328 0.153 8.75 Criteria 2 1770 0.753 30 0.05 0.328 0.153 2.95 Criteria 3 73 0.900 30 0.05 0.328 0.153 0.12 Final 5249 0.900 30 0.05 0.328 0.153 8.75 Minimum sample size required for new model development based on user inputs = 5249, with 263 events (assuming an outcome prevalence = 0.05) and an EPP = 8.75
对于二分类数据,使用4步法诡计样本量,其中B2这一步不成通过这个包诡计,是以这个包给出了其他3个顺次所需要的样本量,B2这个顺次算出来是需要544例,因为要同期满足4个顺次的要求,是以最终需要的样本量是5249例。
活命数据假如咱们要预计颐养罢手一段技能后,静脉血栓栓塞复发的风险。这是一个time-to-event类型的数据,结局是复发/不复发,技能便是颐养罢手后的时长。
假定该数据中,C指数是0.69,CS-R方是0.051,EPP=30,平均随访技能是2.07年,阳性事件发生比例是0.065,需要进行预计的技能点选拔2年,那么样本量诡计如下:
pmsampsize( type = "s", # 活命数据 csrsquared = 0.051, # CS-R方 parameters = 30, # EPP的数目 rate = 0.065, # 阳性事件发生率 timepoint = 2, # 指定要预计的技能点 meanfup = 2.07 # 平均随访技能) NB: Assuming 0.05 acceptable difference in apparent & adjusted R-squared NB: Assuming 0.05 margin of error in estimation of overall risk at time point = 2 NB: Events per Predictor Parameter (EPP) assumes overall event rate = 0.065 Samp_size Shrinkage Parameter CS_Rsq Max_Rsq Nag_Rsq EPP Criteria 1 5143 0.900 30 0.051 0.555 0.092 23.07 Criteria 2 1039 0.648 30 0.051 0.555 0.092 4.66 Criteria 3 * 5143 0.900 30 0.051 0.555 0.092 23.07 Final SS 5143 0.900 30 0.051 0.555 0.092 23.07 Minimum sample size required for new model development based on user inputs = 5143, corresponding to 10646 person-time** of follow-up, with 692 outcome events assuming an overall event rate = 0.065 and therefore an EPP = 23.07 * 95% CI for overall risk = (0.113, 0.13), for true value of 0.122 and sample size n = 5143 **where time is in the units mean follow-up time was specified in
活命数据的样本量诡计顺从4步法,是以效果中给出了4个顺次每一顺次所需要的样本量,最终需要的样本量是5143例。
国产肛交联贯型数据假如咱们要预计青少年的无脂肪体重,该任务很彰着是一个讲究任务,效果变量是数值型的。
假定该数据中,CS-R方为0.9,EPP=20,总体的平均无脂肪体重是26.7kg(截距的值),总体的无脂肪体重的圭臬差是8.7kg,那么诡计样本量的代码为:
pmsampsize( type = "c", # 联贯型数据 rsquared = 0.9, # 联贯型数据的CS-R方=R方 parameters = 20, # EPP的数目 intercept = 26.7, # 截距,也便是均值 sd = 8.7 # 总体的圭臬差) NB: Assuming 0.05 acceptable difference in apparent & adjusted R-squared NB: Assuming MMOE <= 1.1 in estimation of intercept & residual standard deviation SPP - Subjects per Predictor Parameter Samp_size Shrinkage Parameter Rsq SPP Criteria 1 68 0.900 20 0.9 3.40 Criteria 2 41 0.853 20 0.9 2.05 Criteria 3 254 0.970 20 0.9 12.70 Criteria 4* 254 0.970 20 0.9 12.70 Final 254 0.970 20 0.9 12.70 Minimum sample size required for new model development based on user inputs = 254 * 95% CI for intercept = (26.36, 27.04), for sample size n = 254
联贯型数据的样本量诡计也顺从4步法,最终所需要的样本量是254。
有计划咱们日韩成人影片,柔软咱们
免费QQ相通群1:613637742免费QQ相通群2:608720452公众号音问界濒临于作家得回有计划方式知乎、CSDN、简书同名账号哔哩哔哩:阿越便是我 本站仅提供存储做事,扫数内容均由用户发布,如发现存害或侵权内容,请点击举报。