彩票类网站是如何做代理的/seo监控
疾病亚型如何定义?是常见的临床研究问题。可以用潜类别分析(Latent profile analysis,LCA)的方法。
呼吸科的系列文章12014年,对两项随机对照试验的数据二次分析,发现并定义了急性呼吸窘迫综合征(ARDS)的亚型。用到的统计分析方法是潜类别分析。发表在Lancet Respir Med,影响因子22.9分[1]。
22018年,ARDS亚型随时间的稳定性,两项RCT数据二次分析,潜类别分析,Thorax,9.6分[2]。32018年,ARDS亚型潜伏性分析,脓毒症急性损伤他汀类药物研究(SAILS)的二次分析,潜类别分析,Intensive care medicine,18.9分[3]。42018年,ARDS亚型和辛伐他汀治疗反应,RCT数据二次分析,潜类别分析,Lancet Respir Med,22.9分[4]。
以上文章均出自同一个团队,同样的统计方法,同样的临床目的:给急性呼吸窘迫综合征(ARDS)分出亚型。
临床意义在于不同亚型的患者,接受治疗后疗效不同,有利于根据亚型指导临床治疗方案的选择。很有临床意义。在其他的疾病领域也可以开展。研究设计和统计方法是通用的。
背景:亚型已经在异质性疾病(例如哮喘和乳腺癌)中得到确认,具有重要的治疗意义。我们评估了急性呼吸窘迫综合征(ARDS)中是否存在亚型。
方法:基于ARDS患者的两个RCT数据。运用潜类别分析方法处理数据。研究亚型和临床预后的关系。
结果:分析了1022例患者。潜类别模型得出两个亚型。我们确定了一种高炎症性亚型(表型2),其特征是血浆中的炎症因子浓度较高,使用升压药的患病较多,血清碳酸氢盐浓度较低以及败血症的患病率高于表型1。表型2的患者死亡率较高,无呼吸机天数较少,无器官衰竭天数少于表型1(p均 <0.007)。在ALVEOLI队列中,通气策略(高PEEP vs低PEEP)对死亡率、无呼吸机天数和无器官衰竭天数的影响因表型而异(死亡率p = 0.049,呼吸机p = 0.018,无器官衰竭天数,p = 0.003)。
结论:我们在ARDS内确定了两种亚型,其中一种根据严重的炎症,休克和代谢性酸中毒以及较差的临床结果进行分类。PEEP治疗策略随机试验中对治疗的反应因亚表型而异。识别ARDS亚型可能对选择患者进行未来的临床试验是有用的。
核心图表上图定义了两种亚型的特征(横坐标是不同指标分布情况),可见亚型1(红线)的炎症因子水平高(左侧)
上图展示两种亚型的危险因素特征(横坐标是不同危险因素的分布情况),可见脓毒症(sepsis)的概率亚型2的高(红色)。
基本概念潜类别分析(Latent class analysis,LCA)是假定观察对象来自不同的亚组(类),类别之间是互斥的,即每个人都属于一个且仅属于一个潜在类别。每个人来自哪一类本身是不知道的(unobserved),根据观察到的变量(observed)来确定每个人属于哪一类。如果观察到的变量都是分类型的,称为潜类别分析(Latent class analysis),当观察变量有连续型指标时,我们通常将其称为潜特征分析(Latent profile analysis)。
潜类别分析(Latent class analysis) 与聚类分析(Cluster analysis)类似,但使用的分类方法不同。LCA 被称为是一种自上而下(top-down approach)的方法,使用每个人观察到的数据分布的概率模型推导其所在的未观察到的类别,而不是使用某些选定的距离度量来查找聚类。
软件操作练习数据下载链接:
https://pan.baidu.com/s/1v_RFy1Rtg9NGUmrKIdSlyg
提取码: ce3f
方法1:易侕软件2.0版:数据分析-潜类别分析-潜类别分析。观察变量放G1、G2、X1、X2、X3、X4,可以用默认的或者自己手动设定潜类别数。查看结果:
自动得出分型(Class1,2……)是描述性统计结果。
得出分型的变量特征,并以图和表的形式展示。输出结果跟前面SCI论文实例中的图表是一致的,具体结果和统计方法撰写可以参考上面的文献。简述为:
图:不同分型其他指标的分布情况
方法2:易侕软件3.0版:点击数据分析-潜类别分析-潜类别分类。观察变量放G1、G2、X1、X2、X3、X4,可以用默认的或者在潜类别数处输入数字,人为设定分型个数。
结果解读同方法1,略。
适用范围观察变量可以是分类型的也可以是连续性的。
易侕3.0版潜类别分类用到 R depMixS4 程序包,该程序包需要 R3.6版才能运行。该程序包可以直接处理连续性变量与分类变量。
易侕2.0版也可以做潜类别分析,但因为使用的是 R3.4 版本,不能运行 R depMixS4 程序包,只使用 R poLCA, 该程序包只能处理分类型变量,因此如果观察变量是连续性变量,易侕2.0 自动将其5等分转换成分类型变量,再进行潜类别分析。
不是所有数据的所有指标都能运行出结果,需要找是哪个指标导致的无法计算。建议上面练习数据能顺利运行之后,再分析自己的数据。
下面用一个例子帮助大家理解潜类别分析:假定我们测量了100个学生的身高,其中50个是1年级学生,50个是10年级学生,每个人应该有一个身高变量一个年级变量。这个年级变量是可观察的,现在假设这个年级变量没有记录,我们手上只有100个学生的身高数据,我们能不能仅根据身高值把这100个学生属于哪个年级找出来呢?能。这种根据观察到的身高推导未知的(潜在的)年级就是潜类别分析。
以此类推,很多疾病有不同的亚型,不同亚型对药物与治疗的应答不同,我们能否根据病人的临床特征推导出病人属于哪个亚型从而更有针对性地实施治疗呢?这就是潜类别分析的临床应用价值。
E-M 方法简介:LCA方法是如何根据100个身高值推导年级呢?简单地说就是采用了一种 expectation–maximization (EM) 算法。首先随机地将100个人分为两组:组1与组2,分别计算两组的均数与标准差(Mean1, SD1与Mean2, SD2),再根据正态分布计算每个人属于组1的概率、 属于组2的概率(即 Expectation 步),取最大的概率将研究对象重新分组(即 maximization 步),重新计算两组的均数与标准差及每个人属于组1的概率、 属于组2的概率,即重复 expectation 步,再根据概率重新分组即重复maximization 步。重复上述操作直到前后两次结果达到一致 (converge)。
潜在类别数 (number of classes):如何知道所有观察对象是来自几类呢?试想一个极端情况是把所有对象都归为一类 (N),另一个极端情况是每个研究对象归为一类,有多少研究对象(或多少互斥的观察结果)就有多少类,这显然都是不合理的。潜在类别数可根据经验预先指定的,也可以让模型自动寻找出一个最佳类别数。通常根据模型的BIC值确定,取BIC最小的模型为最佳模型。
预先概率 (prior):上面介绍E-M方法时,第一步是将所有研究对象随机地分组,也可以根据预先的概率,将研究对象分为两组。预先概率也可以是给定的具体概率值,但通常是由一个预测模型计算出来(即根据预测潜在类别的变量组建一个预测方程)。
如果观察变量里含连续性变量,本模块默认使用R depMixS4 程序包,此时如果样本量比较大时有可能运行不出来,这时勾选 “将连续性观察变量等分组”,模块自动将每个连续性变量五等分转换成分类变量,然后使用R poLCA程序包运行。如果观察变量全是分类型变量,本模块自动使用R poLCA程序包运行。参考文献:Ingmar Visser, Maarten Speekenbrink (2010). depmixS4: An R Package for Hidden Markov Models. Journal of Statistical Software, 36(7), 1-21. URL http://www.jstatsoft.org/v36/i07/.
参考文献
[1] Calfee C S, Delucchi K, Parsons P E, et al. Subphenotypes in acute respiratory distress syndrome: latent class analysis of data from two randomised controlled trials[J]. Lancet Respir Med, 2014.
[2] Delucchi K, Famous K R, Ware L B, et al. Stability of ARDS subphenotypes over time in two randomised controlled trials[J]. Thorax, 2018.
[3] Sinha P, Delucchi K L, Thompson B T, et al. Latent class analysis of ARDS subphenotypes: a secondary analysis of the statins for acutely injured lungs from sepsis (SAILS) study[J]. Intensive care medicine, 2018.
[4] Calfee C S, Delucchi K L, Sinha P, et al. Acute respiratory distress syndrome subphenotypes and differential response to simvastatin: secondary analysis of a randomised controlled trial[J]. The Lancet Respiratory Medicine, 2018.
▼往期精彩回顾▼2019年发表论文小结(资源:附文献库)科研学习的精神动态变化的类型如何定义?潜类别分析(LCA)对随时间变化的指标归类