67%的癌症药物基于替代终点获批,这意味着什么?
转自:药明康德
在肿瘤学研究领域,无进展生存期(PFS)和无病生存期(DFS)这类复合结局指标被越来越多地用作临床试验替代终点,它们常常作为FDA和欧洲药品管理局(EMA)审批所依据的关键性试验的主要研究终点。尽管应用这些复合终点能够提升临床试验的统计效能,缩短为证明治疗效果所需的随访周期,但其也伴随着若干局限性。
近日,《自然》杂志子刊Nature Reviews Clinical Oncology发表了一篇观点文章,深入分析了在肿瘤学研究中采用复合终点的潜在优势与存在的挑战,并特别强调对这些终点中所包含的各个组件事件(component event)进行更为明确和透明报告的重要性。在今天的文章里,药明康德内容团队将为读者解读其中的精彩内容。
复合结局分析的局限性
在肿瘤学研究中,复合结局分析是一种将多个不同事件(如肿瘤生长、新的病变出现和/或患者死亡)融合为单一度量的方法。这种度量通常用作临床试验的替代终点,并常作为关键性试验的主要终点。然而,复合终点的应用仍存在争议,主要是由于其定义的不一致性和临床重要性的差异。
在生物医学领域,复合终点,如主要心血管不良事件(MACE)、PFS、DFS等,被广泛采用。随着抗癌药物数量的增加,使用复合终点的频率也在上升。根据研究显示,在2008年至2012年间,美国FDA授予的肿瘤药物监管批准中,有67%是基于替代终点做出的,其中47%是基于PFS或DFS。这表明复合终点在肿瘤学临床试验中扮演着越来越重要的角色,尽管其使用仍需谨慎和严格评估。
其中,PFS是肿瘤学中最常用的复合终点,其定义为从随机分组到疾病进展或死亡的时间间隔。PFS至少包括五个不同的事件,提供了一个多维度的评估视角。除PFS外,肿瘤学临床试验中还常用无事件生存期(EFS)、DFS和无复发生存期(RFS)作为复合终点。EFS通常用于评估新辅助治疗的效果,而DFS则更多应用于那些接受了明确的、治愈性的局部治疗后的辅助治疗情境。这些复合终点的使用,为临床试验提供了更为全面和细致的效果评估方法,使研究者能够更准确地理解治疗对疾病进展的影响。
图片来源:123RF
然而,复合终点存在许多局限性,从而限制了其应用,主要包括以下几点:
肿瘤学中使用的复合终点定义往往含糊不清,不同研究之间或同一研究的不同部分存在定义上的差异。
缺乏统一的标准化指导方针,监管机构也并未强制要求遵守特定的复合终点定义。
综合终点的定义复杂,而且常常存在混用现象。
尽管RECIST 1.1指南针对PFS提供了一个共识性的定义,但这一定义不适用于所有癌症类型。
复合终点的定义和应用需要更准确、一致且具有实际意义,以确保临床试验结果的可靠性。
研究者和临床医生需要了解复合终点背后的复杂性,并采取审慎的方法来解释和应用这些数据。
虽然复合终点在肿瘤学研究中扮演着重要角色,但为了确保其有效性和可靠性,需要对其定义和使用进行更细致和一致的处理。
首先,复合终点在肿瘤学研究中的定义异质性,以及改变包含的组件事件,可能导致截然不同的结论,从而使试验结果的解读变得极为复杂。以前列腺癌为例,其放射学进展和生化疾病进展是两种不同的事件,各自具有独特的临床和预后意义。因此,一个包含多种进展类型的复合终点与只包含单一进展类型的终点相比,其临床价值可能完全不同。此外,使用不同的PFS测量方法进行的试验比较可能导致对治疗效果的错误推断,进而影响治疗决策的质量。
图片来源:123RF
其次,在肿瘤学研究中,EFS和DFS的复合终点定义存在显著差异,缺乏普遍的共识。以白血病研究为例,EFS的定义至少有12种不同的版本,涵盖了广泛的事件。例如,在一些试验中,由于毒性导致的治疗中断也被视为EFS事件。仅依赖于单臂试验中EFS结果来评估治疗效果可能会导致误导性的结论。
在心脏病学和临床肿瘤学试验中,对复合时间事件的报告标准也存在差异。在心脏病学试验中,常见的做法是报告单个组成事件的频率,而在使用PFS作为复合终点的肿瘤学试验中,这一做法则不太普遍。研究人员对50项使用PFS的研究进行分析后发现,只有少数研究提供了关于死亡和疾病进展事件的详细信息。这种差异可能源于复合指标的本质、监管机构的要求、以及偶然性因素等。因此,研究人员主张在肿瘤学试验中使用复合终点时,应透明地报告各组成事件,并将此作为一个标准。这将提高临床试验结果的透明度和可靠性,有助于更准确地解释和应用这些结果。
此外,按照RECIST标准确定的进展性疾病类型对预后的影响也不容忽视。在解释PFS结果时,区分不同类型的进展事件及其临床意义的不同至关重要。这种区分有助于理解为何复合终点通常不是总生存期(OS)的理想替代指标。最后,许多患者对仅延迟放射性疾病进展而没有提供总生存或健康相关生活质量(HRQOL)改善的治疗持保留态度,尤其是当这些治疗伴随额外的毒性时。
图片来源:123RF
这些因素导致临床试验结果变得复杂,而且可能改变研究结论,并减少在组件事件层面进行深入分析的能力。不仅如此,复合终点的使用可能导致研究者限制样本量,因为样本量的确定往往基于类似试验中复合终点的比率,而非单个组件事件的频率。这种做法可能降低研究的内部和外部有效性,并减少对组件事件层面进行详细分析的可能性。因此,临床研究设计时应考虑这些限制,以确保研究结果的准确性和相关性。
复合终点的组件事件会可能受到不同疗法的影响
在临床研究中,将不同临床事件纳入单一的复合结局中可能会误导研究人员认为治疗效果对每个组成事件都适用,但这并不一定是正确的。为避免这一问题,EMA在评估抗癌疗法的指南中建议,“使用描述性摘要表格单独分析各类事件,并在适当的情况下,采用竞争风险方法来探索治疗对不同类型事件的影响。”然而,在实践中,许多研究无法检测出复合结局中各个组成部分的显著差异。
在肿瘤研究领域,由于肿瘤生长、转移和死亡率之间的复杂关系,不能仅从治疗对复合终点的影响来推断其对单个组成事件的影响。例如,减小肿瘤大小的治疗并不一定减少新病变的发生。在某些癌症中,转移性病变可以与原发肿瘤并行发展,而非单纯地由原发肿瘤进展而来。这意味着针对原发肿瘤的治疗可能不会影响并行发展的转移性病变。
此外,治疗效果的异质性也可能受肿瘤基础生物学和治疗机制的影响。例如,在前列腺癌中,患者的血清前列腺特异性抗原(PSA)水平容易发生波动,这在一定程度上造成了PSA水平的变化不如客观放射学缓解那样有效地指示治疗效果。同时,有些临床试验显示,即使没有改善PFS,某些治疗也能证明对OS有益,这也反映了某些治疗机制的复杂性。
治疗效果在不同临床事件之间的差异性增大了准确解释PFS结果的挑战。比如,当PFS的定义中包含了症状性进展时,解读治疗效果变得更加复杂,患者报告的结局变化(如疼痛评分)可能更多地反映了基于医院的护理而不是疗法的直接效果。理想情况下,复合结局的每个组成部分都应代表相同的因果生物途径。治疗效果在不同临床事件间的差异越大,准确解释PFS结果的挑战就越大。在解释PFS时,考虑到组成事件之间的这种差异至关重要。
在综合终点的疗效评估中,也可能出现一些问题。通常我们假设所有治疗相关的变量都会以相似的方式改变,但实际情况可能并非如此。例如,某些治疗可能减少肿瘤扩散,但同时增加死亡率。当综合终点包含多个不同的事件时,这些事件的方向性假设可能不再成立。因此,在涉及复杂疾病状态(如癌症复发和移植物抗宿主病)的治疗中,单独分析每个变量以准确评估治疗效果变得尤为重要。
PFS和DFS等复合终点的组成部分受多种因素影响,存在一定不确定性,特别是在肿瘤生长或转移的时间评估上。因此,提供事件的完整细分有助于了解复合结局中的偏差程度。
图片来源:123RF
为了有效比较不同研究人群,了解复合事件中不同组成部分的确切组合情况是必要的。然而,由于缺乏统一的报告标准和方法,可用于比较和分析的数据经常是有限的。即使在相同癌症类型和治疗环境下,治疗对不同病灶的效果也可能存在差异。这一现象突显了在将多项研究结果合并进行荟萃分析前,确保复合终点的各个组成部分在定义和度量上具有相对一致性的重要性。
因此,在设计和解释肿瘤学临床研究时,考虑复合终点内部的异质性和潜在偏差是至关重要的。这不仅有助于提高研究的科学严谨性,而且对于确保患者获得最有效的治疗方案具有重要意义。
复合终点的优势
此外,一些事件,如第二恶性肿瘤或某些不良事件,由于极为罕见,进行个体分析不太可行。
使用复合终点的主要目的是增强研究的统计效力。由于事件总数的增加,复合结局的使用还可以减少所需的样本量、降低成本并缩短临床试验的随访时间,进而加速药物的审批流程。例如,有研究发现,在注册试验中使用PFS作为替代终点,相比于使用OS作为主要终点,获得支持批准的数据所需的平均时间减少了11个月;据估计,这一缩短的时间大约减少了药物整体临床开发时间的12%。
图片来源:123RF
然而,需要注意的是,复合终点对统计效率的影响也可能带来一些问题。例如,如果治疗对复合结果中不同组成部分的影响方向相反,则可能降低统计效力。此外,即使治疗效果方向一致,若二元复合终点中的个别组成部分之间存在高度重叠且相对治疗效果显著,所需样本量依然可能较大。同时,使用复合结局可能导致研究者限制样本量(即使更大的样本量是可行的),因为样本量的确定通常基于类似试验中复合结局的比例,而非单独组成事件的频率。这种方法可能降低研究的内部和外部有效性,并削弱对各组成部分进行详细分析的能力。
复合终点的另一优势在于它能评估治疗对超出OS的其他结局的影响,这在肿瘤的多个方面具有类似临床重要性的情况下尤为重要。只要复合终点的不同组成事件都对应于相同的生物学路径,就能有效捕捉治疗的整体效果。此外,使用时间-事件(time-to-event)终点常能避免生存分析中的竞争风险问题,这一点对于生存分析的准确性至关重要。
例如,在老年患者或有多种合并症和慢性肿瘤的患者中,非癌症相关的死亡可能会先于由疾病进展引起的死亡发生。在这种情况下,如果仅关注疾病进展作为评估结果,可能会错误地认为某些治疗在临床上有益,尽管它们可能增加非癌症相关的死亡风险。因此,综合考虑治疗对疾病进展和其他重要临床事件的影响,可以提供更全面、更准确的治疗效果评估。
图片来源:123RF
结语
在过去的三十年中,复合终点在肿瘤学试验中的应用日益增多。虽然它提升了随机对照试验的效率并加速了药物审批过程,但它也容易受到偏差的影响,并可能导致结果的误解。此外,由于复合终点定义的不一致性,使得不同试验之间的比较变得更加复杂。尽管已有研究组织试图解决这些问题,但标准化的定义并不总是被临床试验者采纳。因此,监管机构需要加强监管,确保随机对照试验遵循统一的准则。
此外,为了确保复合终点的有效性,其组成事件应具有相似的临床意义和频率,并且受到治疗的影响程度也应相似。在肿瘤学试验中,透明地报告这些组成事件至关重要。如果没有细分,就无法准确判断复合终点的改善是否由具有重要临床意义的事件驱动。提供关于复合终点的全面细分,有助于防止试验结果的误解,并提供更深入的治疗效果解释。为了整合多个临床试验的结果,并在不同的患者群体中进行比较,清晰地报告每个独立事件是必需的。
未来的研究应通过随机对照试验来深入探讨复合终点的细分,以揭示对不同组成事件影响的潜在不均衡性。展望未来,改进肿瘤学临床试验中复合终点的报告方式并制定明确一致的定义至关重要。通过这种方式,我们可以更深入地理解这些终点的临床意义,提高肿瘤学研究的有效性和可靠性。