将全基因组机器学习应用到癌症液体活检中

Freenome公司:将全基因组机器学习应用到癌症液体活检中

时间:2016-6-23 09:53  来源:测序中国

摘要:循环肿瘤DNA分析市场的新成员Freenome公司近日表示,已经筹集了550万美元种子基金以实现其技术的商业化。不同于目前市场上或研发中的液体活检,Freenome公司的检测技术是基于全基因组测序和一种计算策略,公司称其为 ……

循环肿瘤DNA分析市场的新成员Freenome公司近日表示,已经筹集了550万美元种子基金以实现其技术的商业化。不同于目前市场上或研发中的液体活检,Freenome公司的检测技术是基于全基因组测序和一种计算策略,公司称其为“适应性基因组学引擎(Adaptive Genomics Engine,AGE)”。

公司的联合创始人兼CEO GabrielOtte表示,Freenome公司的AGE本质上是一个计算系统,可进行训练并不断调整识别基因组数据模式的能力,进而区分癌症和非癌症,或将某种癌症与另一种区分开。

如今商业化的液体活检,和大多数组织活检一样,依赖于识别已知的特异性生物标记物,或者检测癌症高频突变基因集中的已知或新发现的体细胞突变,或者在某些病例中检测全外显子组中的突变。但是Freenome公司表示,这些检测策略都抛弃了大部分能帮助我们在最早期识别癌症的基因组数据。

虽然他拒绝透露公司实施全基因组测序和训练算法的细节,Otte表示他和他的同事们相信,他们独有的方法可以以实用的价格实现全基因组测序数据的分析。虽然他们还没有公开分享数据,但是目前看上去这个方法是有效的。

Freenome公司基于AGE的液体活检策略

他们的策略是这样的:对健康人样本和癌症病人样本进行全基因组测序,将数据提交到AGE直到系统学会如何区分它们。AGE分析的样本越多,它区分样本为癌症组和非癌症组的能力就会越强。一旦该系统强大到足以应用于临床检测,Freenome将能够对客户的循环游离DNA(cfDNA)进行测序,并对其进行精确地分类。

Otte说,“实际上这是机器可以检测并追踪而人类无法做到的事。例如,如果你进行变异筛查,通常采用的方法是将reads匹配到某个位置,同一个位点会出现一定数目的read为‘A’,一定数目的read为‘G’。如果参考基因组上该位点为A,而我们检测到了大量的read为G,超过了设定的截点,那么我们就认为这个位点含有一个突变。”

“但是因为这个截点可以任意设置,如果这个值没有达到阈值,那么整个数据集都要舍弃,即使仅仅只有一个read比要求的低。这个数据的意义是人类可以理解的。但是机器可以追踪更多的情况,无论是一个read为‘G’,还是1000个read为‘G’,机器都可以记录跟踪。”

如果数据中的某个变异是测序错误,那么学习引擎将在分析了足量样本后对其进行过滤,因为这些错误具有随机性。

Otte解释道,“如果是一个随机错误,很少的数据集中会存在这个错误,但是如果它是一个生物学突变,那么就会出现在大量样本中。”

他表示到目前为止该策略已经成功了。“机器在经过20个样本的训练后,灵敏性和特异性已经达到85%。经过100个样本训练后,已经达到98%的灵敏性和特异性。”然而到目前为止该公司还没有发布任何支持这些数字的数据。

一旦建立了一个基本的癌症与非癌症的预测模型,他们可以利用新的样本建立不同的问题,基于AGE的功能同时检测致癌突变和核小体定位或者其他表观标记,进而区分体内不同来源的DNA。

Freenome公司液体活检产品的研发进程

Otte说,公司近期取得的一项成就是,将前列腺癌和肺癌的识别整合到一个检测中,AGE不仅能够识别癌症存在,还能判断这种癌症是属于肺癌还是前列腺癌。

公司打算创建一种泛癌症(pan-cancer)检测,但是目前公司正在研发的是单一癌症的检测,随后再尝试将这些检测进行整合。

Freenome公司的AGE同样还能够从病人是否对药物应答中学习。Otte说,“因为我们进行的是全基因组测序,我们可以建立一个新的学习引擎,检测哪些人对药物有反应,而哪些人没有反应。”这是他们正在和加利福尼亚大学圣迭戈分校合作研究的项目。

公司也在和其他多个研究机构合作,验证AGE发现的新型标记,并将其整合到预测策略中。他们会提供盲样本进行分析,确定公司研发的前列腺癌、肺癌和结直肠癌检测的灵敏性。

Otte表示,Freenome已经和美国食品及药物管理局(FDA)讨论过,确保公司进行的研发和验证能够保证其检测获批为体外诊断(IVD)产品。但是Freenome将首先申请其检测为实验室研发检测(LDT),以便应用于临床,因为最终获批成IVD还需要很长一段时间。

Otte透露,公司计划将在近期发布基于AGE的癌症检测的早期性能数据。