科学性受限
不仅是天赋基因检测,对于所有与“预测”功能相关的科技手段,人们最关心的都是“科不科学”和“准不准”。
“TA不喜欢看恐怖片,也会很难享受在过山车上直冲云霄的感觉。感官的刺激难以带给TA快感,TA会更多体验到恐惧和危险。”北京各色科技有限公司(以下简称各色科技)提供给用户的检测报告中的部分语言,看起来颇像一些常常出现在星座运程中的表述。
对此,各色科技CEO郭婷婷回应说, “看起来像是星座算命,但其实每句话所对应的都有科学依据。”她们为检测者出具的10万字报告是导入数据后,由后台自动生成的。通过几百个标签分别将用户的结果标准化,“每个标签下的分析,一部分是根据研究文献得来,一部分是根据数据分析,最后该标签下可能出现的行为表现,也往往来自该特质的心理学表现研究和问卷”。
根据郭婷婷的解释,一个标签的解读,是结合这一人格特质所对应的权威研究文献,将研究结论运用算法,设置位点间的不同权重,最终自动生成的结果。
但对于文献的依赖,在一些研究者看来,恰恰表明了基因检测分析的局限性。业界和学界的共识是,在祖源、心理、运动等这些偏娱乐应用的消费级基因检测方面,中国与美国相比,差距非常大。这个差距在研究样本数量上体现得尤其明显。美国的基因检测样本量在数百万级,中国在这些领域的检测样本量加起来仅有几万个。据了解,截至目前,各色科技的用户量约近2000人,而WeGene的用户量为近3万人。
陈科指出,国内非临床基因检测样本数据的匮乏,导致目前在此基础上作出的结论,并没有那么准确。陈钢认为,基因检测科学性的高低取决于累积检测人群的规模、所依据研究中的人群是否与检测人群相一致、数据质量是否经过多次独立验证等。
美国的基因检测公司23andMe往往在解读报告中指出,在某几个基因位点上跟被测者相同的人,有百分之多少。“比如有80%的人身体质量指数BMI大于28等,这就比较科学,因为这个结果的背后,有庞大的用户数据作支撑。”陈钢说,“相比之下,国内厂商,包括WeGene,都只能告诉你,你的体重比一般人高,却给不出像23andMe一样精确的百分比数据。”
陈钢认为,理想状态下,所有的解读背后的关键因素都应该是数据——有多少中国人数据,和中国人的这些数据相对应的表型信息来支持解读。
他说,由于国内检测公司的数据积累不足,只能结合研究文献进行解读。但这其中有很多主观因素影响结果,因为论文的质量并无判断标准。哪些论文是最权威、最适合的?分析者往往是根据自身主观经验和眼光进行选择,主观因素在其中起到很大作用。同时,分析者在对论文结论进行整合时,也存在一定的主观判断,进而得出一个带有较多主观因素的解读结果。“相比于这种形式,23andMe依托大数据的分析方式显然更好、更精确”。
郭婷婷也表示, “现有的检测结果是根据国际上对这一问题研究的最新、最权威文献得出的。但科学的特点是变化,所以我们会去追踪这一领域的研究。如果变动的研究所涉及的基因位点影响到我们的检测结果,我们也会追踪更新。”
陈钢和郭婷婷都强调,WeGene和各色科技所作的基因解读报告都在不断更新。“我们不提供纸质报告,而是电子版报告”。
在WeGene提供给51岁的科技爱好者程明(化名)的第一版检测报告中,他被检测出运动能力表现突出,比如爆发力、耐力等指标,属于前10%的范围。但第二版检测报告更新后,他的运动能力变成了前20%的范围。
陈钢表示,WeGene正在不断减少那些科学性不够高、主观影响较多的检测项目,尤其是一些涉及健康风险的项目,尽可能为用户提供最有用、可靠的信息。