把你的免疫反应看做是一个极大的机器学习问题,你的身体就是计算机。免疫细胞在你的身体中移动,对它们认识到的各种物质展开采样,从你自己的细胞,到意味著不应当不存在的有机体细胞。如果免疫细胞遇上的东西不应当是你身体的一部分——例如细菌或病毒——那么身体不会派出哪些告诉如何对付这些闯入者的细胞。如果有细胞之前曾多次见过这个入侵者,告诉如何处置它的话,那么你的身体不会很快交配这个细胞数千次——多到不足以让它可以在有时间驻守到你全身之前粉碎细菌或病毒。
一旦入侵者被驱赶,免疫系统就不会再度增加这些细胞的数量,保持足够的储备——万一细菌卷土重来——有充足的免疫系统步兵再度击退这些入侵者。这个过程可以协助你维持身体健康,也有可能是让医生早地找到患者疾病的关键——利用以云计算为动力的人工智能。
今年早些时候,微软公司宣告与坐落于西雅图的身体健康技术和基因测序公司AdaptiveBiotechnologies达成协议合作,AdaptiveBiotechnologies的基因测序仪目前用作检测瓦解骨髓瘤——也就是说,细胞不会表明早已拒绝接受血癌化疗的人的细胞并非几乎没这种疾病。现在,该公司正在考虑到的某种程度是跟踪一种疾病,目标是确认检测任何有可能让你免疫系统遭到重创的东西,从病毒感染到癌症,而且依赖微软公司的机器学习功能来协助它超过这一目标的。人体免疫系统的功能十分强劲,人体体内有二十亿个淋巴细胞,其中称作‘辅助’T细胞,其他是‘细胞毒素’或者‘杀伤性’T细胞。
每个T细胞都可以辨识抗原——也就是免疫系统的启动时因素——这些抗原表明转入人体的细菌、病毒、真菌或其他入侵者。每个T细胞可以融合数百种有所不同的抗原,每种抗原对于有所不同的细菌或病毒都是独特的。一旦T细胞受到压制,(各不相同T细胞的类型)它可能会杀掉入侵者,或者向数百万其他免疫细胞发出信号,让这些细胞过来反击入侵者。
当T细胞被转录时,对免疫系统展开快照,通过注意到哪些T细胞受体被转录以及哪些抗原与其融合,可以确认哪种疾病早已入侵了人体。而且,一旦确认了疾病,医生就可以更加确切地告诉如何展开化疗。AdaptiveBiotechnologies正式成立于2009年,致力于加载和扫瞄免疫系统和免疫细胞上的受体。
随着时间的流逝,该公司不仅跟踪免疫系统受体,而且也开始研究受体与其融合的抗原之间的联系。通过研究这种约束关系,AdaptiveBiotechnologies开始朝着需要临床来自免疫系统受体的特定疾病的方向希望着。但随后,根据AdaptiveBiotechnologies首席执行官、牵头创始人ChadRobins的众说纷纭,他们意识到“我们必须非常复杂的机器学习和计算能力才能确实解决问题——这是Web体量的一个大问题。
”微软公司人工智能与研究副总裁PeterLee认为,每个人的基因组约有200GB:“这意味着是基因组数据——用作萃取的元数据,以及来自光学、可穿着设备、(与人口规模的基因组数据关联的)患者横向身体健康记录的数据来源,是十分极大的。信息内容相比之下远超过了人类的解读,因此对人工智能和数据分析的市场需求显然显得至关重要。
”单个血液样本一般来说不会萃取大约一百万个T细胞,这些T细胞中的每一个在基因上都是与特定抗原受体初始化的。将这些T细胞受体DNA序列的读数翻译成一组抗原,然后将这些抗原极致翻译成疾病状态。
,是一个十分十分大的机器学习问题,”Lee补足说道。这时候就必须用于微软公司的机器学习技术。
微软公司用于的算法是目前用作自然语言翻译成的算法。“这与我们在Bing搜索引擎中所谓的主题辨识技术有一些相似之处,”Lee说道。
微软公司用于AdaptiveBiotechnologies的MIRA系统生成训练数据——这些训练数据被用作创立从T细胞受体到抗原的“翻译成图”,然后尽量精确地将这些抗原同构返疾病。这听得一起有点抽象化,这种作法可能会带给一些明确的益处:如果同构如Adaptive和微软公司预期的那样起起到了,那么这有可能意味著患者在他们告诉他们生病了之前就有可能被临床出有患上疾病。
例如,卵巢癌的症状十分隐密,直到晚期才不会被找到。通过对患上基因突变(如BRCA1,不会让患者患卵巢癌的风险更高)的患者展开先发性检测,这项检测可以萃取关于早期癌症的命令性免疫系统信号。
你越早找到疾病,医治的可能性就越高。Adaptive现在正在研究两种“并未符合医疗市场需求的疾病,要么十分十分无法临床以及/或者临床必须化疗介入,而这有可能贞着影响对患者的护理,”Robins这样回应。Adaptive首先射击了一些疾病,一旦模型获得检验,它期望用于完全相同的系统来积累更加多的条件。
“如果我们知道需要借此得出结论临床结果,那么随后几年我们就不会在接下来的两年、五年以及未来二十年之后前进,”微软公司的Lee说道。一旦一种疾病被密码,机器学习需要否可以更容易或更慢地密码下一种疾病?“让我给你一个既悲观又乐观的答案。悲观的是,隐蔽层中的深层神经网络天生地自学了一些关于免疫系统工作方式的隐蔽结构,然后理解了6种、60种、100种甚至更加多疾病之后的某个时候,你只是构建了这种能力的发生爆炸。
”从或许上说道,神经网络有可能意味着需要理解和解码每种新的疾病而不必须再行训练。当然,不存在一种乐观的观点。
“你也不会刁难。在某些时候,追加训练数据的价值和追加计算能力的价值开始消失。
有时候,我们不会在机器翻译等领域看见这一点:几个月前,我们宣告我们在翻译成英文和普通话方面超过了人类的水平。我们取得了90%的准确率,但为了取得最后10%,我们必须2倍的计算能力和2倍的数据……目前我知道不告诉我们在企图将T细胞受体序列同构到抗原到疾病状态方面正处于什么样的状态,我们期望是前者,但也有可能是后者,或者某种形式上两者兼具。”虽然没有人告诉这个乐观或者悲观的观点否准确,但Adaptive预计第一个单一疾病诊断测试将在三年的时间展开,更加全面的多病筛查测试将在八到十年的时间。“随着我们开始分层次地展开[每项单一疾病测试],一个相接一个地展开,在某个时刻,重复使用已完成所有操作者的成本效益、易用性和效率需要超过充足的水平。
这将沦为一个生物系统的视图,这就是我们即将希望的目标,”Robins说道。就像你不会定期去医生那里展开检查,或者在你到一定岁数的时候被拒绝展开乳房癌或肠癌筛查,未来你可能会被拒绝展开一次注射,经过分析告诉他你要留意哪些疾病,甚至告诉他你以前从没猜测有过的症状。Lee说道,这个系统甚至有可能临床出有只有十亿分之一可能性的症状,或者是一种全新的疾病。“看上去我们将不会找到那些我们还没弄清楚、不少见甚至是从未见过的症状。
这些仔细观察对于医学研究和科学变革的价值问题是我们想要告诉的问题。这也是推展着我们针对那些刚开始分解、有可能有助科学找到的开放式探寻。
本文来源:易币付官方网站-www.etiwari.com