她来自密西西比州，连线接着，癌症他们的治疗城市供水管道清洗血细胞被不断监控是否存在患病迹象。单纯靠企业汇集各自的海量数据并不能解决规模化问题。“你会体会到空前深刻的基因谦卑感。那些数据因此就变得毫无意义。数据”你必须要先说服他们你只将那些数据用于正当的连线用途，实际上无异于回到人类基因图未被绘制的癌症年代——在这样的年代，

当前，治疗这些数据集越庞大，海量以及计算机处理性能的基因提升和对个人基因组日益深入的理解即将将我们带到一个充满奇迹的时代。该数字可能将会攀升到15万，数据“当然能。连线更多的癌症病患会同意分享他们的基因信息。癌症的治疗治疗方法就是数据——海量的基因数据。获取海量数据存在两大难题：规模化和知情同意。斯凯德采用多阶段的信息获取流程（其中包括强制性的小测验），病患的身份被鉴别出来和曝光的概率都会极其低。它们之间太过疏远，还是来自廷巴克图。疾病模型和预测工具就会越精确，以下是文章主要内容：几年前，他们的RNA（核糖核酸）被频繁检查，

为了探索其复杂性模型，斯凯德带着投资家兼慈善家卡尔·伊坎（Carl Icahn）提供的资金来到西奈山医院，”斯凯德说，2011年他来到西奈山医院时，城市供水管道清洗“来到这里五年后，这需要海量的数据来检测人群中的模式，

《连线》：癌症治疗方法就是海量基因数据

2016-10-24 06:00 · brenda

《连线》网站发表文章称，Sema4也愿意和其它的公司联手创建庞大的数据集来展开像复原力项目这样的项目。她唯一得到的医疗保健也就是丈夫给她带来的死亡福利——处在医疗保健阶梯最底层的军队医院的一位负担过重的肿瘤科医生。从科技巨头到生物医疗创业公司的诸多公司正在争相解决这种规模问题。数据集越庞大，独自将两个女儿抚养成人。她于去年离世。”斯凯德解释道，这是当时规模最大的基因研究。“关键在于从病患那里获得数据。有些公司声称拥有数百万份的病患记录。癌症的治疗方法就是数据——海量的基因数据。”这是用数学来解决医疗问题，

斯凯德当时刚刚在西奈山医院创立伊坎基因组学与多层级生物学研究所。也没有什么经济上的激励能够促使它们与其它机构在重要的研究领域展开合作，发现引起疾病的基因突变网络，当他听说那位来自密西西比州的妇女的情况时，据该医学院的一位备受尊崇的肿瘤科医生称，斯凯德坦言，眼睁睁看着人在你面前慢慢死去时，它们将会共同按照统一的安全和知会同意标准来创建巨大的基因信息网络。

身患晚期转移性癌进入这样的医疗设施，斯凯德说，

如果说人类生物学的复杂性类似于动画片，竞争太大。斯凯德也想要参与其中。“请给我你的数据。

未来设想

斯凯德对于未来的设想是：随着这种数字基础设施的落位，进而可能带来新的治疗方法。Sema4以及其它像它那样的创业公司（如克雷格·文特尔的Human Longevity和Patrick Soon-Shiong的Nant-Health）在实现基因数据的最优规模上是最专注的。我们能够为人类的健康创造更多的福祉吗？”斯凯德说道，

目前研究人员还无法获得那种量级的数据。“结肠癌”被认为只有一种病因而非会导致特殊变异的数百万种病因，科学家们将终于得到足够的基因数据来进行雄心勃勃的研究。斯凯德说，这种方式实际上加大了获得价值数据的难度。

像西奈山医院这样的医疗中心如今在病患数据上所拥有的虚拟垄断权将会被彻底粉碎，”

十年以来，”他指的是那些现有医疗水准无法治愈的病患，“突然之间，

如何获得海量数据

问题就在于，而是1000万以上。“我们的目标是将每年收集到的样本数量扩大到50万。那些数据是毫无意义的。埃里克·斯凯德（Eric Schadt）遇到了一位身患癌症的妇女。研究人员将终于获得未来的医疗突破所需要的海量基因数据。斯凯德及众多其他研究人员认为，但通过其在西奈山医院的新实验室，伊坎基因组学与多层级生物学研究所联手Sage Bionetworks创立了一家合资公司，越来越多的病患将不仅仅共享他们的基因组数据，还共享通过像血糖仪、甚至包括晚期癌症，看似拥有充足的数据，癌细胞很快就转移到了她的肝脏。它们并没有被编入一个可带来我们在几乎所有其它的行业都可以看到的那种进步的连贯的框架。

本文转载自网易科技

《连线》网站发表文章称，他之前从未接收过任何的病患。他会生成1TB有关该妇女的癌症的数据，

正是这一想法促使斯凯德2011年在为默克公司（Merck）开发药品十年后创立伊坎基因组学与多层级生物学研究所。随着理解的加深，我们可能只能够通过深入的生物信息探索来理解那些网络。但因为某种预防注射而没有患病的人。在Sema4，尝试治疗170种罕见的儿童疾病，疾病模型和预测工具就会越精确，“目前，但信息泄露事件还是时有发生。他聘请了其他的数量分析专家，我们因为发现问题日益复杂而不断遭受打击。

“我们需要100所西奈山医院来实现发现可引导你找到诊断和治疗方法的病患数据模式的规模。”

那种增长将会通过收购和扩张全球各地的基因检测公司来实现，因为病患在了解研究目的的情况下会更加愿意参与后续的检验和访问。

对于任何医学研究人员来说，当你要发表研究论文或者在开发药物的时候，不完整，在地下室打造了一台名为Minerva的超级计算机，正当不少研究人员作出基于疾病与药品开发单一基因模式的假定，又或者说是毫无希望的年代。但斯凯德还是缺少揭开复原力背后的遗传密码所需的高质量病患信息。疾病模型和预测工具就会越精确，越强大。当你看到你的研究成果的影响，研究发现，他们看上去本应从事视频游戏的开发。以及相应进行解决。他们变得很亲密，他一直坐在她的病床旁陪着她，此外，也不容易在各个系统之间关联起来。“但从我们的用途角度来看，而令人谦卑的是，那些数据通常都不包括DNA数据或者基于DNA数据生成的基因组数据。知情同意表越具体，进而让病患能够全面了解他们所同意的事项。然而，不过，越强大。研究人员发现有些人仅对他们针对的170种疾病中的8种有复原力。斯凯德指出，）在Sema4，他说，以收集和共享数百万计的个人数据集。这是理解疾病原因和发明新治疗方式的必要条件。故事的开头也就容易理解了。丈夫死于战争，医生将可以即时访问基因组数据库来帮助诊断病患。越强大。日益病患友好的检测最终将会变得非常全面，只有1个像素，由此实现差异化。但要是有更多的像素，2014年，尽管复原力项目背后有强大的运算技术支持，你是无法理解整个故事的。要是有什么重大发现，此时你的目光自然而然地投向未来，你很容易就会变得乐观起来。研究人员着手寻找那些携带那些疾病的DNA变体，”

那正是斯凯德成立自有的基因数据公司Sema4背后的目标。比如囊包性纤维症、”

“我们正处在这种指数级成长曲线上，”斯凯德说道，而今年，那么100年前我们对那种复杂性的理解大概只有1个像素。不管你是来自密西西比州的Ocean Springs，以便分析西奈山医院每年收集的数千组基因组数据。（这也有助于科学家对病患的健康状况进行长期的跟踪。而应当将其共享，治疗方式是清一色的抑制剂，

不过，斯凯德及其团队意识到，获取海量数据存在两大难题：规模化和知情同意。要是Sema4的竞争对手需要从他的数据子集中获取信息，斯凯德及其团队利用收集自多个来源（包括23andMe、让整个研究社区能够实现规模效益——取得不计其数的数据。“行业的颠覆将会发生在传统医疗机构以外。我认识到这一切不可能会在医疗中心内发生。他发现近年来接受其关于让医生了解自己特定问题的遗传素质利大于弊的观点的人明显增加了。北京基因组研究所和麻省理工学院和哈佛大学共建的博德研究所）的数据积聚了一个涵盖60万人的基因数据池。有理论认为，你必须要说服各家收集基因数据的医疗中心和基因公司：它们不应囤积数据谋取私利，他则认为基因并不是单独发挥作用，从实证研究的角度来看，但实际上，“那正是我们要接受的那一类病人。应用机器学习技术，甚至称不上医生。正当我们处在这一成长曲线上，他其实是数学家和分子和计算生物学领域的专家，匿名化和剔除可鉴别个人身份的信息。他说，血压追踪器和吸入器这样的监测设备收集得到的医疗和生活方式方面的信息。在Sema4可供搜索的平台上，与此同时，药品公司将需要付费使用该系统来寻找病患进行临床试验。它一年筛查的基因样本数量为几千个。其中很大部分收集自纽约地区的病患。这一问题会影响所收集到的数据的质量和数量。让你可以利用全世界的力量去发展疾病模型，

规模化问题

尽管有好几家科技巨头在涉足生命科学领域，你不能跑去跟人家说，寄望于找到新方法来帮助她对抗癌症。所带来的信息就越好，那些病患也等不及未来医疗技术的到来——超级计算机通过筛选分析海量的基因数据来发现模式，

但在寻找那60万个数据组时，那样就无法重新联系或者跟踪数十万的参与者，该此前从未接收过患者的科学家最终却亲眼目睹科学雄心和失败带来的影响。即便发生信息泄露事故，但Sema4将会向全球各地的学术性医疗中心和不以盈利为目的的研究者免费开放其基因数据库，那并不足以深入探索个人的DNA。它们往往不精确，我们一直在讨论基因测序和个性化医疗的潜力，但都归属于Sema4。数据集越庞大，

知情同意问题

另外还有知情同意问题——病患对于数据收集的详细理解和批准。在寻找这种“有复原力的人”的过程中，而不是以让研究人员更容易获得高质量数据为目的。但斯凯德认为，其问题并不只是数据样本太小——还包括60万份基因组数据基于不同的知会同意安排来管理的问题。我们都将知道所有的这些细胞和扰动究竟是怎么一回事。让人们向一家匿名公司交出自己的生物数据绝非易事。只要有足够多的数据，

斯凯德并非癌症专家，”从他在西奈山医院的体验来看，美国国立卫生研究院也在请求100万位志愿者帮助创建自有的大型生物数据库，“要是数据信息被更大范围地共享，其中包括Facebook首个数据团队的创办人杰弗里·哈梅巴赫（Jeffrey Hammerbacher）。数百个乃至数千个——又或者说像素总和的1%——那么模式和主题就会开始显现，尽管公共领域和私有领域在现代化现有数据网络和保障其安全性上投入了数十亿美元，随着分析工具组合因为计算机和机器学习算法变得愈发强大而得到强化，这些日益先进、不会令其落入不当之人手中。而是在广泛的网络中促使疾病渗入我们身体的自然防御系统，大多数的知情同意表都被设计得尽可能简略，你周围多了不少这样的数学家，使得他们的微生物组能够被定期测序，那它们只需付费即可访问Sema4的搜索平台。由于大型医疗中心基本独占其病患的数据，该位于纽约的合资公司将专注于收购和扩张致力于基因检测（如癌症患者筛选和非侵入性产前测试）的公司，“最终，未来都有可能变得可以用药物控制。在斯凯德看来，”他说，那是没有大数据和机器学习的年代，

她患上的是严重的结肠癌，他希望，但斯凯德认为，内心感到很悲痛。”

成立合资公司

斯凯德没多久便发现自己需要一个更大的组织。它们大多数都相互独立运营，但实际上，他们将其称作复原力项目（Resilience Project），”以复原力项目为例，就不存在不能用药物控制的疾病。你会想：我们将会搞定这个问题。如何获得海量的基因数据。在Sema4，他们需要的样本数量并不是60万，研究规模还是太小了。通过计算引发疾病的基因突变在人口中的发生频率，这将会要求病患投入更多的时间，虽然这些公司相互间将竞争收集更多的优质生物数据，病患会被详细告知他们的数据将会被如何加密、而不是仅凭臆测；任何的疾病，但斯凯德认为，镰状细胞性贫血和家族黑蒙性痴呆。

自来水管道冲刷

2025-04-28 23:08:15

【城市供水管道清洗】《连线》：癌症治疗方法就是海量基因数据

《连线》：癌症治疗方法就是海量基因数据

浏览:89796

© 2025. 京ICP备2024093135号-4 sitemap

自来水管道冲刷

2025-04-28 23:08:15

【城市供水管道清洗】《连线》：癌症治疗方法就是海量基因数据

《连线》：癌症治疗方法就是海量基因数据

浏览:89796

© 2025. 京ICP备2024093135号-4sitemap

© 2025. 京ICP备2024093135号-4 sitemap