AI开始尝试预测死亡

更新时间:2024-01-16 20:06:13作者:橙橘网

AI开始尝试预测死亡

界面新闻记者 | 赵一帆
界面新闻编辑 | 文姝琪

一串由人类创造的代码正在尝试帮人类"算命",死亡似乎不再是无法预测的事情了。

近期,丹麦科技大学的研究团队声称设计出一款人工智能死亡预测器。研究人员表示,这款名为“Life2vec”的模型可以通过强大的机器学习算法,分析构成个人生命的事件序列,预测包括寿命、疾病风险、未来收入等各种重大生活事件。

从研究结果看起来,预测器颇具成效。报告显示,该模型预测死亡的准确率高达78%,比当下其他AI模型或者保险公司使用的方法高了11%。

高度具体的数据是其成功预测的关键。论文第一作者苏恩·莱曼表示,他们使用了丹麦国家登记处的数据,收集了600万人的十年日常生活记录,具体包括教育、健康、收入和职业等生活方面的信息。

该模型使用了2008年1月1日至2015年12月31日期间,从35岁到65岁年龄段内230余万人的数据进行训练。作者莱曼向媒体解释称,选择这一群体是因为该年龄段的死亡率更难以预测。

为了让“Life2vec”理解这些数据,团队把人类生活的每一部分都编成了一串代码。例如,S52表示前臂骨折,POS3513表示这个人是计算机系统技术人员。研究团队把个人生活事件当成句子中的单词,然后再根据时间顺序,绘制出详细的“个人生活序列”。

“我们使用ChatGPT背后的技术来分析人的寿命,方法是将每个人生活中发生的事件表示为序列。”作者莱曼表示,“就像语言一样,生活事件发生的顺序非常重要。”

与ChatGPT的原理类似,“Life2vec”也是通过大量数据来推断未来可能发生的事情。例如,你问它“我会在四年内死亡吗?”,它会查看你过去的生活事件,包括你如何思考、感觉和行为,以及可能影响生存的遗传或环境等其他因素,然后根据统计模型为不同场景分配概率,预估出未来事件或死亡风险。

为了测试“Life2vec”的效果,研究人员让模型对随机挑选的匿名人士的死亡时间进行预测。团队选择了一组10万人的数据,其中一半人在2016年后的四年内死亡,一半人存活,然后让算法对这个人能否活过2020年进行判断。令人惊奇的是,模型预测准确率达到了78%。

“Life2vec”模型能够实现对死亡的预测,一方面得益于强大的数据支持,另一方面则是因为大模型算法已经进化到可以捕获大量非结构化单词序列。

“该模型通过借助于注意力机制模型的能力,挖掘出了序列中的隐藏的深层特征,更容易拟合预测目标。这在除开语言的其他场景中拥有很好的潜力。”百图生科AI算法负责人王太峰接受界面新闻记者采访时表示。

过去大模型主要被应用在自然语言以及图像处理等科学领域,而较少被应用于泛科学等社会经济领域。

“科学与泛社会科学领域(包括语言学)的主要区别在于,科学领域存在客观规律。这意味着大模型可以从这些规律出发,而不仅仅依赖于数据本身。”深势科技的研究人员进一步对界面新闻解释说,“但人类生命是一个复杂的系统,AI在生命科学领域的进步,需要该领域专家把这些问题拆解成AI可以有效解决的具体问题。”

除了预测死亡,这款模型还具有一定通用性,能够预测出性格特征、幸福程度、职业成果等更为主观的人类细节。举例来说,它可以根据人们过往的工作经历来预测职业成果,告诉人们是否会更换工作或提前退休。

“Life2vec”的更大价值在于提供信息和指导。比如未来它可以综合考虑生活方式、遗传基因、收入程度等多方面因素,在健康风险预测、个性化诊疗方案制作等方面提供更为科学准确的分析。

当然,“Life2vec”仍存在许多缺陷和风险,首当其冲的便是数据安全问题。由于模型需要获取大量收入、疾病史等个人数据,一旦用人单位或者保险公司知道了个人存在的疾病风险,极有可能会影响就业或参保。

其次,预测结果的可靠性也无法完全保证。一位头部大模型企业的产品专家向记者解释称,模型预测结果会受到数据质量、模型参数、模型假设等诸多因素的影响,有不确定风险。

同时,人们是否想要知道自己能活多久也没有定论。对于大多数普通人来说,预知死亡或许意味着更大的恐慌,接下来的生活很可能在长期笼罩的焦虑中度过。

为保护用来训练的丹麦公民的个人隐私信息,该AI模型并未对公众和保险公司开放。作者莱曼对CNN表示,在目前的状态下,Life2vec还没有准备好执行任何“现实世界的任务”。同时鉴于经济与社会的差异,关于该模型能否应用于其他国家仍不清楚。

本文标签: 算法  科学  莱曼  序列  ai  预测死亡