Title Text:WE WILL ARREST THE REVOLUTION MEMBERS [AT THE JULY 28TH MEETING][tab] “Cancel the meeting! Our cover is blown.”
Origin:https://xkcd.com/2169/
https://www.explainxkcd.com/wiki/index.php/2169:_Predictive_Models
預測模型
预测文本是许多系统上的一项功能,当您键入系统时,系统会自动建议可能的单词或短语,以遵循您写入该点的内容。例如,如果您键入“我正在前进”,系统可能会建议“回家”或“回来”作为可能的词语。预测系统通常使用先前的输入来生成预测,因此如果您经常输入“Totally amazing!”系统会建议“太棒了!”每次你输入“完全”,即使你实际上有时想要输入“完全真实”。
在漫画中,Cueball使用预测文本来揭示针对其组织/政府的情节,但系统不是仅使用他的个人输入,而是使用来自所有用户的输入。通过键入与革命和会议相关的模糊短语,他获得预测文本算法,以显示基于其他用户输入将在何时何地举行下一个所谓的秘密会议。这是有效的,因为革命者以外的其他任何人都不可能输入这个短语,因此算法必须预测的唯一数据是来自革命者在下次会议上的实际信息。漫画的标题指出,以这种方式使用先前输入用于预测目的的系统最终可能泄漏可能被视为私有的信息。 (但是,这种方法可能会产生过时的信息。在2019年6月29日,在谷歌打字“革命万岁。我们的下一次会议将在”预测完成“革命万岁。我们的下一次会议将在漫画会议上2018年“,对于任何寻找革命者的人来说都不是有用的信息,因为Comic-Con 2018已经结束了。”
标题文本显示革命者使用相同的技术。通过输入“我们将逮捕革命成员”,他们希望算法将建议他们计划逮捕的时间和日期,因为除了当局之外没有人会输入该短语。按下[tab]键自动完成该文本会产生“我们将在[7月28日会议上找到革命成员]”,然后革命者说“取消会议!我们的封面已被烧毁”。革命者显然犯了一个严重的错误,即在正常的,可预测的日期举行秘密会议(例如每个月的第28天,保证在格里高利历的任何一个月都存在的最后日期),当局已经成功地解决了这个问题。 ,通过预测文本攻击或通过其他方式。
这两个例子都假设革命者和当局将在他们的对手可以访问的网络上清楚地谈论非常秘密的信息。在现实世界中,参与敏感活动的人将通过代码,加密或两者进行通信,或者通过他们认为是安全渠道的方式进行通信。但是,仍存在通过非秘密渠道泄露秘密信息的危险。
旁道攻击使用从系统实施中获得的信息来推断出所谓的受保护信息。第二次世界大战就是一个着名的例子。德国人对坦克生产数据保密,但是他们提供了类似发动机组顺序序列号的项目。盟军想知道确切的坦克生产数据,因此他们通过使用统计方法分析这些数字在捕获的车辆上的分布来解决德国坦克问题。他们能够非常准确地预测坦克生产数据,他们预测在一个月内实际建造276辆坦克270辆。因此坦克生产的秘密信息泄露。
某些系统需要频繁更改密码,以便限制发现密码的危险。然而,人们通过在模式中选择密码来做出回应,因此很容易预测后续密码将会是什么,给定旧密码,从而挫败了需要频繁更改的目的。用词进化:现代时代的身份验证指南
尽管漫画标题是“预测模型”,但预测建模这一术语通常指的是试图预测数据汇总结果的计算机程序,例如检查健康记录以识别基于体重,先前受伤等特定疾病风险最高的人群。之前,直接测试疾病本身。这与漫画中的示例类似但不完全相同,因为预测文本使用直接输入来预测进一步输入,而预测建模使用相关输入(例如汽车的品牌和型号以及驾驶员加速模式)来预测不同的输出(例如崩溃的可能性)。然而,正如漫画所暗示的那样,预测文本和预测建模都可能泄露信息。
在1068年之前,预测文本以及泄漏意外信息的可能性已经在xkcd上被模仿:Swiftkey。