埃隆马斯克希望获得更多关于 Twitter 机器人的信息可能会得到满足。据《华盛顿邮报》报道,Twitter 正计划向其推定买家提供其完整的“消防水带”,即推文的全面数据流。
在没有做太多尽职调查的情况下同意以440 亿美元收购 Twitter后,这位特斯拉和 SpaceX 的 CEO 公开发脾气,显然是为了退出交易。虽然有些人认为马斯克的冷落是宏观经济衰退的结果,但这位亿万富翁已经利用自动机器人账户问题作为交易的潜在出路。
周一,推特在提交给美国证券交易委员会的文件中分享了马斯克法律团队的一封信,称马斯克需要在服务上的“垃圾邮件和虚假账户”方面提高透明度,然后才能推进这笔交易。 Twitter估计,机器人占该网站帐户的比例不到 5%,但“跛鸭”首席执行官 Parag Agrawal 表示,他不认为这种计算可以在外部得到验证,因为它需要使用私人公司数据(那时马斯克给 CEO 发了一个便便表情符号)。
– 埃隆马斯克 (@elonmusk) 2022 年 5 月 16 日
显然,马斯克现在可以访问这些数据,而 Twitter 最初并不想交出这些数据。 “firehose”包含有关发送的每条推文的信息、发送的设备以及有关帐户的其他信息。
根据 440 亿美元交易的合同,马斯克必须完成收购,除非他能证明 Twitter 在公司的真实价值上欺骗了他。如果事实证明 Twitter 实际上比以前认为的更密集,这可能是交易的一条途径——但 Twitter 的披露甚至不太可能是错误的。 《华盛顿邮报》报道称,至少有 22 家 Twitter 以外的公司已经为访问这些广受欢迎的数据付费,如果有任何重大差异,很难想象我们现在不会注意到它们。
但总部位于英国的 GlobalData 今天早上发表了一项研究,声称至少 10% 的 Twitter 用户可能是机器人。目前尚不清楚他们的数据是否来自“消防水带”或可公开访问的数据(TechCrunch 要求该公司澄清),但该研究分析了来自 20,976 个独特句柄的约 400 万条推文。 GlobalData 通过每 3 小时从 Twitter 收集一次数据进行 22 次迭代来选择这些帐户,然后选择样本大小。尽管如此,根据垃圾邮件的定义,这些数据可能会以不同的方式进行解释。
数据科学家 Sidharth Kumar 解释说:“不断发布非原创内容的推文可被视为垃圾邮件,但有些人可能会选择将其视为非常活跃的用户分享文章/意见。” Kumar 意味着只转发新闻文章的帐户可能会被标记为机器人,但实际上,它可能是一个不发布原创内容的真实用户。
自 2013 年申请上市以来,Twitter 一直声称只有大约 5% 的帐户是垃圾邮件。
原文: https://techcrunch.com/2022/06/08/twitter-hand-over-data-musk-bot-spam-accounts/