新浪博客

暗数据

2022-07-29 11:38阅读:
#读书《暗数据》,作者大卫·汉德。
书中把各种缺失的数据称为“暗数据”(dark data)。暗数据隐藏在我们的认知之外,这意味着我们可能出现误解,得出错误的结论,做出糟糕的决定。
本书结构很清晰,基于成因,作者把暗数据分为15种类型。第1种暗数据:已知的缺失数据 第2种暗数据:未知的缺失数据 第3种暗数据:局部选择案例 第4种暗数据:自我选择 第5种暗数据:关键因素缺失 第6种暗数据:或可存在的数据 第7种暗数据:因时而变 第8种暗数据:数据定义 第9种暗数据:数据汇总 第10种暗数据:测量误差与不确定性 第11种暗数据:反馈与博弈 第12种暗数据:信息不对称 第13种暗数据:故意屏蔽的数据 第14种暗数据:编造与合成的数据 第15种暗数据:推理僭越数据
这种分类并不是穷尽式的,因为暗数据的成因非常多,列出所有类型几乎是不可能的。基于这种分类,其目的探索暗数据是如何形成的以及它为什么会形成。我们将考察不同类型的暗数据,并研究它们的起因。首先,我们会探讨采取什么措施可以避免暗数据的产生。其次,我们还将研究如果意识到暗数据被屏蔽,我们能做些什么。最后,我们还将看到,如果我们足够聪明,那么我们也有可能从暗数据中获益。

我的更多文章

下载客户端阅读体验更佳

APP专享