数据统治世界
1 生活离不开数据。不对,是生活没有离开数据。但是数据,我们是否是在统治他,还是被他统治?看到了这本书的题目,我就忍不住要看一看。
2 平均值与异常值都需要注意。有许多流量相关问题的解决方式并非是扩大容量可以解决的,而是需要通过分流。。。例如经常提的错峰上下班。
但是对于有些问题,互联网的即时信息,却是另一种模型。需要思考一下解决方法。
3 假阴性与假阳性是此消彼长的关系。现实中的工具绝大部分不可能是百分百准确率,所以“假”的问题就经常存在
4 小概率事件几乎不可能发生,但是我们的大脑却经常无意扩大了小概率事件的发生概率,也不知道是什么原因。
5 相关性也许比因果更重要。世界万物错综复杂的关联着。要想理清因果是很难的,但是能够找到相关性,就对认识世界产生巨大作用了。
重要的是,我们如果以因果来解释世界,必然是在我们能够理解的范围内去分析。但是,我们的知识体系总是不完整的,怎么能够理解这个复杂的体系呢?所以,知道相关性已经很不错了。
知道相关性后,对于我们建立新的理论体系也是重要的辅助甚至是决定性作用
6 分组之间的差异。随机性的不完美。有时候必须要分组讨论,有时候又必须做出随机样本。全面分析,正反兼顾。
7 书之外的内容。时间才是读者付出的最大阅读成本。
选择花费的时间加阅读花费的时间加误读花费的时间等于阅读的时间成本
8 读书方法 回想 笔记 PPT