
大数据时代知识的停止点_数据分析师考试
毫无疑问,信息超载作为一种生活方式,已经挟裹着众生的生活。戴维·温伯格《知识的边界》所尝试的,恰是在大数据时代,如何认知网络下的知识与科学。因为,不管确定“互联网+”,还是定义“互联网-”,都要面对今日“事实不再是事实”,而“专家随处可见”的现实。
显然需要理清思路,理性面对这一切。你要学会像戴维一样,冷静地打着比方,包括以转述的方式,向自己的见解缓步、轻松而去——
美国出版公司兰登书屋的创始人之一贝内特·瑟夫出版的一本书里就讲过这么个奇闻轶事:
一天,《哈波斯》杂志的卡斯·坎菲尔徳在编辑部接待一位长相甜美却个性坚决的妇女。这位女同胞很想讨论她自己正在创作的第一本小说。“一本小说应该是多长的篇幅?”她问道。
“这个问题没有确切的答案,”坎菲尔德解释道,“一些像《伊登·弗洛姆》这样的小说,大概只有4万字。而其他的小说,如《飘》,却可能达到30万字。”
“但,普通小说的平均长度大概是多少字?”妇女坚持问道。
“呃,我觉得大概是8万字吧。”坎菲尔德回答。
妇女跳了起来,并欢呼着。“感谢上帝!”她喊道。“我的小说完结了!”
戴维转述这则逸闻并不是让大家简单地笑上一笑。戴维想说的是,面对太多的信息而无法全部知道的事实,其实我们的战略一直是建立一个知识的停止点(stopping points)系统。这是个很有效的方法,很实用于保存和交流知识的纸质媒介。
戴维列举的另一伟大实例同样能说明问题。1836年,达尔文从“小猎犬号”航行归来,完成了将促进他进化论理论的观察。1838年,达尔文对自己的理论有了清晰的想法。1842年,他用铅笔写下了35页的“骨架”,但没有公开。1844年,他写了189页的手稿,没有公开,但指示妻子,如果他死了就将手稿出版。接下来的15年,他研究了藤壶,出版了8本书,生了9个孩子,并且经常和同事通信往来讨论。他还开始了实验科学。但他就是没有出版自己的进化论。他似乎在等着什么?有一天他收到了年轻的博物学家阿尔弗雷德·罗素·华莱士写来的一封信,此后华莱士又寄给了达尔文一份20页的文稿,里面提到的理论和达尔文的进化论基本相似。达尔文万分惊讶,他想成为这个理论的最早提出者,但不想欺骗华莱士,或者怕更为糟糕,让自己看起来是窃取了华莱士的观点。在听取两位亲密同事意见后,1858年7月,伦敦林奈学会安排宣读了华莱士的一篇文章,以及达尔文的两篇文章。林奈学会在自己的杂志上刊发这些文稿后,达尔文才开始在科学家圈内引起关注。这个鼓舞,让达尔文经过13个月的写作,完成了不朽的《物种起源》。达尔文和华莱士的故事,后世有多种解读。纸质出版模式静静地塑造了科学,这是一个例子。同时,那个停止点,格外清晰。
传统的知识是纸的意外产物。没有什么时候,我们对纸的认识这么明确过。纸上的知识,纸上的科学,曾经是一种出版的类型,它们经过层层过滤,才能在纸上“行走江湖”。但今天,纸质悄然换作网络。在此背景下,如有达尔文和华莱士的故事上演,恐怕要重新演绎,且绝不会如此安安静静,按部就班,起承转合。
能够明确的是,权威在网络化时代仍然会是一个停止点,但“权威已经不再是一个主要由有资质的人所构成、专门生产特级产品的特殊阶层了”。相反,权威更多地是由功能性来定义,如你的体验一般:权威是你在无数连接中访问的那个最后一个页面——是你决定不再继续去点击其他链接的那个页面。
正如戴维所打的比方一样:当知识变得网络化之后,房间里最聪明的那位,已经不是站在屋子前头给我们上课的那位,也不是房间里所有人的群体智慧。房间里最聪明的人,是房间本身:是容纳了其中所有的人与思想,并把他们与外界相联连的这个网。换句话说,互联网作为知识的基础设施,本身并不拥有创造知识的实体要件,知识不存在于书籍之中,也不存在于头脑之中,而是存在于网络本身。
以下事实正越来越清晰:传统的图书在表达观点的方式和呈现形态上,是将思想挤压到一条狭长的小径上,驱使读者沿着这条小径行进。网络化时代,从最为纯正的网络意义上,它的开放姿态,决定每个人都遭遇了网络所带来的心理颠覆——丰富性、链接、无需许可、公共性、未决性,但网络化的知识和科学,会让我们更加接近关于知识和科学的真理。但就在这浩若烟海之中,我们一样要找到知识的停止点,在心里给它个飞吻。
网络,如尼古拉斯·卡尔说的那样,重装了我们的大脑。在信息洪流之中,众生得以不必焦虑,并能轻松自在地在网络之上“笑傲江湖”的方式,或许是找到那一个个知识的停止点。从这个意义上,我们要再回看一下本文开始时戴维·温伯格转述的故事,大笑三声,一起释怀。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10