3.1 人是如何“理解”的?
Length: • 1 min
Annotated by Harry

本书把学习分为从输入到输出的5个主要环节。“输入”、“输出”并非我们的日常词汇,为什么不说“阅读”说“输入”?为什么不说“表达”说“输出”?

“输入”和“输出”这两个词汇是从计算机学科借来了。在学习观3.0阶段,科学家把人脑视作计算机,很自然地就把“输入”、“输出”这样的计算机词汇引入到对人类学习的理论中。人类的学习和认知活动非常庞杂,学习无处不在无时不在,而这两个词汇很精炼地总括了人类学习的两个重要环节。
到了学习观4.0 阶段,人们对大脑的比喻从计算机升级到了神经网络,输入输出这样的词汇不但没有过时,反而更加重要了。现在,以GPT模型为代表的深度神经网络,把海量数据“输入”和生成范式的“输出”做到了极致。但是,输入的数据在一层一层的神经网络中如何被加工处理的?目前还无法解释,没有科学层面的细节过程和理论解释。
深度学习是“端到端”的(end to end):GPT模型的数据输入是已知的,GPT模型的生成输出是看得见的。但是,GPT的上亿神经元(节点、node)、上万亿突触联结(参数)是如何加工处理这些信息的,我们是如何得到高质量输出的?一片漆黑,完全不知道。所以,科学家们把深度神经网络的中间处理过程成为“黑盒子”,认知的黑盒子。
在人类科技发展的过程中,技术实践领先于科学理论是很正常的。这是科学探索的动力之一,去解释世界,更好地服务工程技术改造世界的实践。GPT模型作为工程和技术层面的巨大创新,目前还没有科学原理层面的精确解释,主要是因为大脑、智能可能是宇宙中最神秘最复杂最深刻的问题。而认知科学家们多年来,一刻也没有停止对这些问题的思考和探索。
同理,人脑的认知过程和GPT模型内部的认知过程一样,都是神经网络在加工处理信息。人脑的输入和输出也都是看得见的。在输入和输出环节的问题好识别,病根好定位。
输入环节:你的信息流质量如何?单条信息好坏?信息构成如何?读书如何?知识类输入有多少?娱乐类输入有多少?一年阅读几百万字?英文阅读如何?是否每天阅读?
输出环节:你是否有输出性质的活动?你在解释世界、解决问题上的行动输出如何?你会写作吗?写了多少?口头表达如何?平时有费曼吗?考试成绩如何?行动输出如何?
但是,我们对人类学习的理解不能停留在黑盒状态,不能停留在“端到端”层面。如果教育行业的供给侧满足于“灯下黑”的状态(看起来点灯了,实际上没照亮),停留在操作层面而忽视原理层面,“黑盒子”里面学习和教育,很容易就长出“教培”这样的怪胎。
对于人脑神经网络的学习,输入和输出的中间过程是什么?如果人的理解、知识体系构建、记忆内化永远保持在一个个黑盒子的状态,没有人去构建关于这些问题的整体性解释框架,人人都在学习,人人不理解学习,这种“灯下黑”实在是操蛋的。
本篇就是要解决这个问题。
我们都知道“四年级现象”:孩子入学前几年似乎学的都挺好,甚至很多孩子都能拿到“双百分”,但是,到了四年级之后,成绩忽然掉队了,学习忽然跟不上了。
这是为什么呢?为什么到四年级突然就“不理解”了?
孩子的“四年级现象”,根本原因就是学习者对知识的理解能力跟不上了。但这种“理解不足症”并非局限于孩子,成年人也同样如此:面对同样的社会现象和问题,网络上吵成一团,存在截然相反的理解,甚至很多明显错误的观点都有大批成年人坚信不疑。这也属于成年人版本的“四年级现象”。
四年级掉队的原因并不复杂:1-3年级,孩子学的是读写和算术等基本技能,对理解的要求很低。4年级有一个关键转变:从读写技能到理解能力的转变,从“learn to read”到“read to learn”的转变。四年级之后,孩子必须“真正阅读”了,必须开始”阅读理解“了,对于很多孩子来说,阅读理解就是一个过高的要求,一个难以克服的学习困难。
在这个困境中,孩子不理解自己为什么不理解,老师虽然一直重复强调“你要理解啊你不要死记硬背啊”但是事实上也不知道怎么教会孩子如何理解,家长就更不知道理解是怎么回事啦(家长也挺可怜的,小时候没被教会理解,长大后辛苦打工,下班回来累的半死,怎么能要求家长会老师都教不会的东西呢)。
于是,四年级之后,人们,包括成年人和小孩,包括老师、学生和家长,都慢慢走进并迷失在那些习以为常的“词汇迷雾”中:学习、记忆、问题解决、认知、思维、知识、思考、逻辑、推理、理解......
这些词汇迷雾的本质是对学习和教育领域的重要概念不清楚。概念不清,脑子就雾蒙蒙。我大致梳理了一下相关问题:
认知类问题:什么是认知?认知与知识的区别是什么?认知和知识哪个才是关键?人类有哪些认知能力,相互关系是什么?人类是如何认知的?认知可以升级可以跃迁吗?认知可以觉醒可以折叠吗?
理解类问题:什么是理解?人是如何理解的?什么是推理?什么是逻辑思维?理解与逻辑推理的关系?人对知识的深度理解是靠逻辑思维还是靠别的什么东西?
记忆类问题:什么是记忆?人如何记忆?什么是知识?记忆与知识的关系是什么?记忆与学习的关系是什么?记忆能力是否重要?有多重要?GPT 时代,还需要记忆吗?
陷入词汇迷雾,根本原因在于认知的黑盒子
学习和教育中的“词汇迷雾”,根本原因就在于人的认知过程对于不少人来说属于“黑盒”状态。分不清这些概念,不理解学习和理解是怎么回事。因为对这一领域的“无知”,所以导致愚昧和轻信教培,才逐渐走入教育的迷途,给孩子造成了诸多伤害,给家庭造成了诸多焦虑和负担,给社会造成了诸多伤害。
斯蒂芬·金(Stephen King)是我和我老婆都特别喜欢的一个作家,虽然他是写恐怖小说的,但是他的作品中满满的都是对人性的洞察。他在 1980 年发表了一篇叫《迷雾》(the mist)的短篇小说,后来被改编成了非常成功的电影,里面的故事设定就很类似我们的教育现状。
小说中,一层神秘的雾气忽然笼罩了整个小镇,人们为了躲避这层不断压迫而来的迷雾,到处躲藏。一旦陷入迷雾中,人们就会被迷雾中隐藏的恐怖生物攻击和伤害。迷雾无法躲避,但是,穿过这层迷雾是多么困难的任务啊,人们不但要对抗雾中的怪物,还要面对人性中的恐惧和绝望。
当人们看不清世上的迷雾,悲剧就会发生。迷雾中隐藏着未知的恐惧,人们在迷雾中失去了方向,无法看清前行的道路。
现在人们对这些学习教育相关的词汇、概念的误解,就像斯蒂芬·金笔下的“迷雾”。在这层“词汇迷雾”中,人们对于学习、教育缺乏基本的认识,这种雾蒙蒙的状态导致了教育实践中的种种问题,比如应试教育的盛行、学生过重的学习压力和抑郁症流行、全社会被教培支配的白色恐怖、以及家长和教师的迷茫......
如何走出“词汇迷雾” ?3 个模型
如何走出教育的“词汇迷雾”?我们必须加深对基本概念的理解:学习、记忆、认知、思维、知识、思考、逻辑、推理、理解......
对此,我将通过3个模型,和你一起来捋一捋这些“习以为常”的词汇。
认知能力模型:什么是认知?
先说认知(cognition)。
当你不知道“什么是认知”、“人的认知能力是如何构成的”,你可能就会陷入“认知觉醒”、“认知折叠”这样的迷雾。
美国认知心理学家bloom 在 1956 年提出了一个基础的框架,把学习和教育领域的所有词汇(名词和动词)做了一个分类。我称之为“布鲁姆(教学目标)分类学”(bloom's taxonomy)。
生活在 AGI时代,我当然不可能机械沿用接近 70 年前的理论。我对此做了一定的调整和优化,迭代为小能熊版本的“认知能力模型”(a stairway model of cognition abilities),这是对bloom 分类学的一个改造升级,是小能熊对大脑认知能力的一个分级体系。
简单说,当我们谈“认知”时,我们在谈些什么?这个模型就是我在思考认知问题时使用的一个框架。
以“猫”为例
人的认知能力,从基础到中级再到高级,可以具体分为6种。除了基本解释之外,我用“猫”为例贯穿解释:
理解 understanding:对事实的理解,对知识、概念、思考的理解。在新知和已知之间,建立丰富、有意义的关联。例如,猫的主要特征是什么?如何区分猫和狗?
记忆 memorization:记住已经学过的信息。在有效学习中,记忆以理解为基础。理解之后,在脑子里真正留下的,就是记忆。例如,说出猫的3个品种。复述猫的演化历程。
应用 application:把学到的知识应用到新环境中,应用到实际环境中。例如,你队友养了一只猫,让你照顾几天。怎么照顾?
分析 analysis:化整为零,把主题和思想分解成更简单的部分,在idea 之间建立关联,发现证据并得出结论;包括:理性分析,知识性分析,经常表述为:分析型思维、批判性思维。
例如,你孩子8岁想要一只猫作为生日礼物,你担心她始乱终弃,只看到一时新鲜,但是后期不愿承担照顾动物的责任。你如何与她一起讨论这个愿望?帮助她做出兼顾理性思考和感性愿望的合理决策。
综合 synthesis:化零为整,对多学科多领域知识的综合处理,把思考模块整合成一个全新的整体,提出不同的解决方案;也包括对信息的评价:基于内部证据或外部标准,产生并维护自己的判断。
例如,研究这个主题:猫咪在世界各地神话中扮演的角色及其文化意义。
创造 creation:狭义的创造:产出新的、原创的成果;广义的创造:费曼输出,解释世界,解决问题;
例如,以《我和猫》为主题写一篇万字长文;以猫为主题,画一幅画,写一个游戏程序,编一个笑话。
认知是一个拾级而上的过程
说实话,我很讨厌“认知跃迁”这个概念:“跃迁”是量子力学的概念,是电子在能量层级上的跳跃。人的认知能力,人的脑子作为一个千亿神经元组成的庞大复杂网络,真的能像电子那样轻松“跃迁”吗?
而且,“cognitive leap”在世界文化与思想领域几乎就不存在,可怜的几个网络搜索结果都是要通过这个概念给你卖些什么。而在正式出版物中,这个概念几乎就不存在,与cognition 比起来,这个概念的存在是前者的约 2000 分之一。
google searchgoogle n-gram
说实话,我也不喜欢“认知觉醒”这个概念:二极管只有开和关两个状态,但是,人脑不是二极管,而是千亿神经元构成的复杂网络。二极管可以轻松“觉醒”,但是,神经网络要从“昏睡”状态改变到“觉醒”状态岂是容易的事情?脱离学习和做到对大脑的长期有效改造,轻松的“认知觉醒”更可能是一种觉醒的“幻觉”。
举一个不一定合适的例子:假如你找对象时遇到了一个人,这个人在原生家庭中在过去几十年的成长中被培养了一些不太好的习惯,例如不爱读书乱发脾气喜欢赌博。这样的人当然是可能“认知觉醒”的,但是这绝对不是一个轻松的过程,你如果选择他作为终身伴侣就必须做好心理准备。
至于“认知折叠”,更是一言难尽,懒得评价。把猫叫成个咪,宣布这是新知,带领大家一起跟他认知折叠,这已经不是语言的腐败了,而是思想的腐败,对人类思想的污染和投毒。
其实,人类的认知能力,就像一个爬台阶的拾级而上的过程:基础的认知能力是高级认知能力的基础,在终身学习的过程中,从基础能力开始培养,从基本的知识和概念逐渐激烈,然后能力不断增强,理解能力、抽象思考、逻辑思考的能力不断提升,最终发展出信息综合评价、跨学科跨领域整合的高级能力,能对现实世界通过自己的思考分析来解释问题,来解决问题。
虽然看起来朴实无华,但是日拱一卒,功不唐捐,最终却能实现丰富灿烂的创造。
深度理解模型:什么是理解?
谈完“认知”,来谈一谈“理解”。
学习、思考、逻辑推理、理解......这些词汇通常乱成一团,那么,直接上我整理后的模型吧。
我把这些概念的关系用一个“理解模型”来总结:
学习与思考的关系
有效的学习(learning),一定是基于思考(thinking)的,而非机械学习/机械记忆(rote memory)。
学习是一个广泛的、普遍的概念,包括信息的吸收和技能的培养,而思考,可以看作是学习中最有效的部分。所有的思考都是学习,但是并非所有的学习都涉及思考。机械记忆、简单重复,可能并不涉及深入的思考过程。
高效学习需要结合深度思考。思考不是一个被动的接收信息的过程,而是一个主动、深入和有时颇具挑战性的活动。通过深度思考,学习者能够更好地理解、记忆和应用所学知识,从而实现更全面和持久的学习效果。
思考是学习的主体,是有效学习的主要构成。
思考与理解的关系
我的结论:人类的思考,基于知识理解(understanding),而非逻辑推理(reasoning)。
所谓的逻辑,在思考中并非主体。真正占主体的是模式识别,是基于知识的理解性生成过程。模式识别就是大脑能够识别信息中的模式和结构。通过模式识别,个体形成概念,这些概念帮助我们将信息分类和理解。有效的理解,就是外部环境的新信息能够与长期记忆中已有的知识结构相整合,建立有意义的关联。
为什么本篇不以“逻辑思维”为中心?因为没用。不信的话,你去买一本逻辑类的书看一看,学完之后,看看你的理解能力是否会得到提升?或者去学习所谓的逻辑思维,看看能不能提升理解能力?
人类大脑神经网络的运作,更像是模式识别和生成。还是以“猫”为例,当你看到一只猫,你是通过“逻辑”来判断这只猫的吗(猫的定义是什么,特征是什么,眼前这只生物符合哪些猫特征,所以这是一只猫!),并不是。
思考的比喻 说到“思考”,人们经常想到“开动脑筋啊”,背后隐含的比喻是大脑就像一个机器齿轮组合,齿轮转动起来,脑筋就开动了,然后思考就发生了。
实际上,比齿轮更好的比喻是神经网络:思考的过程,是神经网络激活然后生成输出的过程,往往不是严密逻辑推理的产物。
关于推理
人类不擅长推理(推理在理解中所占比重没有人类以为的那么高,更多是知识及其关联,是知识生成),但是有些人喜欢神化逻辑思维,从而掩盖了知识理解的价值。所以,我们需要简单了解下“推理是什么”。
推理 (reasoning)可以分为逻辑推理和非逻辑推理。
演绎推理(deductive reasoning):从一般到特殊的推导过程。典型的就是苏格拉底的三段论:大前提+小前提=>结论。这是个严格的逻辑推导过程,前提没问题,就不会出现任何错误结论。例如,猫会死,大黄是只猫,大黄会死。
归纳推理(inductive Reasoning):从特殊到一般的推导过程,基于经验,比演绎推理的严格程度低很多,是可能出错的。例如,我看到的所有猫咪都是黄色的,所以猫是黄色的。事实并非如此。
类比推理(analogy):不严格的逻辑推理,基于相似性。逻辑上越不严格,大脑越轻松,也越容易出错。例如,一个人骂另一个人:大黄是一只喜欢偷肉吃的贼猫。我看你就像大黄,所以你就是破坏分子。
非逻辑推理就更轻松了:直觉(intuition)近乎拍脑袋,情感(emotion-based reasoning)就是 PUA 的“抓手”,而信仰和偏见驱动的推理(faith and bias-driven Reasoning)简直就是封建社会独裁者的愚民神器。互联网上遍地都是实例,无需我再举例说明。
推理属于思考,是思考的子集。但是,推理真的没你想的那么重要。别再追求逻辑思维了,人们需要破除对逻辑和思维的迷信。学习,最重要的是知识积累。看起来平淡普通,不够exciting,但这才是正道。
关于理解
“理解”(understanding)是一个面目模糊的词汇,是人们的日常词汇,而非科学词汇。
在认知心理学中,科学家们用“编码”(encoding)这个概念:大脑对信息的信息加工是信息编码的过程,形成短时记忆的痕迹。短时记忆经过有效的记忆巩固(consolidate),可以存储(store) 为大脑的长时记忆,在人脑认知过程中可以被有效提取(retrive),进一步整合和加工。
所以,在本篇章中,我会使用“编码”而非“理解”这个词汇。原因是人们谈到“理解”一词时,往往对“理解”这个词有着不同的理解,对“理解”缺乏定义、外延和内涵的思考。与其一起迷失在模糊词汇中,不如直接用一个清晰的科学词汇。如果不习惯,你可以把“理解”转换为“编码”一词。
编码的两大要义:知识砖块,知识关联。人脑加工处理信息的编码过程,其实就是提炼知识砖块,在新知和已知之间建立丰富有意义的知识关联的过程。此处是为了建立大局观,走出词汇迷雾,所以编码/理解的细节、框架、方法和落地,我在后面会详细深入解释。
简单说,理解,是深度思考。 而本篇的操作方法、费曼大法,则是深度理解的终极方法。
知识记忆模型:知识和记忆的关系是什么?
帮你走出教育迷雾的第三个模型,是关于知识和记忆的。
先谈“知识与记忆的关系”。人们经常把知识和记忆看成两个不相干的东西,但是,真的如此么吗?
所谓记忆,不过是思考之后在大脑里留下来的东西。
长短期记忆模型从记忆持续时间这个维度对记忆进行分类,把记忆分为感觉记忆、短时记忆和长时记忆。感觉记忆不过就是信息被注意到了,还未进行实质加工。而短时记忆则是信息被初步加工后,大脑神经元放电(没有形成物质层面的牢固的突触联结)之后留下的短暂痕迹。而长时记忆则是短时记忆被巩固后,神经元突触生成(基因表达、蛋白质合成、物质层面的大脑改变),信息在大脑中留下牢固、甚至永久的痕迹。
如果我们从理解维度对知识分类,可以把知识分为机械知识、浅层知识和深层知识。
脱离理解的机械学习,产生的只是机械记忆(rote memory)。我都不愿意称之为“知识”。小和尚念经,抄写100 遍,这些操作得到的所谓“知识”只不过是死的知识,就像在石头上刻字。这些知识只能在科举以及低级应试场景中运用,在真实的生活中根本不是力量所在。
浅层知识来自浅层理解,深层知识来自深度理解。一个人对一个事物的认识,都是由浅入深的。所以,不是说浅层知识不好,深层知识好。而是说,浅层知识就像一颗种子,一个小苗,长成大树,开花结果,就成了深层知识。
所谓知识,不过就是外部信息被大脑加工处理后变成自己的知识。不属于你的,不管多干货多有洞见,都只是“信息”。你死记硬背下来,也不过是死的“机械记忆”。而信息被主动加工、被理解之后,才是你的“知识”。浅层理解后得到的是浅层知识,深层加工深层理解后得到的是深层知识。知识以记忆的形式储存在大脑中。一个人在工作学习生活中能提取记忆、应用已知,就表现为这个人“有知识”。
记忆和知识,不过是同一个东西的不同视角,都是大脑对信息加工处理的产物。而理解的深度,决定知识的价值。
亲爱的读者,通过这3个模型,你是否已经走出了学习和教育的“词汇迷雾”?学习、记忆、认知、思维、知识、思考、逻辑、推理、理解......这些词汇,是否对你来说变得“面目清晰”了一些?
本篇内容的目标,是要从根本上回答并落地“人是如何理解的?”这个老大难问题。
整体方向非常简洁:要解决理解问题,一手抓知识砖块,一手抓知识关联。
仅此而已。
END -
小能熊科学学习
【闭门直播】如何顺利度过经济危机+GPT挑战?十年挑战过半时的复盘与行动方案 免费 savage解读《基因彩票》:自然彩票、个人命运与社会公平 免费
- 服务号
严肃、耐心、永不妥协