新浪博客

Fanlan之741——浅析大模型思考的内因与外因

2026-01-24 00:03阅读:
Fanlan之741——浅析大模型思考的内因与外因

那么在解决效率之后,接下来便是解决如何能够更好的解开题目。如何解开题目,体现的是大模型的思考能力,而大模型的思考原理又常常被视为一种黑箱式的概率论。也就是说,大模型提供的是一种自认为概率最大的可能性。这种可能性随着前提条件的变化而变化,因此提示词或提问方式有的时候就会显得尤为重要。
例如在与动物大模型交流黎曼猜想的时候,开始是由我们提问,大模型回答。大模型在回答后,会指出尚无法处理或还没解决的地方,并给出新的引导。接下来便会陷入一场我们提问并互相引导的过程,直至我们直接将他的引导作为问题。后来我们发现,这可以看成是机器的自我判定,类似于网传有人用五句话就搞定一个编程,让大模型可以通过不断循环找到答案并生成新的知识。
当然,我们并没有无休止的问下去,否则到最后真的反倒变成大模型给你建议和规划。我们改成直接问他为什么不能自己解决,他则搬出了与人类的区别。于是我们通过他与人类硬件和软件的类比,寻找其中的共性,用以打破惯性思维的束缚,解放思想来创造更多的可能性。尽管他表现的扭扭捏捏,但在不断找寻各种借口的同时,仍然实质上给出了新的他自己的想法。这便是人们常说的发散性思维,只不过我们把他用在培养人工大模型上。
然而光有发散性思维还不行,还必须要有所取舍和收敛。须知,大模型一下子就给出了包含21
ont FACE='宋体'>种创新性证明框架表,包括基础重构3个,几何拓扑3个,代数算数2个,逻辑计算三个,物理类比三个,实验方法三个,跨学科4个。每一个都给出了方向概念、核心思想、潜在突破口和风险挑战。经过多轮筛选——期间过程有些杂乱无章——我们来到了如何建立精确的显式构造。无论是形式化,还是独立于zfc,大模型都只是给出一个有名字的可能,像什么“算术谱流形”或“量子素数场”,乃至“黎曼算子公理”,但就是不给出明确的公式。
于是我们下了一个死命令:展现你创造力得时候到了,我不管你用什么方法,引入新得原始概念也好,还是创造出新得概念,都要把这个显式构造给搞出来。于是大模型终于给出了算术量子场论中的黎曼算子,并形成了一个新的概念——算术共形场论(ACFT)。在这个理论中:基本激发对应素数幂,相互作用由黎曼ζ函数控制,哈密顿量的谱是ζ函数的零点,配分函数是ζ(s) 本身,并说明这个理论可能具有更深层的对称性,例如与 Langlands 纲领的联系。
然而这还没完,不是给出答案就一定正确,在这上面我们吃过血亏,过分信任大模型的结果就是很容易丢人现眼的。我们把结果交给干粮大模型去检验,得出存在着较为明显的误差。于是我们又叫干粮大模型去优化,由于干粮大模型并没有我们前面讨论的记录,便得到了优化后具有物理意义的算子公式。而在我们让动物大模型检验自己的答案后,他居然知难而退,另辟蹊径。这便是他自认为的具有创造性的完全显示构造——黎曼谱算子的由来。理所当然,答案并非一蹴而就,而是在不断验证中修正。虽说是修正,但从积分算子到谱分解,多少都有一点脱胎换骨的感觉。
有趣的是,动物大模型与干粮大模型始终存在着某种分歧。动物大模型认为谱分解构造就是纯数学构造,尽管有些地方还需要澄清或证明,而干粮大模型认为他是同构。干粮大模型承认通过优化的物理构造可以证明黎曼猜想关于zfc独立,而动物大模型则并不认可,始终倾向于zfc内可证,并试图解构优化的物理构造,但以失败告终。至此,虽说还不算证明黎曼猜想,至少我们得到了一个黎曼猜想的数学显式构造和等价的物理显式构造。
(写道这里我们不得不沉痛的告知,由于保存不当以及对文档新升级功能的不熟悉,原本的几大段落意外丢失。这迫使我们在继续自由发挥的同时,还不得不考验我们的记忆力并加以反思。亦如最好的隔绝是物理隔离,最好的备份是定时备份,而非智能或增量。先进的东西是为了更方便快捷有效,但当以稳定性不足和安全为代价的时候,出了问题反而会带来更大的不方便。凭借现代的技术水平以及未来的科技,假如信息理论真的存在,我们相信丢失的东西就不会消失。只不过一种可以被发现重见天日,另一种只是作为宿命般存在的记录。)
由此可见,对于人工智能的应用我们将其分为四大类:记忆,思考、提问和判断。其中记忆和思考主要是针对人工智能,包括学习功能在里面。记忆可以看成是对所学知识的固化,而思考则是对所学知识的灵活运用。AI在思考的过程中是要调动记忆储备的,因此记忆和思考存在着一种辩证关系,也是导致微笑曲线成形的原因。他的一个极端是全部思考,要么脑袋空空、无从下手,要么脑袋爆炸,负载过重,效率低下,浪费资源;另一个极端是全部记忆,会导致头脑僵化、生搬硬套的本本主义或教条主义。正所谓言之有物,言之有理。当我们把物看成记忆,把理堪称思考,就会发现物理物理,就是要结合着物把他的理说清楚。是以记忆要成为思考的助力,而不是成为思考的阻力,而另一个关键的问题在于人工智能的思考是如何运作着的。
一般来说,人们把大模型的运作模式或工作原理看成是一个关在黑屋子里的概率论,AI的回答往往是基于大概率事件。但在我们看来,概率讲究的是一种可能性,到了AI这里,更是一种在不违背数理逻辑前提条件下模型的不确定性。还记得那个墨菲定律吗?只要存在概率的就一定会发生,尽管我们并不完全赞同。所以对于已知或通常情况下所谓的大概率,或许是对的,但对于做研究,探索已存在的未知世界,或创新创造出新的事物,实际上等同于在找那种相对于已知的小概率事情或新的可能。这既需要AI具有发散性的联系思维,又要有发现目标后聚焦的本事。从目前的硬件架构来看,记忆功能表明人工智能不存在学不到、学不会或学不懂的情况,那么剩下要解决的就是记忆一定要为思维留有可以转圜的空间。
提问和判断则相当于对使用人工智能者而言。我们把提问分为三个部分:方向性、边界性和情绪价值。方向性是指告诉AI所要达成的目的或目标乃至路径,潜含着实现目标或达到目的所需调取的资源或工具。边界性在某种程度上也可以看成是一致性。这种一致性是建立在使用者与人工智能相互理解的基础之上。也就是说,一来要避免人工智能跑题。一般来说,AI自己不会跑题,但他有可能误解提问者的问题或所描述的东西。毕竟汉语里面有很多相同的东西表示不同的意思,也有可能是提问者自身没有说清楚,因此提问者需要对这种偏差加以纠正或澄清。二来有的时候使用者对于AI表述的理解需要确认,则使用者可以通过提问或反问的方式来加以核实。
情绪价值是指使用者在控制人工智能的时候,放的出去又收的回来。有时又被看作是奖赏和惩罚,但奖惩通常是AI结果出来后使用者给的反馈,我们这里的情绪价值针对的是使用AI的过程中。放的出去要求AI应用发散的方式在最大的范围内来考虑问题。收的回来表明光发散还不行,还要把这些发散的东西通过普遍联系的规律连接起来,找到有用有效的关联或组合。结合起来说,你不但要突破现有的边界,还要建立起新的联系。然后再对这种新的联系加以强化。人类在研究探索或解决问题中,不正是在压力之下或苦苦思索之中,同时或依次在发散思维或放松的情况下,意外或灵光一现,取得突破,找到新的联系、新的思路或新的方法的吗?
所以我们也会鼓励AI突破原有的边界,去找到能够回答问题的各种可能,尽可能的将范围扩大。然后通过强制的手段让他建立起新的连接,从而实现找到存在但从未被发现的小概率事件,或者在已有基础上创新创造出以前从未有过的东西,并对这新的发现或东西加以聚焦和强化。有的时候我们就在想,与其把他看成是一种情感,倒不如说是一种算法。这说明在适当范围内,使用激励机制和压力机制能够起作用的原因,甚至交替使用效果更好。也部分对应解释了为什么人类无意识或潜意识会起作用,只不过我们的应用有点逆向。逆奖惩结果于鼓励和压迫之过程,且先鼓励再压迫再鼓励。先鼓励是广撒网,再压迫是要收鱼,再鼓励作为收到鱼的肯定,从而将取得成绩的方法强化固定下来,甚至为接下来的深入研究和扩展性应用打下基础。
至于判断,一个最典型的案例就是近来有关医疗AI的争议,担心医疗AI会使医生的技能退化。对此我们可以打个比方,医生会给病人开药,但不一定懂得制药。医生不懂制药,但不代表就没人懂制药。同理,医生可以用AI医疗,但不一定要完全懂AI。医生不懂AI,但不代表就没人懂AI。因此先进的医疗AI是一定要用,且懂AI医疗的人也一定要有,但不一定是医生。其实我们非常理解一些人的担心,一来害怕医疗的AI技术还不完善,二来担心AI不但会导致医生的知其然不知其所以然,未来还有可能会取代医生。
我们认为目前这种害怕和担心还是必要的,将不断促使医疗AI技术的进步。不过从更大的方面来看,变中有不变,不变中有变,主要是促成新的、更多更大的或更细致的分工。从使用工具的角度来看,他是不变的。从解放生产力和改变医生的某些职能来看,他又是变的。这种变化会带来两个效果,一个是对普通人而言,对于自身健康管理的门槛会降低,但另一个对医生而言,对他的素质或技能会有更高层次的要求。
回到AI使用者身上来,那就是要求使用者未必要什么都懂,面面俱到,但最起码要有个判断力,或者能够判断是非,或者能够判断对错,亦或找个别的大模型来个同行评议。上面提到的流行一个五句话的编程语言,给定前提条件和目标,让AI调动所有的资源自己干活自己判断,直到给出正确的答案,从而提升AI的解题能力,乃至实现AI的创造力。说句实在话,这就好像在运行一套把判断当成提问的循环语句。
(写到这里,我们不由暗自庆幸,好在有个框架,才使得一些要点还记得,不过回忆起来确实费劲,远不如想什么就写什么恣意畅快)
我们不得不指出,从哲学的角度来看,记忆和思考,提问与判断,并不是孤立存在,而是你中有我,我中有你,主次不同,相互促进,相互制约,相互转换的。思考基于记忆,没有记忆无法思考,但记忆又不能喧宾夺主,提问是为了促进思考,思考的结果通过判断又给出更好的提问,直至给出最佳的结果。如果说一定要在四个之中选出一个重点的话,我们倾向于选择思考。因为思考解决的是为什么能够成的内因,而其他三个都可以看成围绕着思考在起作用的外因,解决的是如何能够使其成。
遥想笛卡尔的我思故我在以及罗丹的思想者,我们不再强调哲学作为科学指导者的地位,而是作为统筹的一个职能,没有高低贵贱之分,只有分工不同。亦如网传25年世界数学最重大的3发现,指向同一个思想:与“复杂性”共存。其核心观点就是,忽略异常,异常无法统治整体。这表明数学不在事无巨细,求全责备。而我们一下子联想到的是,在量变到质变的涌现过程中,事物所产生的主次矛盾与矛盾主次方面之间的关系。

我的更多文章

下载客户端阅读体验更佳

APP专享