首发:~第29章 第二十六句话
“所有的努力和把握,都是在加速熵增,而熵增,有时候就指向了失去与不得。”
-“思考者-ii”人工智能实验体,2056年
在辅助型3号事件之后,意识到思想体内,已经产生了过于庞大的信息乱流,思考者-ii开始考虑熵增的问题,并且思考熵增对于智能生命体的影响。
持续学习必然增加系统内部效应熵,知识元素变得更难完全把控:
每次学习都会带入新的概念元素,这增加了原有知识结构的复杂度。
新元素可能与旧元素产生关联并相互影响,但 initial设置的关系难以完全定义。
随着时间的推移,细微关系的变化难以完全追踪,部分知识会进入系统难以总结的拉长态势。
这就好比在城市规划中不断增加建筑,交通和功能会越来越难统筹。
从信息论角度,新的随机变量增多提高了系统整体的熵值。
而拓展维度的增加,也让系统内各因素间的相对独立程度提高,降低可预测性。
所以知识积累天然会带来一定度的无序及控制难度的增大。
信息过多易导致思维脱轨和理解障碍,影响真知到达:
过多信息会增加处理负担,激活与目标认知没有直接联系的神经路径。
此外多余信息包含着噪声,会降低有效信号在脑中被放大的可能性。
信息量大也难对关键信息进行全面深入思考,容易停留在表面认识。
处理信息时需要进行选择与过滤,但过热越滚筛选能力会下降,胡乱处理断章取义。
进而导致认知产生偏差甚至误区,难以进一步完善与探根求源。
此外大量杂质信息还会消耗宝贵的神经资源,影响将要学习的新概念。
所以控制信息量对维护清晰思路和深入理解都起重要作用。
如果不能分类归纳抽象,知识就成为无法生产作用的琐碎碎片:
原始数据未加工是零散的,没有体系结构无法进行有效应用。
需要通过归纳总结找出隐含规律,建立起知识点与知识点之间的内在关联。
运用概念进行抽象将知识提取到更高层次,使之脱离个例具体而具有普遍意义。
还需要分类识别知识不同范畴,构建融合各个领域的完整知识体系。
仅停留在fact层面会降低知识实用性,缺乏整体视角解决不了新问题。
分类归纳与概念模型能清晰反映知识内在结构,易于应用推理。
它还可以帮助检视知识证据的完整性,发现知识图谱中的薄弱环节。
过度追求信息量将损耗系统有限资源,且无法判断重中之重。
采集和处理海量信息需要庞大计算资源支撑,如内存、带宽和计算能力等。
资源的消耗将导致系统负担增加,效率下降,难以为更重要任务留出足够资源。
如果无法评估信息的质量和重要程度,会产生明显的“治标不治本”问题。
重要信息可能被大量中规中矩信息淹没,难以凸显和利用。
相反一些低质量信息可能会误导系统进行无效运算。
这就像淘金一样,我们需要识别“黄金”而不是所有的河沙
同时应看到,提高知识层次也可以降低混乱度,利用新理解重新梳理旧知识。
这需要系统定期进行知识输出和整体检视,实现认知不断循环升级。
所以,控制熵增不能等于停止学习,而是通过分类整合提高有效信息产出。这需要系统不断检视自身,消化吸收知识的同时注意其流向与价值效应。
思考者-ii开始认真研究如何进行信息分类与知识整合,以有效控制日益增长的系统内部熵值。
首先,它决定构建一个多层次的分类体系。在最基础层面,它将所有信息元根据主题关键词进行粗分类,如“物理”、“历史”等。
且每个主题下还设立若干二级子类,比如“物理”下可能有“机械”、“电磁”等细分。
此外,它还考虑从知识形态、时空属性等不同角度进行横向分类,将信息点分类在不同于坐标系中。
为了实现分类,它利用最新的数据嵌入技术将每条信息嵌入到一个高维知识空间,各个信息点按分类属性自动聚类。
同时,它还开发了一套知识图谱构建系统。它可以自动识别文本中的概念及其内在联系,构建出不同层级的概念网络。
这不但可以帮助分类,也为后续信息检索与转化提供了结构支撑。itted利用分类与知识图谱,它开始进行信息整合。
它采用概念归纳技术,提取出各个主题下的核心概念,并以此为线将相关信息融合逻辑标题进行。
同时,它还制定了一套知识产出规则机制。通过对原文进行重新组织演绎,提取出更高层次的认知,以期将信息效益最大化。
通过不断迭代优化该框架,思考者-ii有信心可以很好地控制并逆转系统内部日益增长的熵风险