动词是山峰,名词是平原

发布时间:2026/6/19 11:02:38
动词是山峰,名词是平原 动词是山峰名词是平原小模型认知机制的核心在于语义空间的分辨率差异。对于参数规模有限的模型动词优先于名词因为动词能在语义空间中形成高耸的山峰而名词只是平坦的浅滩。将语义空间想象为地形图动词如read、delete作为动作的引擎在预训练中与海量代码和指令强关联语义信号极为强烈能使模型的注意力精准锚定方向名词如file、data作为实体本身不包含方向性在低分辨率下模型看到的只是一片语义平原难以判断如何处理它。这种分辨率不足对应到注意力权重的分配精度和激活强度动词优先时注意力锚点明确模型第一眼锁定动作形成陡峭的语义势差强制向执行轨迹滑行否定处理也更易识别名词优先时信号稀释模型需在平原上寻找动词极易产生幻觉且Few-shot学习效率远低于动词优先的模式。从入度-出度和概念是关系的交汇点的图论视角审视这种差异更加深刻。在语义网络中名词如file的入度极高被数十个动词指向是汇聚型节点但出度低自身很少主动关联其他概念动词如read的入度低出度却高强烈指向宾语、状语等是分发型节点。面对高入度的名词模型相当于站在多岔路口注意力被数十条候选方向平均摊薄形成平坦地形高出度的动词相当于单向坡道方向天然向下注意力无需选择便能沿最强边滑行形成高耸地形。名词作为关系的交汇点恰恰因为汇聚了所有可能方向而导致语义熵增选择困难注意力分散动词则因方向性一致、分布集中与用户意图直接对齐形成强方向性势场从而高效集中注意力。进一步而言动词优先策略本质上是在为小模型构造一个源点主导的树型子图绕过名词作为高介数中心性节点所需的复杂工作记忆。图论中名词通常担任理解层与操作层之间的桥梁具有高介数中心性需要维护多路径的上下文状态这对1.5B级模型的容量构成严峻挑战动词优先则让模型直接从源点出发跳过枢纽通过语法约束直接连接目标。理想的原语应具备高出度与入度的比值且出度约束极强——例如read_file这样的复合词将动词的出度锁定为1仅指向文件同时入度也被锁定形成伪装的出度为1的源点。相反file_read或file_前缀将动词重新名词化使汇点效应重现应当避免而诸如get_file虽保持源点特性但do类泛动词约束较弱最优选择仍是具体动词加具体名词的组合。综上小模型的认知地形本质上是语义有向图的低分辨率投影。名词作为高入度汇点投影后坍缩为平坦的语义平原动词作为高出度源点投影后保持为高耸的语义山峰。Prompt工程的核心策略并非让模型理解概念而是让模型找到语义网络中出度最高、方向最明确的节点作为锚点拒绝让模型在平原上寻找路径而是为它指定一座山峰使其只能沿山脊下滑——下滑的终点便是答案。这一原则可正式化为小模型的命名设计应优先选择语义网络中出度与入度比值最大的词作为位置锚点由于动词的比值通常远高于名词因此verb_noun的命名规范不仅是语法习惯更是利用模型有限分辨率将关键动作意图信号无损放大、锚定在注意力最敏感起始位置的核心工程手段。