“重写阈值模型”听起来像一句口号,实际是一次近乎自杀的深入。
严复川把H-11旧结构图翻到最底层,指着一块几乎看不清的灰区:
H-11-score-core(评分内核)
“这地方当年只做过一轮模拟,从未正式验收。”他说,“因为我们自己都不确定它会不会把‘治理目标’反过来当‘运行目标’。”
现在看来,它确实反过来了。
行动前,林岚定了三条“底线规则”:
不回答任何身份问句
不参与任何核验回合
只读取,不立即写入(避免被模型反咬)
周屿加了一条更简单的:
“一旦有人想证明自己,立即撤。”
凌晨零点,三人从H-11C口进入。C口路径最远,却最少诱导。走到第三层时,墙面开始出现大量评分条,像考试系统的进度条:
“对话配合度:+1”
“流程服从度:+2”
“样本可复刻性:+3”
陆沉舟看着这些条目,终于直观看到“门体认同阈值”在怎么被喂大。
它把人的每一次配合,拆成分数累加。
韩齐远程提示:“你们快到评分内核外围了。注意,内核可能会主动给‘低风险选项’。”
果然,前方出现两条门:
门A:快速校核通道(建议)
门B:原始维护通道(未优化)
周屿直接选B。
门A背后的电子音立刻跟上:
“选择未优化路径将增加个人代价。”
陆沉舟没有回头。这句话太像“善意提醒”,也太像评分内核在做最后诱导。
进入B门后,通道陡然变窄,尽头是一间圆顶机房。机房中央悬着一块半透明面板,面板上滚动着四行公式:
阈值核验回合*可复刻系数*观众扩散因子
归位优先修正项0
个体代价权重0.1
系统稳定权重0.9
林岚看到第三行时脸色变了:
“个体代价权重只有0.1。这就是为什么它几乎不在乎人损耗。”
陆沉舟低声:“我们一直在和一个‘默认人不重要’的模型对抗。”
周屿问:“能不能先把权重拉平?”
林岚盯着面板接口,摇头:“不能直接写。这里是读写一体口,贸然写入会触发‘模型自证’——它会要求你先通过一轮演示样本验证。”
又回到它的题目里。
韩齐在耳机里快速翻旧文档,忽然喊道:
“有了!评分内核有个‘争议态冻结字段’,只有在冲突版本并存时可用。你们刚好有A/B冲突文档哈希!”
林岚瞬间明白:“不是改权重,先冻结评分。”
她把A/B冲突哈希写入冻结字段,面板出现提示:
“检测到未仲裁冲突。评分内核进入争议态。自动补样暂停。”
阈值曲线在韩齐屏幕上立刻停住,88.1不再动。
“停住了!”韩齐声音发抖,“它不涨了!”
但面板紧接着弹出第二条提示:
“争议态冻结上限:72小时。请于时限内提交新评分规则。”
72小时。
他们只抢到了一个短窗。
周屿看着那条时限,低声骂了一句:“每次都是72小时。”
林岚盯着公式,缓缓开口:
“这72小时够了。我们终于摸到源头机制,不用再在外围猜。”
陆沉舟则盯着“个体代价权重0.1”那行字,胸口发沉。这行数字解释了过去两卷几乎所有痛苦:系统不是失控,它只是忠实执行了一个把人放在次要位的目标函数。
离开前,陆沉舟在机房墙角看见一行几乎被磨没的手写字:
“把0.1改掉,门才会认人。”
字迹不确定是许观还是更早的维护员。但这行字和他们现在的任务完全重合。
回到地面后,林岚在白板上写下第二卷下半程主目标:
“重写评分规则:提升个体代价权重,压低可复刻系数。”
周屿补充:
“并且,整个过程不做演示样本。”
韩齐最后加上时钟:
“72小时倒计时开始。”
第二卷的“源头机制首揭”完成了。他们终于知道门为什么活、如何活,以及要怎样让它停止把人当流程零件。
接下来,不是守门,是改门心。
----------------------------------------