每日AI&科技快讯 (2026年6月18日)

今天从 arXiv 精选了 8 篇值得关注的 AI/ML 论文，涵盖多模态推理、时序问答、模型自我修正、安全攻防、软件工程自动化以及人机信任等多个前沿方向。

1. 先看后思：解耦感知与推理，构建抗捷径的多模态自蒸馏框架

作者: Sihan Wang, Xiyao Liu, Lianqing Liu, Zhi Han | 分类: cs.LG, cs.CV 链接: arxiv.org/abs/2606.19120v1

在线策略自蒸馏（OPSD）让模型基于自身采样进行训练，并利用冻结副本提供密集的令牌级目标。该方法在纯文本LLM推理中表现良好，但直接扩展到多模态大模型（MLLM）会产生捷径：特权的参考教师可能会主要基于文本参考目标引导令牌，而忽略图像信息。为此，我们提出ViGOS，一种视觉导向的多模态自蒸馏框架。学生模型首先撰写视觉描述，再推理最终答案。对于有效轨迹，图像专用感知教师监督描述生成，而特权推理教师则负责监督推理过程与最终答案。无效轨迹则使用参考教师恢复输出格式。在通用视觉语言、专家推理、视觉数学、空间定位及视觉语言先验等基准测试中，ViGOS在保留OPSD主要优势的同时，显著改善了易出现捷径场景下的图像导向行为。

点评: 这篇论文精准地指出了多模态蒸馏中的“文本主导”陷阱，其“先写视觉描述”的思路简单有效，为MLLM后训练提供了新的范式参考。

2. 超越分词：面向时序问答的直接时间步嵌入与对比对齐

作者: Yafeng Wu, Huu Hiep Nguyen, Thin Nguyen, Hung Le | 分类: cs.CL, cs.AI 链接: arxiv.org/abs/2606.18986v1

近期LLM的发展催生了时序问答（TSQA），将时序分析转化为自然语言问答。然而，直接将原始数值序列喂给LLM存在分词瓶颈：BPE分词将连续数值打散成不稳定的令牌，其嵌入缺乏有意义的度量结构，导致数值量级、尺度和趋势信息的丢失。先前的方法使用基于分块的编码器，将序列分割为固定窗口，这锁定了单一粒度并破坏了完整模式。为此，我们提出CADE框架，其核心是直接时间步嵌入与语义对齐。该框架通过逐点线性编码器和MLP投影器将每个时间步直接映射到LLM嵌入空间，保留了精确的索引级访问，无需分块和填充。同时，我们引入一种新的单向监督对比损失，将时间序列嵌入与冻结的类名文本锚点对齐。在Time-MQA基准上的实验表明，我们的框架在六个TSQA任务上均取得了一致性的性能提升，超越了开源和专有LLM基线。

点评: 该工作直击LLM处理数值数据的核心痛点——分词带来的信息损失。直接嵌入时间步的思路更符合时序数据的连续性本质，有望成为时序分析的基础性改进。

3. 重思奖励监督：基于评分标准的条件式自蒸馏

作者: Siyi Gu, Jialin Chen, Sophia Zhou, Arman Cohan, Rex Ying | 分类: cs.AI, cs.CL 链接: arxiv/abs/2606.19327v1

推理语言模型的后训练通常由监督蒸馏和基于可验证奖励的强化学习驱动。蒸馏依赖于昂贵且可能嘈杂或不完整的思维链标注；而强化学习的标量奖励信号则掩盖了具体改进方向。我们提出基于评分标准的条件式自蒸馏，将评分标准（rubrics）作为结构化的细粒度反馈引入在线策略自蒸馏。该方法让教师模型基于评分标准提供令牌级指导，而非仅依赖单一参考答案。评分标准明确了强响应应满足的条件，相较于标量奖励优化，实现了更细粒度的信用分配。我们通过两阶段流程实现该框架：先生成任务专用评分标准，再训练评分标准引导的推理器。在科学推理基准套件上的评估表明，该方法平均超越GRPO 1.0个百分点，超越OPSD 0.9个百分点。

点评: 用结构化的评分标准替代单一标签或标量奖励，是强化学习奖励信号设计的重大进步。它为复杂推理任务的信用分配提供了更加精细和可解释的方案。

4. 原生主动感知即推理：面向全模态理解的智能体

作者: Zhenghao Xing, Ruiyang Xu, Yuxuan Wang, Jinzheng He, Ziyang Ma 等 | 分类: cs.CV, cs.CL, cs.SD 链接: arxiv/abs/2606.19341v1

长视频理解的被动模型通常采用“全看一遍”的范式，无论查询难度如何都统一处理所有帧，导致计算成本随视频时长增长。我们提出OmniAgent，首个原生的全模态智能体，将视频理解形式化为基于POMDP的迭代式“观察-思考-行动”循环。OmniAgent按需执行动作，选择性提取视听线索并存入持久的文本记忆，有效地将推理复杂度与原始视频时长解耦。我们引入了智能体监督微调与基于TAURA（回合感知自适应不确定性重缩放优势）的智能体强化学习。关键在于，OmniAgent展现出正面的测试时扩展：性能随着推理回合数的增加而提升。在十个基准（如VideoMME、LVBench）上，OmniAgent在开源模型中取得了最先进水平。值得注意的是，在LVBench上，其7B模型超越了10倍大的Qwen2.5-VL-72B（50.5% vs 47.3%）。

点评: 突破了“全看一遍”的长视频处理范式，将主动感知与推理深度结合。7B模型超越72B大模型的结果，充分证明了“精挑细选”的主动策略在效率与效果上的巨大潜力。

5. 量化与审计：基于正例-未标注学习的LLM评估

作者: Zilong Zhang, Yi-Ting Hung, Lei Ding, Chi-Kuang Yeh | 分类: stat.ML, cs.LG, stat.CO, stat.ME 链接: arxiv/abs/2606.19057v1

LLM作为评判员（LLM-as-a-Judge）被广泛用于可扩展评估，但这些系统存在与语义质量脱节的系统性偏差，最典型的是冗长偏差。同时，人工监督成本高昂且通常是选择性的，这使得可靠的正面判断有限，大量输出未标注且质量参差不齐。我们将选择性人工监督下的LLM评估问题形式化为正例-未标注学习问题，并提出基于部分最优传输的几何审计框架。通过在固定嵌入空间中，将一小批人工验证的正样本与未标注输出中的可靠子集进行对齐，我们的方法能够识别符合人类偏好的偏好，并在无需重训练的情况下纠正有偏差的评判员。实验表明，该方法提升了与人类偏好的一致性，增强了对呈现偏差的鲁棒性，并提供了可解释的置信度估计。

点评: 为“以AI评AI”的可信度问题提供了一个严谨且低成本的解决方案。利用少量人工标注即可系统性纠正LLM评判员的系统性偏见，实用性极强。

6. OpenAnt：通过代码分解、对抗验证与动态测试实现LLM驱动的漏洞发现

作者: Nahum Korda, Gadi Evron | 分类: cs.CR, cs.LG 链接: arxiv/abs/2606.19149v1

在大型代码库中自动化漏洞发现仍然充满挑战。我们提出OpenAnt，一个开源漏洞发现系统，它将静态程序分析与基于LLM的推理整合到多阶段流程中。OpenAnt引入三项关键技术：首先，将代码库分解为基于外部入口点可达性过滤的自包含分析单元，将分析面缩减高达97%的同时保留攻击相关代码。其次，候选漏洞通过对抗验证，即受约束的攻击者模拟，来评估在现实攻击能力下的可利用性。最后，发现结果通过动态验证进行确认：自动生成利用环境，在沙箱容器中执行并随后丢弃。在OpenSSL、WordPress和Flowise等广泛使用的开源项目上的评估表明，该架构能够发现先前未知的漏洞，同时保持可控的分析成本并大幅减少误报。OpenAnt已在Apache 2.0许可下开源。

点评: 将LLM的语义理解能力与传统安全分析工具（静态分析、fuzzing）有机结合，形成了一个“发现-验证-确认”的闭环。97%的代码面缩减率展示了该方案在效率上的巨大优势。

7. CAPRA：利用多智能体LLM系统扩展软件架构交付物的反馈

作者: Marco Becattini, Niccolò Caselli, Matteo Minin, Roberto Verdecchia, Enrico Vicario | 分类: cs.SE, cs.AI 链接: arxiv/abs/2606.18976v1

软件工程教育中的自动化评估在代码评分和论文评分方面取得了显著进展，但软件架构交付物的评审——需要分析结构完整性和需求可追溯性——尚未完全自动化。本文提出CAPRA（可配置架构能力报告评估），一个多智能体LLM系统，用于分析软件架构交付物并生成个性化的、模板合规的LaTeX反馈。CAPRA协调多个专门智能体，使用基于PyMuPDF和视觉LLM的多模态文档提取微服务来解析文本和UML图。为确保教育可靠性并减轻幻觉，CAPRA引入了基于归一化Levenshtein距离的模糊匹配的确定性证据锚定步骤，以及交叉验证、去重与合并发现的ConsistencyManager智能体。初步实证评估显示，CAPRA满足了88.8%的评价标准，与人类评估者达到了中等一致性。

点评: 将LLM应用于软件架构评审这一高难度任务，其多智能体协作+确定性验证的设计思路，为LLM在教育领域的可靠应用树立了良好典范。

8. 纠正自己，维系信任：自我修正与社会连接如何塑造社交聊天机器人的可信度

作者: Biswadeep Sen, Yi-Chieh Lee | 分类: cs.HC, cs.AI, cs.CY 链接: arxiv/abs/2606.19286v1

当社交聊天机器人犯错时，其恢复策略决定了用户是否会再次信任它们。我们进行了一项受试者间实验（N=120），比较三种纠错策略：网页撤稿、同一社交聊天机器人的自我修正，以及专家聊天机器人的修正。结果揭示了两个关键发现：第一，所有三种策略都能同样有效地纠正错误，但只有自我修正不会损害聊天机器人的可信度：参与者对自我修正的聊天机器人的可信度和专业度评价显著高于由外部来源修正错误的机器人。第二，用户与聊天机器人的社会连接强度（通过社交吸引力和自我表露测量）能显著预测信念改变的程度，但这仅在机器人自我修正时成立。将修正外包给外部来源会完全切断这一联系。这些发现表明，社交聊天机器人应自行修正错误，而投资于社会连接是一种功能机制，能够放大修正效果。

点评: 一篇极具洞察力的人机交互研究。它揭示了用户信任的微妙心理：犯错的AI并不可怕，可怕的是“承认错误的AI”不是“你自己”。自我修正能维系甚至增强信任，这为聊天机器人的错误恢复策略设计提供了直接指导。

本内容由 AI 辅助生成，论文信息来源于 arXiv。

今日AI&科技快讯 (2026-06-18)