Detecting Contextual Hallucinations in LLMs with Frequency-Aware Attention (ICML 2026) 2026-05-06 #深度学习 #大模型
SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks NeurIPS 2023 (spotlight) 2026-04-25 #深度学习 #大模型
2026年-腾讯游戏-第十一届游戏安全技术竞赛-比赛笔记 进了决赛,可惜折戟决赛,未能获得名次。 由于手头GPU不足,故采用了一些方法去减轻GPU的沉重负担,比如GBDT蒸馏LLM,比如小模型打草稿大模型来润色的思路。 也不知道决赛会不会因为使用了树模型和非完整end to end生成式训练而被“一票否决”。 2026-04-24 #笔记 #深度学习 #大模型
Do Not Waste Your Rollouts: Recycling Search Experience for Efficient Test-Time Scaling (arxiv 2026) 2026-04-23 #深度学习 #大模型
SPECULATIVE RAG: ENHANCING RETRIEVAL AUGMENTED GENERATION THROUGH DRAFTING (ICLR 2025) 2026-04-22 #深度学习 #大模型
HALO Raphael Pisoni 提出的一种名为 HALO (Hyperspherical Alignment & Latent Optimization, 超球面界定与潜在优化) 的全新损失函数。 该算法的提出旨在解决现代神经网络分类器存在的“盲目自信”和“幻觉”问题,通过重构潜在空间(Latent Space)的几何结构,使得模型在保持高准确率的同时,具备强大的“分布外(OOD)检测”能力 2026-04-21 #深度学习
DYNAMIC MULTIMODAL ACTIVATION STEERING FOR HALLUCINATION MITIGATION IN LARGE VISION-LANGUAGE MODELS (ICLR 2026) 2026-04-15 #深度学习 #多模态 #大模型
Seeing Far and Clearly: Mitigating Hallucinations in MLLMs with Attention Causal Decoding (CVPR 2025 ORAL) 2026-04-13 #深度学习 #多模态 #大模型