Bear
  • 首页
  • 目录
  • 标签
  • latex识别
  • 每日arxiv
  • 关于
顽石从未成金,仍愿场上留足印。

Detecting Contextual Hallucinations in LLMs with Frequency-Aware Attention

(ICML 2026)
2026-05-06
#深度学习 #大模型

SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks

NeurIPS 2023 (spotlight)
2026-04-25
#深度学习 #大模型

2026年-腾讯游戏-第十一届游戏安全技术竞赛-比赛笔记

进了决赛,可惜折戟决赛,未能获得名次。 由于手头GPU不足,故采用了一些方法去减轻GPU的沉重负担,比如GBDT蒸馏LLM,比如小模型打草稿大模型来润色的思路。 也不知道决赛会不会因为使用了树模型和非完整end to end生成式训练而被“一票否决”。
2026-04-24
#笔记 #深度学习 #大模型

Do Not Waste Your Rollouts: Recycling Search Experience for Efficient Test-Time Scaling

(arxiv 2026)
2026-04-23
#深度学习 #大模型

SPECULATIVE RAG: ENHANCING RETRIEVAL AUGMENTED GENERATION THROUGH DRAFTING

(ICLR 2025)
2026-04-22
#深度学习 #大模型

HALO

Raphael Pisoni 提出的一种名为 HALO (Hyperspherical Alignment & Latent Optimization, 超球面界定与潜在优化) 的全新损失函数。 该算法的提出旨在解决现代神经网络分类器存在的“盲目自信”和“幻觉”问题,通过重构潜在空间(Latent Space)的几何结构,使得模型在保持高准确率的同时,具备强大的“分布外(OOD)检测”能力
2026-04-21
#深度学习

Vision Transformers Need More Than Registers

(CVPR 2026)
2026-04-17
#深度学习 #多模态 #大模型

DYNAMIC MULTIMODAL ACTIVATION STEERING FOR HALLUCINATION MITIGATION IN LARGE VISION-LANGUAGE MODELS

(ICLR 2026)
2026-04-15
#深度学习 #多模态 #大模型

Seeing Far and Clearly: Mitigating Hallucinations in MLLMs with Attention Causal Decoding

(CVPR 2025 ORAL)
2026-04-13
#深度学习 #多模态 #大模型

CAN HETEROGENEOUS LANGUAGE MODELS BE FUSED?

(arxiv 2026)
2026-04-12
#深度学习 #大模型
123…35

搜索

LJX Hexo
博客已经运行 天