new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Jan 12

Submitted by

xiaochonglinghu

Thinking with Map: Reinforced Parallel Map-Augmented Agent for Geolocalization

alibaba-inc

Submitted by

menik1126

MMFormalizer: Multimodal Autoformalization in the Wild

·
14 authors

Submitted by

eldad929

CaricatureGS: Exaggerating 3D Gaussian Splatting Faces With Gaussian Curvature

Technion

Technion Israel institute of technology

2

Submitted by

LightChen2333

The Molecular Structure of Thought: Mapping the Topology of Long Chain-of-Thought Reasoning

ByteDance

2

Submitted by

NeoZ123

Chaining the Evidence: Robust Reinforcement Learning for Deep Search Agents with Citation-Aware Rubric Rewards

zai-org

Z.ai

Submitted by

zhangboguodong

EnvScaler: Scaling Tool-Interactive Environments for LLM Agent via Programmatic Synthesis

·
6 authors

Submitted by

thenlper

Qwen3-VL-Embedding and Qwen3-VL-Reranker: A Unified Framework for State-of-the-Art Multimodal Retrieval and Ranking

Qwen

Qwen

Submitted by

Ningyu

Can We Predict Before Executing Machine Learning Agents?

antgroup

Submitted by

XingweiT

An Empirical Study on Preference Tuning Generalization and Diversity Under Domain Shift

·
3 authors

Submitted by

langfeng01

AgentOCR: Reimagining Agent History via Optical Self-Compression

NanyangTechnologicalUniversity

Nanyang Technological University

2

Submitted by

taesiri

VideoAR: Autoregressive Video Generation via Next-Frame & Scale Prediction

·
7 authors

Submitted by

Ningyu

Illusions of Confidence? Diagnosing LLM Truthfulness via Neighborhood Consistency

Zhejiang University

Submitted by

taesiri

Goal Force: Teaching Video Models To Accomplish Physics-Conditioned Goals

·
9 authors

Submitted by

Viglong

Orient Anything V2: Unifying Orientation and Rotation Understanding

·
8 authors

Submitted by

lzw1008

Same Claim, Different Judgment: Benchmarking Scenario-Induced Bias in Multilingual Financial Misinformation Detection

TheFinAI

1

Submitted by

Tinker250

BizFinBench.v2: A Unified Dual-Mode Bilingual Benchmark for Expert-Level Financial Capability Alignment

HiThink-Research

HiThink Research

Submitted by

SteveZeyuZhang

AnyDepth: Depth Estimation Made Easy

PekingUniversity

Peking University

Submitted by

rajkumarrawal

SmartSearch: Process Reward-Guided Query Refinement for Search Agents

·
3 authors

Submitted by

taesiri

Over-Searching in Search-Augmented Large Language Models

apple

Submitted by

liboaccn

DR-LoRA: Dynamic Rank LoRA for Mixture-of-Experts Adaptation

·
6 authors

2

Submitted by

namespace-ERI

Memory Matters More: Event-Centric Memory as a Logic Map for Agent Searching and Reasoning

·
5 authors

3

Submitted by

taesiri

GenCtrl -- A Formal Controllability Toolkit for Generative Models

apple

Submitted by

nielsr

TCAndon-Router: Adaptive Reasoning Router for Multi-Agent Collaboration

tencent

Submitted by

vicgalle

Distilling Feedback into Memory-as-a-Tool

·
1 authors

Submitted by

rajkumarrawal

TowerMind: A Tower Defence Game Learning Environment and Benchmark for LLM as Agents

auckland

University of Auckland

Submitted by

devichand

Router-Suggest: Dynamic Routing for Multimodal Auto-Completion in Visually-Grounded Dialogs

Indian Institute of Technology, Kharagpur

2

Submitted by

gurayozgur

ViTNT-FIQA: Training-Free Face Image Quality Assessment with Vision Transformers

·
7 authors

Submitted by

taesiri

IIB-LPO: Latent Policy Optimization via Iterative Information Bottleneck

·
11 authors

Submitted by

Atnafu

Afri-MCQA: Multimodal Cultural Question Answering for African Languages

·
19 authors

Submitted by

Tassy24

The Persona Paradox: Medical Personas as Behavioral Priors in Clinical Language Models

brownu

Brown University

Submitted by

noamkolt

Legal Alignment for Safe and Ethical AI

·
17 authors