LLM/VLM
views
| comments
Domain Page
LLM/VLM
基础模型与多模态模型总入口,关注能力边界、训练方式与推理表现。
Definition
LLM/VLM 关注语言模型与视觉语言模型的能力扩展、对齐方式、后训练与多模态推理表现。
Key Questions
- 后训练、合成数据与推理时扩展分别带来什么收益?
- VLM 的 grounding 与推理能力如何统一评估?
- 模型能力应该如何服务后续 Agent 与具身系统?
Representative Items
Long-Horizon Manipulation via Trace-Conditioned VLA Planning
可作为 LLM/VLM 与具身交叉场景的近期代表条目。
Open Source
CorridorVLA
VLM 接口与 action head 设计的示例。
Open Source
Recent Signals
- 近期更新集中在 multimodal reasoning、grounding 与 post-training。
- 值得后续补一个“模型能力 / 数据路线 / 推理范式”三层索引。