Vision Language - 搜索 News

无需训练，如何提升黑箱VLM？CARPRT用「类别感知」给出答案

近年来，视觉-语言模型（Vision-Language Models, VLMs）如 CLIP 的出现，彻底改变了图像理解的范式。其中，零样本分类作为 VLM ...

一文纵览 Vision-and-Language 领域最新研究与进展

导语：在经典的 vision-language 任务上，能够增长的空间已经很小，已经过了暴力的通过数据去学习的阶段。真正的挑战其实是一些细分的领域。雷锋网 AI 科技评论按：本文作者为阿德莱德大学助理教授吴琦，去年，他在为 AI 科技评论投递的独家稿件中回顾了他 ...

3 天

三星DAM-VLA：机器人操控新纪元的动态解耦技术

在机器人技术快速发展的今天，三星研究院推出的DAM-VLA（Dynamic Action Model-Based Vision-Language-Action）模型引发了广泛关注。该技术通过手臂与夹爪的解耦建模，成功解决了当前主流机器人操控模型存在的关键问题，标志着机器人智能化的又一次飞跃。 1. 机器人操控的挑战与机遇随着人工智能和机器人技术的不断进步，机器人在各行各业的应用越来越广泛。然而， ...

腾讯网

2025年，自动驾驶即将开“卷”的端到端大模型 2.0 - VLA (Vision Language ...

太卷了，智能驾驶在国内的落地发展太迅速了，从体验功能端，大家开城大战打完了之后就进入点到点的落地战，点到点弄完了之后肯定Robotaxi大战；而在硬核的软件技术端，端到端大模型战在华为这个月宣布急攻端到端大模型的信息下，已经算是进入焦灼状态。

新浪网

自动驾驶新风向：VLA（Vision-Language-Action）模型是如何崛起的？

2025年，随着智能驾驶开始往深度和广度两个方向去卷，智能驾驶行业往迎来一个显著信号：端到端大模型迈向2.0时代，VLA（Vision-Language-Action，视觉-语言-动作模型）或将成为国内车企全面竞争的焦点。作为继VLM（视觉-语言模型）之后的进化形态，VLA通过整合 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果