标签：图像分割

PAM模型助力图像分割与视频理解，多模态AI实现语义解析新突破，3B参数模型刷新视觉理解SOTA，图像视频全面适配

整理后文章一款能够同时完成分割、识别和解说任务的全能模型来了！这款名为PAM（Perceive Anything Model）的模型，由香港中文大学MMLab、香港理工大学、北京大学等机构联合开发并开源。它不仅支持图像和视频处理，还能同时输出文本和Mask结果，真正实现了一次交互解决多种需求。 PAM在继承了SAM2强大分割能力的基础上，进一步扩展了语义信息输出功能。为了训练这一高效模型，研究团队构建了一个包含150万张图像区域和60万段视频区域标注的超大规模高质量数据集。实验结果显示，PAM仅用3B参数规模，便在多个图像和视频理...

来源：

量子位【阅读原文】
Tags：PAM模型图像分割多模态AI 视频理解语义解析

1年前 (2025)

Meta开源『Segment Anything Model 2』：SAM 2实现图像与视频全方位分割技术

Meta发布Segment Anything Model 2 (SAM 2)，引领图像与视频分割技术新纪元去年四月，Meta推出颠覆性的“分割一切”模型，引起了业界广泛关注。如今，Meta再次引领潮流，推出了Segment Anything Model 2 (SAM 2)。这款全新模型在原有基础上实现了重大突破，能够实现实时、可提示的对象分割，适用于静态图像和动态视频内容。SAM 2的强大之处在于它可以无缝处理图像和视频，甚至能够分割之前未曾见过的对象和视觉域，极大地拓展了应用场景。 SAM 2的技术革新与卓越性能 SAM 2采用了创新的流式内存设计，能够按顺序高效处理...

来源：

机器之心【阅读原文】
Tags：Meta SAM 2 Segment Anything Model 2 图像分割视频分割

2年前 (2024)