标签：大模型

刚刚！蚂蚁推出首个金融推理大模型，登顶权威金融测评，超越OpenAI o1、DeepSeek-R1

整理如下（，优化SEO结构）：蚂蚁数科发布新一代金融大模型Agentar-Fin-R1，性能领先行业 7月28日，蚂蚁数科正式对外发布其最新研发的金融推理大模型——Agentar-Fin-R1。该模型基于Qwen3架构进行深度优化，在多个权威金融评测基准中表现优异，超越了包括DeepSeek-R1在内的同尺寸通用大模型及金融垂直模型。此次发布的Agentar-Fin-R1包含32B和8B参数两个推理版本，同时还有14B和72B参数的非推理版本，旨在满足金融机构在不同业务场景下的部署需求。此外，蚂蚁数科还推出了基于百灵大模型的MoE（混合专家）架构模型，进...

来源：

智东西【阅读原文】 Tags：OpenAI 大模型

11个月前

红杉中国开源AI基准测试xbench，助力大模型评估避免过拟合问题

6月18日，红杉中国正式对外开源了其AI基准测试工具xbench中的两个重要评测集——xbench-ScienceQA和xbench-DeepSearch。这一举措旨在为大模型及AI Agent开发者提供更全面、高效的评估工具。据红杉中国介绍，未来将根据大模型与AI Agent技术的发展动态调整评测集。同时，xbench将引入“黑白盒”机制，一方面确保工具能够服务于更多开发者，另一方面有效规避静态评测集中常见的过拟合问题，从而保障xbench的长期有效性与实用性。通过持续优化评测标准，红杉中国希望推动AI领域技术的进一步发展，并助力开发者在实际应用中取得...

来源：

界面新闻【阅读原文】
Tags：AI基准测试 xbench 大模型红杉中国过拟合

1年前 (2025)

AI数据标注师：在人工智能大模型浪潮中探索职业转型新方向

在北京798艺术区附近的一家大型咖啡馆内，AI数据标注师廖仔在交谈中多次提到了店内的咖啡机器人。这家占地近3000平方米的咖啡馆里，不少咖啡师围绕中央圆形岛台忙碌工作，而最吸引人眼球的是一台仿人型机械臂的咖啡机器人。据说，这台机器人的脸部模型是根据咖啡馆主理人的形象定制的。回溯到三四年前，廖仔从未想过机器人能够制作咖啡，也未曾想到自己会踏入AI领域。作为1999年出生的专科毕业生，他曾就职于深圳一家体制内的单位。然而，不想让自己的人生一眼望到头，他选择离职并学习建筑设计课程。随后，他从设计师转型...

来源：

定焦one公众号【阅读原文】
Tags：AI数据标注人工智能大模型数据标注师职业转型

1年前 (2025)

腾讯星火挑战营：高中生直接参与大模型与具身智能研究，探索量子科技未来方向

腾讯顶尖学生招募计划正式启动！高中生可直接参与大模型与具身智能前沿研究。高考结束后的暑假还没有安排？腾讯邀请你来参加一年一度的顶尖学生招募计划——“星火挑战营”。本次计划将招募60-70名高二、高三学生（2025级高考生），入选者有机会前往深圳总部，挑战一线产业难题。今年特别新增了四个大模型方向：超长文本理解、长思维链技术、具身智能+机器人、多模态感知理解。超长文本理解大模型在处理超长文本时受限于字数输入上限，微信读书的AI问书技术团队正在掀起一场关于超长文本智能的认知革命。专家们将带领同学...

来源：

量子位【阅读原文】
Tags：具身智能大模型星火挑战营腾讯量子科技

1年前 (2025)

通义灵码引领AI编程新时代，MCP工具与大模型助力开发者高效创作，体验智能体自动写代码，AI IDE免费使用不容错过

阿里云通义灵码近日推出全新AI开发环境工具——通义灵码AI IDE（Lingma IDE），这是阿里云首个AI原生开发环境工具，深度适配最新的千问3大模型，并集成国内最大的魔搭MCP市场。开发者可通过该工具调用超过3000个MCP服务，一键安装部署，快速完成复杂编程任务。通义灵码AI IDE不仅集成了通义灵码辅助编程助手的全部功能，还提供了六大核心能力：多种会话模式、工具使用（含MCP）、复杂工程感知、行间建议预测、自动记忆感知和行间智能会话。这些功能使得开发者能够在不同技术栈和复杂度下高效工作，无论是简单软件的0-1开发还...

来源：

智东西【阅读原文】
Tags：AI编程 MCP工具大模型开发者工具通义灵码

1年前 (2025)

AI硬件与大模型驱动下，中国智能终端如雷鸟创新的AR眼镜如何抓住苹果、谷歌、Meta、OpenAI等科技巨头抢滩的新赛道机遇？

五天前，科技圈被一起重磅收购案震撼。OpenAI以高达65亿美元的价格，将由前苹果首席设计官Jony Ive创立的AI硬件公司io收入囊中，并计划将其打造为专注于消费级智能设备的核心部门。此次收购涉及约55名硬件工程师、软件开发人员和制造专家，标志着OpenAI历史上最大规模的一次投资。OpenAI CEO Sam Altman在声明中表示：“AI能力的飞跃需要全新的计算形态。”这表明大模型时代的AI需要一款全新的“AI原生”硬件平台。上周的Google I/O开发者大会上，这一趋势再次得到强化。Google推出了专为Android XR平台打造的旗舰级AR眼镜Proj...

来源：

硅星人Pro公众号【阅读原文】
Tags：AI硬件 AR眼镜大模型智能终端雷鸟创新

1年前 (2025)

人大高瓴人工智能学院6年成果显著：大模型助力创新创业，涉外法治大模型引领人工智能新方向

高瓴人工智能学院是中国人民大学的一个重要学术机构，专注于AI领域的研究和人才培养。最近，该学院分享了其在大模型研发、跨学科研究以及创业创新方面的最新成果。第一段 2023年5月18日，中国人民大学高瓴人工智能学院对外展示了其在AI领域的最新研究成果，包括在校生及毕业生的创新创业项目。作为成立仅6年的年轻学院，高瓴人工智能学院已经在多个领域取得了令人瞩目的成就。自2020年起，该学院便开始着手大模型的研发工作，成为国内最早涉足这一领域的单位之一。目前，学院已经布局了超过20个研究方向，并发布了诸如文...

来源：

智东西【阅读原文】
Tags：人工智能创新创业大模型涉外法治大模型高瓴人工智能学院

1年前 (2025)

AI人工智能领域的竞争，不仅是技术的较量，更是人才的争夺; 阿里通义成了黄埔军校

随着AI行业的“决赛圈”逐渐缩小，顶尖科技公司对高端人才的需求达到了前所未有的高度。自去年以来，各大巨头纷纷调整战略，加大了对AI人才的招募力度。例如，腾讯推出了“青云计划”，以顶级薪资和无职级上限吸引顶尖人才，并新增2.8万个实习岗位储备后备力量；字节跳动则启动了“Top Seed计划”，专注于大模型、多模态等前沿领域，为顶尖博士提供专属机会。相较于新兴力量，经验丰富的AI核心骨干成为这场竞争中的焦点。其中，阿里巴巴旗下的通义实验室尤为引人注目。近期，阿里通义实验室应用视觉团队负责人薄列峰被曝离职，引...

来源：

硅星人Pro公众号【阅读原文】
Tags：AI人才大模型技术竞争通义实验室阿里巴巴

1年前 (2025)

阿里巴巴推出基于大模型的开源搜索引擎ZeroSearch，结合强化学习技术，实现搜索能力大幅提升且成本降低80%，重新定义高效搜索新标准

（由多段落组成）感谢IT之家网友“乌蝇哥的左手”提供的线索！近日，阿里巴巴在GitHub等平台正式开源了一款名为ZeroSearch的大模型搜索引擎。这款工具无需与传统搜索引擎直接交互，即可通过强化学习框架提升大模型的搜索能力。ZeroSearch充分利用了大模型在大规模预训练过程中积累的知识，将其转化为高效的检索模块，能够根据用户输入的查询生成相关的。此外，ZeroSearch还支持动态调整生成的质量，这一特性是传统搜索引擎无法实现的独特功能。为了验证其性能，研究人员在NQ、TriviaQA、PopQA和HotpotQA等7个主要问答数据...

来源：

IT之家【阅读原文】
Tags：ZeroSearch 大模型强化学习搜索引擎阿里巴巴

1年前 (2025)

提示词工程师：AI岗位中的复合型人才，掌握提示词工程与大模型精髓，未来发展潜力无限——揭秘ChatGPT催生的高薪职业为何逐渐被大厂冷落？

在大模型元年，提示词工程师曾是AI领域最热门的岗位之一。然而，随着技术的发展和市场需求的变化，这一岗位如今已不再像以前那样备受追捧。曾经，提示词工程师无需写代码、不限专业、不要求学历，仅通过研究如何与AI对话就能获得高达25-33万美元的年薪。但如今，微软的一项涉及31000名员工的调查显示，提示词工程师已成为未来12-18个月内公司最不愿意新增的岗位之一。此外，在招聘平台Indeed上，提示词工程师的搜索热度也经历了过山车式的变化。从2023年初的低谷到4月的高峰，再到如今的平稳，显示了市场对这一岗位需求的...

来源：

快科技【阅读原文】
Tags：AI岗位复合型人才大模型提示词工程提示词工程师

1年前 (2025)

123 4…18