标签:大模型

字节大模型关键人物被曝离职!

整理后文章(更利于SEO优化,版本): 字节跳动AI大模型团队再失核心骨干,冯佳时离职引行业关注 近日,据多家科技媒体报道,字节跳动旗下豆包大模型视觉基础研究团队的核心负责人冯佳时已确认离职。这一消息再次引发外界对字节跳动AI人才流动的关注。据悉,冯佳时在字节跳动内部属于4-1或4-2级别的高级技术人才,属于公司顶尖科研力量之一。 早在今年6月,业内便传出冯佳时将离开字节跳动的消息,但当时被公司官方否认。如今,随着最新动态的披露,这一人事变动终于被证实。 冯佳时曾在2024年参与字节跳动推出的“Top ...

我国首个法律垂直大模型发布:整合 2 亿余份裁判文书、420 万余部法律法规

近日,在广州举行的第五届“小包公杯”大学生法律实证分析征文比赛颁奖典礼上,一项具有里程碑意义的成果正式亮相——我国首个专注于法律领域的垂直大模型“小包公法律大模型”正式发布。这一发布不仅标志着人工智能技术在法律行业的应用迈入新阶段,也为法律服务的智能化、规范化提供了全新可能。 该法律大模型由华南师范大学法学院王燕玲教授团队主导研发,并已通过国家网信办深度合成服务算法备案。不同于传统通用大模型,“小包公”采用“通用大模型+专业垂直大模型”双引擎架构,深度融合了超过2亿份裁判文书和420多万部法律法规...

在人工智能领域,音频理解正逐渐成为提升用户体验的重要技术

近日,小米公司正式开源了其声音理解大模型——MiDashengLM-7B。这款模型在22个公开评测集中刷新了多模态大模型的最佳性能记录(SOTA),并在推理效率方面展现出显著优势,标志着小米在音频AI领域迈出了重要一步。 MiDashengLM-7B的核心架构由Xiaomi Dasheng音频编码器与Qwen2.5-Omni-7B Thinker解码器组成。通过采用通用音频描述训练策略,该模型能够统一理解语音、环境音和音乐等多种声音类型,实现跨模态的声音感知能力。这一能力不仅提升了模型的泛化性,也为构建全场景智能生态奠定了基础。 目前,Xiaomi Dasheng系列模...

刚刚!蚂蚁推出首个金融推理大模型,登顶权威金融测评,超越OpenAI o1、DeepSeek-R1

整理如下(,优化SEO结构): 蚂蚁数科发布新一代金融大模型Agentar-Fin-R1,性能领先行业 7月28日,蚂蚁数科正式对外发布其最新研发的金融推理大模型——Agentar-Fin-R1。该模型基于Qwen3架构进行深度优化,在多个权威金融评测基准中表现优异,超越了包括DeepSeek-R1在内的同尺寸通用大模型及金融垂直模型。 此次发布的Agentar-Fin-R1包含32B和8B参数两个推理版本,同时还有14B和72B参数的非推理版本,旨在满足金融机构在不同业务场景下的部署需求。此外,蚂蚁数科还推出了基于百灵大模型的MoE(混合专家)架构模型,进...

红杉中国开源AI基准测试xbench,助力大模型评估避免过拟合问题

6月18日,红杉中国正式对外开源了其AI基准测试工具xbench中的两个重要评测集——xbench-ScienceQA和xbench-DeepSearch。这一举措旨在为大模型及AI Agent开发者提供更全面、高效的评估工具。 据红杉中国介绍,未来将根据大模型与AI Agent技术的发展动态调整评测集。同时,xbench将引入“黑白盒”机制,一方面确保工具能够服务于更多开发者,另一方面有效规避静态评测集中常见的过拟合问题,从而保障xbench的长期有效性与实用性。 通过持续优化评测标准,红杉中国希望推动AI领域技术的进一步发展,并助力开发者在实际应用中取得...

AI数据标注师:在人工智能大模型浪潮中探索职业转型新方向

在北京798艺术区附近的一家大型咖啡馆内,AI数据标注师廖仔在交谈中多次提到了店内的咖啡机器人。这家占地近3000平方米的咖啡馆里,不少咖啡师围绕中央圆形岛台忙碌工作,而最吸引人眼球的是一台仿人型机械臂的咖啡机器人。据说,这台机器人的脸部模型是根据咖啡馆主理人的形象定制的。 回溯到三四年前,廖仔从未想过机器人能够制作咖啡,也未曾想到自己会踏入AI领域。作为1999年出生的专科毕业生,他曾就职于深圳一家体制内的单位。然而,不想让自己的人生一眼望到头,他选择离职并学习建筑设计课程。随后,他从设计师转型...

腾讯星火挑战营:高中生直接参与大模型与具身智能研究,探索量子科技未来方向

腾讯顶尖学生招募计划正式启动!高中生可直接参与大模型与具身智能前沿研究。 高考结束后的暑假还没有安排?腾讯邀请你来参加一年一度的顶尖学生招募计划——“星火挑战营”。本次计划将招募60-70名高二、高三学生(2025级高考生),入选者有机会前往深圳总部,挑战一线产业难题。今年特别新增了四个大模型方向:超长文本理解、长思维链技术、具身智能+机器人、多模态感知理解。 超长文本理解 大模型在处理超长文本时受限于字数输入上限,微信读书的AI问书技术团队正在掀起一场关于超长文本智能的认知革命。专家们将带领同学...

通义灵码引领AI编程新时代,MCP工具与大模型助力开发者高效创作,体验智能体自动写代码,AI IDE免费使用不容错过

阿里云通义灵码近日推出全新AI开发环境工具——通义灵码AI IDE(Lingma IDE),这是阿里云首个AI原生开发环境工具,深度适配最新的千问3大模型,并集成国内最大的魔搭MCP市场。开发者可通过该工具调用超过3000个MCP服务,一键安装部署,快速完成复杂编程任务。 通义灵码AI IDE不仅集成了通义灵码辅助编程助手的全部功能,还提供了六大核心能力:多种会话模式、工具使用(含MCP)、复杂工程感知、行间建议预测、自动记忆感知和行间智能会话。这些功能使得开发者能够在不同技术栈和复杂度下高效工作,无论是简单软件的0-1开发还...

AI硬件与大模型驱动下,中国智能终端如雷鸟创新的AR眼镜如何抓住苹果、谷歌、Meta、OpenAI等科技巨头抢滩的新赛道机遇?

五天前,科技圈被一起重磅收购案震撼。OpenAI以高达65亿美元的价格,将由前苹果首席设计官Jony Ive创立的AI硬件公司io收入囊中,并计划将其打造为专注于消费级智能设备的核心部门。此次收购涉及约55名硬件工程师、软件开发人员和制造专家,标志着OpenAI历史上最大规模的一次投资。OpenAI CEO Sam Altman在声明中表示:“AI能力的飞跃需要全新的计算形态。”这表明大模型时代的AI需要一款全新的“AI原生”硬件平台。 上周的Google I/O开发者大会上,这一趋势再次得到强化。Google推出了专为Android XR平台打造的旗舰级AR眼镜Proj...

人大高瓴人工智能学院6年成果显著:大模型助力创新创业,涉外法治大模型引领人工智能新方向

高瓴人工智能学院是中国人民大学的一个重要学术机构,专注于AI领域的研究和人才培养。最近,该学院分享了其在大模型研发、跨学科研究以及创业创新方面的最新成果。 第一段 2023年5月18日,中国人民大学高瓴人工智能学院对外展示了其在AI领域的最新研究成果,包括在校生及毕业生的创新创业项目。作为成立仅6年的年轻学院,高瓴人工智能学院已经在多个领域取得了令人瞩目的成就。自2020年起,该学院便开始着手大模型的研发工作,成为国内最早涉足这一领域的单位之一。目前,学院已经布局了超过20个研究方向,并发布了诸如文...
12317