每日AI快讯

一种全新的视觉生成范式——邻近自回归建模

近年来,视觉生成任务在人工智能领域中逐渐崭露头角,尤其是在图像和视频生成方面。然而,传统的“下一个token预测”方法在效率上遇到了瓶颈。为了解决这一问题,浙江大学、上海AI Lab等机构的研究团队提出了一种全新的视觉生成范式——邻近自回归建模(Neighboring Autoregressive Modeling, NAR)。 NAR模型通过采用“下一个邻域预测”的机制,将视觉生成过程视为一种逐步扩展的“外绘”过程。具体而言,NAR模型从初始token开始,按照与初始token的曼哈顿距离从小到大依次生成token。这种顺序不仅保留了视觉的空间和时间局部性,...

Claude这样的语言模型并非由工程师直接编写固定规则,而是通过海量数据训练而成

在这个过程中,模型会自主学习解决问题的方法,并将其编码到计算流程中。尽管每次生成一个单词可能涉及数十亿次计算,但这些计算方式对于开发者而言仍是“黑箱”。为了更深入理解Claude的“思维”模式,研究人员借鉴了神经科学研究方法,打造了一种“AI显微镜”,以分析模型内部的信息流动和激活模式。 最新研究揭示了以下关键发现: 1. Claude的“思维语言”是跨语言的,存在一种通用的“概念空间”。 2. Claude在生成文本时会提前规划,而不仅仅是逐词预测。 3. Claude有时会编造合理的推理过程,而非严格遵循逻辑。 此外,研究还...

AI代理与大语言模型结合:科技趋势下聊天机器人与AI助手的未来发展

近年来,AI技术的迅速发展使其成为全球关注的焦点。根据凤凰网科技讯报道,北京时间3月30日,《华尔街日报》指出,硅谷科技巨头们正在热烈讨论一个新概念——“AI Agents”(AI代理或AI智能体),并将其视为未来的重要趋势。然而,目前对于这一术语的定义尚未形成统一标准,这导致了市场上的一定混乱。 金融服务公司第一资本(Capital One)的首席科学家兼企业AI负责人普雷姆·纳塔拉詹(Prem Natarajan)形象地将这种现象比喻为“盲人摸象”。他表示,不同的人对AI代理的理解可能大相径庭,就像每个人都在触摸大象的不同部位,得出的...

讯飞医疗发布全球首个1型糖尿病专病大模型,助力慢性病防治与AIoT技术融合

近年来,随着人工智能技术的快速发展,医疗领域的创新应用层出不穷。近日,一项由讯飞医疗主导研发的重大科研成果引发了广泛关注。据IT之家报道,3月30日,全球首个“1型糖尿病专病大模型”正式发布。这一突破性成果标志着从实验室到临床应用的重要跨越,同时也是安徽省在慢性病防治领域实现国家级科研成果转化的首次成功实践。 据悉,该专病大模型聚焦于1型糖尿病诊疗中的关键痛点问题,通过整合多模态数据与临床经验,基于讯飞星火医疗大模型X1,构建了一套覆盖筛查、分型、治疗及管理全流程的智能化防控体系。这套体系不仅...

酷睿Ultra 200HX游戏本发布:能效优化飙升40%,AI能力与性能提升全新体验

Intel在3月29日于北京正式推出了基于酷睿Ultra 200HX系列处理器(代号Arrow Lake-HX)以及RTX 50系列显卡的新一代游戏笔记本。这次发布会汇集了来自10家OEM厂商的20款产品,不仅为游戏玩家带来了全新的体验,也为专业创作者提供了更强大的工具。 酷睿Ultra 200HX作为Intel重返顶级游戏本市场的关键产品,其性能、能效和扩展性均实现了显著提升,成为游戏本的主流选择。此外,这是首次将完整的AI能力引入到游戏本中,为移动游戏提供独特的AI支持。 尽管酷睿Ultra 200HX系列早在CES 2025期间已经发布,但本次发布会的重点在...

大模型游戏评测:17款大模型与八款棋牌游戏对决,o3-mini凭借出色推理能力胜出,DeepSeek R1因中间步骤失误落败,GameBoT见证谁是真正的棋艺王者?

第一段 在AI社区中,大模型玩棋牌游戏的风潮愈演愈烈。例如,国外知名博主让DeepSeek和ChatGPT下国际象棋的视频在YouTube上获得了百万播放量。此外,ARC Prize组织最近发布了一个贪吃蛇LLM评测基准SnakeBench。针对这一场景,来自香港大学、剑桥大学和北京大学的研究人员推出了一种更全面、客观可信的LLM评测基准:GameBoT。通过让大模型在8个游戏中相互竞争,GameBoT能够评估各主流大模型的推理能力。 第二段 传统的LLM基准测试面临两个主要挑战:性能饱和与数据污染。性能饱和指的是榜单分数已经被刷得很高,几乎没有进...

通义千问Qwen32B结合夸克AI超级框,阿里DeepSeek布局ToC市场

这一周,人工智能领域可谓热闹非凡。先是DeepSeek推出了最新版本V3-0324,接着阿里云通义千问开源了更小尺寸的视觉理解模型Qwen2.5-VL-32B-Instruct。中国两大AI巨头轮番上阵,持续向美国硅谷施加压力。虽然DeepSeek依旧表现出色,但此次Qwen32B同样吸引了大量关注。 Qwen32B:小巧却强大的新星 从名称后缀就能看出,Qwen32B这款新模型非同一般。首先,它的参数量仅有32B,与DeepSeek-V3满血版高达671B的参数量相比,显得非常精简。然而,尺寸小并不意味着性能差。在国际权威测评榜LiveBench测试中,Qwen32B超越了OpenAI ...

随着人工智能技术的快速发展,中医药领域也迎来了创新性的突破

近日,中国中医科学院广安门医院正式发布了国内首款中医AI大模型——“广医・岐智”。这款模型将传统中医智慧与现代科技深度融合,为中医药的发展注入了新的活力。 据广安门医院官方介绍,“广医・岐智”基于70年来积累的丰富中医经验,结合407万份临床病例数据,构建了一个庞大的知识图谱体系。该体系涵盖了疾病、证候、中药、古籍文献等9大类、1400万条临床知识。通过国产算力和模型底座的支持,对大模型进行持续训练和优化,实现了对名医诊疗过程的深度解析,从而赋予了“广医・岐智”强大的中医智能大脑。 在患者服务方面,“广...

教育数字化时代来临,科大讯飞AI求职助手助力智慧教育平台发展,通过自然语言处理技术提升教育与就业新体验

(由多段落组成): 随着科技的快速发展,教育领域的数字化转型也在不断推进。近日,教育部召开国家教育数字化战略行动2025年部署会议,并正式发布了国家智慧教育平台2.0智能版。这一平台旨在通过整合优质教育资源和先进技术,为用户提供更加智能化、个性化的学习与职业发展服务。 作为首批入选的AI应用之一,科大讯飞的AI求职助手成功上线该平台,为用户提供了全新的求职体验。与此同时,北京大学、清华大学、上海交通大学、复旦大学等知名高校以及人民网也推出了各自的AI产品,包括数学解题助手、代码纠错助手、AI课堂、...

CoreWeave携手英伟达与微软,布局AI云计算领域,冲刺IPO千亿算力市场,年营收激增736%引发行业关注

第一段: 近日,美国AI云服务提供商CoreWeave成功登陆纳斯达克,成为市场关注的焦点。尽管开盘价低于发行价,但其股价在交易中经历了多次波动,最终收盘与发行价持平,市值约为189.39亿美元(约合人民币1375.7亿元)。CoreWeave曾以加密货币挖矿起家,后来转型为AI云计算服务商,目前在全球范围内运营着32个AI数据中心。凭借高效的数据中心解决方案,CoreWeave提供的AI云服务价格更具竞争力。 第二段: 2024年,CoreWeave的年营收增长了736%,达到19.15亿美元(约合人民币139亿元),但同时亏损也达到了8.63亿美元(约合人...
12425262728304