每日AI快讯

大模型游戏评测:17款大模型与八款棋牌游戏对决,o3-mini凭借出色推理能力胜出,DeepSeek R1因中间步骤失误落败,GameBoT见证谁是真正的棋艺王者?

第一段 在AI社区中,大模型玩棋牌游戏的风潮愈演愈烈。例如,国外知名博主让DeepSeek和ChatGPT下国际象棋的视频在YouTube上获得了百万播放量。此外,ARC Prize组织最近发布了一个贪吃蛇LLM评测基准SnakeBench。针对这一场景,来自香港大学、剑桥大学和北京大学的研究人员推出了一种更全面、客观可信的LLM评测基准:GameBoT。通过让大模型在8个游戏中相互竞争,GameBoT能够评估各主流大模型的推理能力。 第二段 传统的LLM基准测试面临两个主要挑战:性能饱和与数据污染。性能饱和指的是榜单分数已经被刷得很高,几乎没有进...

通义千问Qwen32B结合夸克AI超级框,阿里DeepSeek布局ToC市场

这一周,人工智能领域可谓热闹非凡。先是DeepSeek推出了最新版本V3-0324,接着阿里云通义千问开源了更小尺寸的视觉理解模型Qwen2.5-VL-32B-Instruct。中国两大AI巨头轮番上阵,持续向美国硅谷施加压力。虽然DeepSeek依旧表现出色,但此次Qwen32B同样吸引了大量关注。 Qwen32B:小巧却强大的新星 从名称后缀就能看出,Qwen32B这款新模型非同一般。首先,它的参数量仅有32B,与DeepSeek-V3满血版高达671B的参数量相比,显得非常精简。然而,尺寸小并不意味着性能差。在国际权威测评榜LiveBench测试中,Qwen32B超越了OpenAI ...

随着人工智能技术的快速发展,中医药领域也迎来了创新性的突破

近日,中国中医科学院广安门医院正式发布了国内首款中医AI大模型——“广医・岐智”。这款模型将传统中医智慧与现代科技深度融合,为中医药的发展注入了新的活力。 据广安门医院官方介绍,“广医・岐智”基于70年来积累的丰富中医经验,结合407万份临床病例数据,构建了一个庞大的知识图谱体系。该体系涵盖了疾病、证候、中药、古籍文献等9大类、1400万条临床知识。通过国产算力和模型底座的支持,对大模型进行持续训练和优化,实现了对名医诊疗过程的深度解析,从而赋予了“广医・岐智”强大的中医智能大脑。 在患者服务方面,“广...

教育数字化时代来临,科大讯飞AI求职助手助力智慧教育平台发展,通过自然语言处理技术提升教育与就业新体验

(由多段落组成): 随着科技的快速发展,教育领域的数字化转型也在不断推进。近日,教育部召开国家教育数字化战略行动2025年部署会议,并正式发布了国家智慧教育平台2.0智能版。这一平台旨在通过整合优质教育资源和先进技术,为用户提供更加智能化、个性化的学习与职业发展服务。 作为首批入选的AI应用之一,科大讯飞的AI求职助手成功上线该平台,为用户提供了全新的求职体验。与此同时,北京大学、清华大学、上海交通大学、复旦大学等知名高校以及人民网也推出了各自的AI产品,包括数学解题助手、代码纠错助手、AI课堂、...

CoreWeave携手英伟达与微软,布局AI云计算领域,冲刺IPO千亿算力市场,年营收激增736%引发行业关注

第一段: 近日,美国AI云服务提供商CoreWeave成功登陆纳斯达克,成为市场关注的焦点。尽管开盘价低于发行价,但其股价在交易中经历了多次波动,最终收盘与发行价持平,市值约为189.39亿美元(约合人民币1375.7亿元)。CoreWeave曾以加密货币挖矿起家,后来转型为AI云计算服务商,目前在全球范围内运营着32个AI数据中心。凭借高效的数据中心解决方案,CoreWeave提供的AI云服务价格更具竞争力。 第二段: 2024年,CoreWeave的年营收增长了736%,达到19.15亿美元(约合人民币139亿元),但同时亏损也达到了8.63亿美元(约合人...

马斯克xAI重磅收购X平台:人工智能实验室引领社交媒体整合新风向标

马斯克旗下的xAI与社交平台X(原推特)正式合并,这一消息引发了全球关注。根据最新公告,xAI以全股票交易形式收购了X,估值分别为800亿美元和330亿美元(扣除债务后)。两家公司的合并估值高达1130亿美元,成为科技领域的一大焦点。 在官方声明中,马斯克表示:“xAI和X的未来紧密相连。今天,我们迈出了整合数据、模型、计算、分发和人才的重要一步。” 这次合并不仅标志着两家公司业务的深度融合,也展现了马斯克对人工智能和社交媒体未来的战略布局。 值得注意的是,X和xAI拥有许多共同投资者,包括a16z、红杉资本、富达...

AlphaFold推动蛋白质结构预测革命:人工智能助力生命科学发展荣获诺贝尔化学奖认可

第一段 近日,在谷歌举办的一场媒体分享会上,谷歌DeepMind的产品经理Dhavi Patel详细介绍了AlphaFold在蛋白质结构预测及生命科学领域的应用。数据显示,AlphaFold在全球190多个国家拥有超过250万用户,其中亚太地区的用户数量已突破100万,占全球总用户的三分之一以上。从基础研究到实际应用,AlphaFold展现了人工智能技术对生命科学的深远影响。2024年10月,AlphaFold荣获诺贝尔化学奖,充分体现了其在科学界的重要地位。据估计,AlphaFold的应用已潜在节省了数百万美元的科研经费,并大幅缩短了科研周期。 第二段 在分...

生成式AI浪潮下,Dify.AI借助亚马逊云科技与开源平台优势,推动AI应用全球布局

(由多段落组成): 生成式人工智能的兴起,为众多初创企业开辟了全新的市场,并对多个行业产生了深远影响。得益于AI云计算基础设施的支持,新一代创业公司得以快速成长,展现出与以往截然不同的发展态势。本周,Dify.AI 分享了其成长历程。如今,Dify 已成为业内知名的开源大模型应用平台,吸引了大量泛开发者和企业用户,提供领先的生成式AI技术栈支持。近期,这家初创企业荣登 TechCrunch 全球20佳榜单第3名。 在 GitHub 上,Dify 的项目跻身全球百大开源项目行列,与 LangChain 并列为最受欢迎的应用开发平台之一。Dif...

微软萨提亚·纳德拉引领下自研高性能AI平台模型挑战OpenAI与ChatGPT

(由多段落组成): 微软首席执行官萨提亚·纳德拉(Satya Nadella)近日透露,微软正计划开发自己的高性能人工智能(AI)平台模型。这一消息来自《日经亚洲》的报道,显示了微软在AI领域的进一步战略布局。 在接受采访时,纳德拉明确表示,尽管微软目前与OpenAI合作,使用其开发的ChatGPT技术,但微软仍希望拥有自己的生成式AI能力。“我们正在构建自己的生成式AI能力,以补充我们与OpenAI的合作关系。”他说道。此外,他还强调,如果微软认为某项服务能够为客户带来额外价值,那么这项技术将通过微软的商业软件提供给客户。...

哥伦比亚大学学生因使用AI工具通过技术面试被开除,Leetcode与Interview Coder成为职场新人必备技能

在当今科技快速发展的时代,AI技术的广泛应用引发了诸多争议。最近,一位名叫罗伊·李的学生因开发并使用一款名为“Interview Coder”的AI工具而被哥伦比亚大学停学。这款工具帮助他在Meta(原Facebook)、亚马逊和TikTok等公司的技术面试中脱颖而出。 根据罗伊·李在LinkedIn上的分享,他提到自己因抵制传统的Leetcode面试模式而被学校开除。这一事件在今年3月初迅速成为社交媒体上的热门话题。作为一名计算机科学专业的学生,李的目标是进入大型科技公司工作。然而,面对严苛的技术面试流程,他感到身心俱疲,于是决定开发一...