每日AI快讯

终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名

最近的研究揭示了一个令人惊讶的现象,即许多流行的大规模语言模型(LLMs)存在过拟合问题。尽管一些小型模型如微软的 Phi-3 和 Mistral 8x22B 在推理任务上表现出色,但新研究表明,当前的评估方法可能并未准确反映大模型的真实能力。问题在于,大部分研究依赖于如 GSM8k、MATH 等测试集,而这些数据集可能已被训练数据污染,导致模型在基准测试中的表现被夸大。 Scale AI 的最新论文深入探讨了包括 GPT-4、Gemini、Claude 等在内的多个大模型,发现它们受到基准数据污染的影响。为避免数据污染,Scale AI 创建了新的 GSM1...

OpenAI下周将发布ChatGPT搜索引擎,挑战谷歌搜索!

随着OpenAI的最新SSL证书日志揭示了search.chatgpt.com子域名的创建,业界推测该公司即将推出一款ChatGPT支持的搜索引擎,直接瞄准全球搜索巨头谷歌。OpenAI的官方网站已更新,首页突出展示一个可供用户提问的搜索框,进一步证实了这一猜测。据theinformation报道,OpenAI与微软的Bing合作开发搜索引擎已有数月。预计OpenAI将在5月9日揭晓这一项目,巧妙地避开谷歌即将举行的“Google I/O”大会。 目前,谷歌在全球搜索引擎市场占据主导地位,份额高达90%,但其广告过多、死链和过时链接、关键词匹配局限性以及个性化搜索可能...

外媒:苹果将公布AI计划细节,资本支出策略与众不同

【苹果AI战略揭秘,巨头竞争格局凸显】 在全球科技巨头纷纷加大人工智能(AI)研发投入的背景下,苹果CEO蒂姆·库克近日向外界释放出重要信号。在接受路透社采访中,库克表达了对生成式AI领域的积极看法,并宣布苹果将不久后公布其AI计划的详情。过去五年,苹果已斥资1000亿美元用于研发,但与微软、谷歌和Meta等对手不同,苹果在数据中心建设上的投入相对保守。 尽管市场担忧苹果在AI竞赛中滞后,导致股价下滑,但苹果股价近期出现反弹。苹果的资本支出策略与竞争对手形成鲜明对比,2023年全年预计不超过100亿美元。首席财...

库克抛出8000亿元史上最大回购!苹果市值大涨超11000亿元

苹果公司最近宣布了一项创纪录的1100亿美元股票回购计划,这在公司历史上尚属首次,同时他们还将现金股息提高了4%。在与投资者的电话会议中,CEO库克还分享了公司在人工智能领域的最新进展,他表示对AIGC(人工智能生成内容)带来的收入前景充满信心,并预告即将有令人振奋的动态公布,这将进一步巩固苹果的行业领先地位。这一消息刺激了苹果股价在盘后交易中上涨超过6%,按当日市值计算,苹果一天内市值增长了1600亿美元以上。尽管没有直接透露一季度iPhone在中国市场的销售数据,库克仍然表达了对中国经济长期发展的积极看...

李飞飞被曝AI创业!做空间智能,已筹集种子轮融资

在人工智能领域享有盛誉的华裔科学家李飞飞,被誉为“AI教母”,近期正着手创建一家名为Spatial Intelligence的初创公司,致力于提升AI的高级推理能力。李飞飞因其开发的ImageNet数据集对计算机视觉技术的贡献而闻名,目前担任斯坦福大学计算机科学系首位红杉教授及HAI研究院联席院长。据悉,她的新创企已获得硅谷风投Andreessen Horowitz和Radical Ventures的支持。 在最近的TED大会上,李飞飞介绍了“空间智能”的概念,这是一种能让AI理解并预测3D环境中物体行为的技术。她以猫推杯子的例子说明,人类大脑可以瞬间分析并预测...

消费级显卡轻松跑AI,英伟达RTX领跑AI PC竞争

在AI技术日益普及的今天,消费级显卡也开始扮演重要角色。英伟达的RTX显卡在AI PC领域展现出强劲的竞争力,构建了一个拥有超过1亿用户和500款AI应用及游戏的庞大生态系统。在技术品鉴会上,RTX 40系列显卡在生图能力上表现突出,相较于集成显卡,性能提升显著。然而,高效的AI运算不仅依赖硬件,还需要软件优化,如英伟达的Tensor RT加速框架,能更好地利用硬件资源,提高推理速度。在实际应用中,RTX 40系列显卡在内容生成速度上的优势在建筑、艺术等领域得到体现,提升了设计效率和创作空间。速度虽快,但转化为生产力还需...

【解读】费电但极具潜力的“大脑”:如何理解AI耗能问题?

1. Meta推出了新AI模型Llama3,其训练使用了比前代模型Llama2多8倍的H100 GPU,加剧了AI训练对电力的依赖。 2. AI发展的电力需求引发关注,OpenAI CEO、马斯克和黄仁勋等业界领袖警告,电力短缺可能成为AI发展的瓶颈,而AI的能耗远超预期。 3. AI的能耗分为软件和硬件两部分,硬件中的芯片制造尤其耗水,如台积电每年耗水约8000万吨。软件和硬件的能耗对比,AI尚未在能耗和成本上优于人脑。 4. AI的能耗产出比需综合考虑,其在各行业的应用潜力巨大,能提高生产力。专家探讨了AI能耗的计算方法和降低能耗的途径,包括改进硬...

最新中文大模型测评:百川智能 Baichuan 3 国内第一

在最新的《中文大模型基准测评 2024 年度 4 月报告》中,SuperCLUE 评测机构对国内外32个知名大模型进行了全面评估。这份报告揭示了百川智能的 Baichuan 3 在国内大模型中占据领先地位,紧随其后的是智谱 GLM-4、通义千问 2.1、文心一言 4.0和 Moonshot (Kimi)。尽管如此,国际上的GPT-4和Claude3在测评中表现出更高的得分。 SuperCLUE 不仅局限于传统的选择题形式,还引入了开放性问题的测评,以模拟实际应用中的大模型场景。通过多轮对话的设定,深入评估模型的上下文理解、记忆和对话能力。本次测评涵盖了逻辑推理、代码...

消息称苹果挖走大量谷歌顶尖人才,建立神秘人工智能实验室

苹果公司在人工智能领域持续发力,从谷歌挖走了大约36名专家,并在瑞士苏黎世设立了一处秘密的“欧洲实验室”,以加强其AI研发能力。这个实验室专注于研发先进的人工智能模型和产品,尤其是大型语言模型。苹果的AI团队主要分布在美国加州和西雅图,但苏黎世的新中心表明了公司在这一领域的扩展。据信,苹果此举部分受到收购当地AI初创公司的启发,如FaceShift(虚拟现实)和Fashwell(图像识别)。实验室的工作涵盖了类似ChatGPT的聊天机器人技术,涉及文本和视觉输入的综合处理。 苹果的AI研究,特别是对大型语言模型的关注...

苹果挖走大量谷歌员工:全力布局AI 打造神秘苏黎世团队

苹果公司在增强其人工智能(AI)领域的竞争力,最近从谷歌挖走了数十位顶尖AI专家,并在瑞士苏黎世设立了一处秘密的欧洲实验室。自从2018年聘请John Giannandrea作为高级副总裁负责机器学习和AI战略以来,苹果已吸引了至少36位来自谷歌的AI专家,显示出对谷歌AI团队的高度重视。这些专家在苹果内部的不同AI和机器学习团队中工作,共同推进新的AI模型和产品的研发。 在苏黎世,苹果建立的“苏黎世视觉实验室”显得尤为神秘。该实验室的建立得益于苹果收购了当地的AI初创企业,包括VR公司FaceShift和图像识别公司Fashwell。这一举...