每日AI快讯
智算云服务平台
智东西报道:阶跃星辰中标上海智算云服务平台项目,首次亮相招标市场 12月31日,据智东西(公众号:zhidxcom)报道,大模型独角兽企业阶跃星辰在12月27日成功中标上海某公司智算云服务平台源代码采购项目,投标报价为4199.9万元。此次招标为智算云服务平台的源代码采购,要求中标人在服务器和网络环境部署完成后,两周内完成平台的部署、配置及调试,并满足招标文件中的技术规格需求。 该项目从公开招标公告到中标结果公告仅用时17天。具体时间线如下:12月11日发布公开招标公告,12月23日递交投标文件并公布中标候选人,...
Llama 2 在 Windows 98 奔腾 II 上成功运行:每秒39个token,探索26年前的老年机如何支持现代人工智能普及
让 Llama 2 在 Windows 98 奔腾 II 上成功运行 最近,EXO Labs 成功地让 Llama 2 模型在一台 26 年前的硬件上运行,这台机器配备了英特尔奔腾 II CPU 和 128MB 的内存。令人惊讶的是,模型的输出速度达到了每秒 39.31 个 token。这项实验不仅展示了 Llama 模型的强大适应性,还证明了即使在资源极其有限的情况下,现代人工智能模型仍然可以运行。 EXO Labs 的使命与背景 EXO Labs 是一个由牛津大学研究人员和工程师组成的组织,成立于今年 9 月,其使命是“让人工智能普及大众”。该组织认为,少数几家大公司控制人工智能...
中国AI产业的迅猛发展:从宇树机器狗到DeepSeek模型,硬件与软件的双重突破引发全球关注
中国AI产业的崛起与挑战 近期,英文技术社区对中国AI产业的进步速度表现出半震动半懵逼的状态。主要的应激来源有两个:一个是宇树(Unitree)的轮足式机器狗B2-W,另一个是开源MoE模型DeepSeek-V3。 宇树在早期基本上是波士顿动力的追随者,产品形态和商业模式都模仿后者,但没有太大的吸引力。然而,从B系列型号开始,宇树的机器狗在灵活性上已经可以与波士顿动力平起平坐。B2-W的最大亮点在于它采用了运动性更高但平衡性更难的动轮方案,并在一年内完成了户外环境中的复杂训练,让许多美国人怀疑这是CGI特效。 波士顿动...
深度解析2024年国内AI大模型应用的破圈姿态:聚焦AI技术、数据隐私与版权争议,展望海外市场机遇
大模型应用的“破圈”之路:从技术到市场的转变 在经历了拼算力、财力和人力的“大炼”大模型阶段后,企业和投资人都逐渐变得更加务实。大模型不再仅仅是实验室里的“技术大神”,而是需要真正赢得用户的青睐才能体现其价值。2024年,许多国内大模型企业开始积极探索如何让自己的产品成为现象级AI应用,实现“破圈”。 回顾这一年,确实有一些大模型应用取得了显著的成功,扩大了影响力,不再局限于科技极客圈。这些成功案例有的是通过精心运营,有的则是意外走红,甚至有些是因为被迫出圈。 一、Kimi:长文本处理的异军突起与资...
NVIDIA特供版H20 GPU在中国市场大放异彩,AI加速器助力数百亿美元增长浪潮
NVIDIA特供版AI GPU在中国市场表现强劲,H20成最大赢家 根据快科技12月30日的报道,NVIDIA为了将AI GPU加速器销售到中国市场,推出了一系列特供版产品。这些特供版GPU包括早期的A800、H800,以及后来的H20、L20和L2。其中,基于新Hopper架构的H20特别受到中国客户的青睐,主要用于训练任务,而L20和L2则是基于Ada架构的推理卡,需求相对较低。 根据分析机构Claus Aasholm的数据,H20在中国市场的销量非常出色,每个季度的环比增幅约为50%,成为NVIDIA在中国最成功的产品之一。尽管没有具体收入数据,但据信H20已经为NVIDIA...
中信证券:DeepSeek-V3发布,大幅提升AI大模型的训练效率与推理速度,推动AI产业链快速发展
12月30日,中信证券发布研报指出,DeepSeek-V3的正式发布在AI行业内引起了广泛关注。这款新一代模型不仅保持了强大的模型能力,还在训练效率和推理速度上实现了显著提升。以下是整理后的文章 DeepSeek-V3引领AI普惠新时代 近日,DeepSeek-V3的正式发布在AI行业掀起了新一轮热潮。作为一款备受瞩目的AI大模型,DeepSeek-V3不仅继承了前代产品的卓越性能,更在训练效率和推理速度方面取得了突破性进展。这一进步标志着AI技术正逐步迈向普惠化,为更多应用场景提供强有力的支持。 高效训练与推理加速 DeepSeek-V3的发布不仅...
26年前的Windows 98古董电脑成功运行大型语言模型:EXO Labs推动人工智能普及,搭载奔腾II处理器和128MB内存,再现BitNet时代辉煌
运行 Windows 98 的奔腾 II 电脑成功运行大型语言模型 近日,一个名为 EXO Labs 的组织在社交媒体上发布了一段视频,展示了在一台拥有 26 年历史的奔腾 II 电脑(配备 128MB 内存)上成功运行大型语言模型(LLM)的过程。这台古老的 350MHz Elonex 奔腾 II 电脑运行了基于 Andrej Karpathy 开发的 Llama2.c 定制纯 C 推理引擎,并生成了一个关于“Sleepy Joe”的故事。令人惊讶的是,整个过程非常流畅,故事生成速度也相当可观。 EXO Labs 的愿景与使命 EXO Labs 由牛津大学的研究人员和工程师组成,致力于“普及人工智能”。...
大英百科集团的AI转型之路与上市计划
大英百科集团(Britannica Group),拥有超过250年的历史,近日传出以10亿美元估值寻求上市的消息。AI技术成为这家老牌出版商在激烈竞争中脱颖而出的关键因素。早在2000年,大英百科集团便收购了以色列AI初创企业Melingo,涉足自然语言处理(NLP)领域。Melingo的产品涵盖了客服系统、销售助理及知识库产品,并开发了希伯来语等复杂语言的机器翻译引擎,客户包括哈佛大学和必胜客等大型组织。 随着生成式AI浪潮的到来,大英百科集团推出了基于《大英百科全书》信息的在线聊天机器人,提供更可靠且通俗易懂的回答。此外,他...
通过noise_step和低精度训练显著降低GPT-3算力需求,仅用20MB存储空间,这篇探讨1.58-bit模型训练及反向传播替代的分布式训练新论文引发热议
突破性技术:GPT-3存储只需20MB,算力直降97% 近期,一篇关于大幅降低大语言模型(LLM)训练和存储成本的新论文引起了广泛关注。这篇由机器学习研究者Will Brickner发表的论文提出了一项名为“noise_step”的新技术,能够在不损失精度的情况下,将1750亿参数的GPT-3模型压缩至仅需20MB的存储空间,并且显著减少算力消耗(下降97%)。 不依赖反向传播的新训练方法 传统的神经网络训练依赖于反向传播算法,通过逐层计算损失函数对每个权重的梯度来更新网络权重。然而,noise_step技术打破了这一传统,允许模型直接在低精度(...
深度体验AI零食:无印良品味道测试揭示食品创新的未来,AI模型助力味觉革命
AI食品创新:探索未来的味觉体验 近年来,AI技术在食品行业的应用逐渐增多。亿滋国际(奥利奥的母公司)宣布开发一款全新的AI工具,用于旗下品牌的口味创新。这并非AI与食品公司首次合作,此前无印良品和可口可乐等品牌也推出了由AI设计的新品。尽管早期的AI零食评价褒贬不一,但这一趋势无疑展示了AI在食品研发中的潜力。 为了深入了解AI零食的表现,小雷购买了无印良品推出的AI薯条,并与三款经典口味进行对比测试。这次测试不仅揭示了AI在口味创新上的优势,也暴露出其局限性。 口味PK:人类与AI的较量 无印良品的AI...