每日AI快讯

Mistral Small 3与Tülu 3 405B:探索更小、更便宜的大型语言模型及量化技术在后训练方法中的应用进展

Mistral AI 和 Allen 人工智能研究所发布最新大型语言模型 1月31日,站长之家(ChinaZ.com)报道,Mistral AI 和 Allen 人工智能研究所(简称 Ai2)分别发布了最新的大型语言模型(LLM)。Mistral 推出的 Mistral Small 3 模型参数量为240亿,远少于市场上的其他先进 LLM。这使得它在启用量化后可以在某些 MacBook 上运行。量化技术旨在降低硬件资源需求的同时,减少输出质量的损失。 Mistral 在内部评估中将 Mistral Small 3 与 Meta Platforms Inc. 的开源 LLM Llama 3.3 70B Instruct 进行了对比。尽管 Mistral Small 3...

2024年AI行业变革下的生成式人工智能(AIGC):文生视频工具如何推动短视频平台创新与视频创作生态发展——Sora务虚、即梦和可灵务实的探索

自从ChatGPT成为有史以来最快突破亿级用户规模的消费级应用,AI行业迎来了前所未有的变革。随后,各界纷纷探讨AI将给人类社会带来的深刻影响与挑战。比尔·盖茨甚至认为生成式人工智能(AIGC)的重要性不亚于互联网的发明,将彻底改变我们的世界。两年后,AI确实带来了许多变化,但这些变化或许与最初预期有所不同,因此有人调侃说AI在“写诗作画”,而人类却还在“当牛做马”。 2024年,AIGC几乎彻底改变了互联网的生态,尤其是在文艺领域。长文本、文生图、文生视频等引人瞩目的爆点,几乎都发生在非标准化评价体系中,使得AI...

1000万美元开发AI模型不现实

印度AI使命进展与DeepSeek的崛起 去年3月,印度政府宣布了一项名为“印度AI使命”(IndiaAI mission)的12.5亿美元投资计划,旨在支持AI初创企业并开发本土AI基础设施。近日,印度电子和信息技术部部长阿什维尼·维什瑙(Ashwini Vaishnaw)在奥里萨邦的一次活动中表示,尽管有人质疑政府的投资承诺,但DeepSeek的成功证明了智慧的力量。该公司仅用550万美元就开发出了强大的AI模型。 维什瑙回应OpenAI CEO的质疑 维什瑙的言论似乎针对的是OpenAI首席执行官萨姆·奥特曼(Sam Altman)在2023年访问印度时发表的评论。当时,奥...

提升搜索体验:谷歌Ask for Me AI代打电话,轻松搞定商家预约和价格查询

谷歌推出AI代打电话新功能“Ask for Me”,提升用户搜索体验 1月30日,谷歌公司宣布在其Search Labs中推出一项名为“Ask for Me”的实验性新功能。该功能允许用户通过AI代替自己致电商家,咨询价格、服务可用性等信息。这项创新旨在简化用户的查询流程,让用户无需亲自拨打电话即可获取所需信息。 目前,“Ask for Me”已与多家美国汽车修理厂和美甲沙龙店合作,提供包括营业时间、费用等在内的相关信息。商家可以选择是否接受AI代打电话,并且在通话开始时会明确告知对方是由AI发起的电话。这一透明化设计确保了沟通的诚信和透...

OpenAI再获2900亿巨额AI融资,软银等投资者助力估值突破2万亿,人工智能领域迎来新高峰

OpenAI新一轮融资谈判,估值或达3000亿美元 据《华尔街日报》报道,OpenAI正在与日本软银集团进行初步谈判,计划在新一轮融资中筹集至多400亿美元(约合人民币2901亿元),使公司估值达到3000亿美元(约合人民币2.18万亿元)。这一估值较此前的1570亿美元几乎翻倍。知情人士透露,软银将领衔投资150亿至250亿美元,其余资金将来自其他投资者。 软银助力OpenAI融资,估值接近3400亿美元 根据知情人士的消息,软银和OpenAI最近就将OpenAI估值定为3400亿美元进行了洽谈。然而,在《华尔街日报》报道的早期版本公布后,估值被...

通过创新的FP4训练框架和低精度量化技术,微软实现大模型训练成本大幅降低,性能媲美BF16,混合精度设计助力高效训练

微软推出首个FP4精度大模型训练框架,显著降低计算和存储成本 近日,微软研究院推出了首个支持FP4(4位浮点)精度的大模型训练框架。这一创新使得在相同超参数设置下,训练效果与FP8和BF16相当,大幅减少了所需的存储和计算资源。这意味着模型规模最高可达130亿参数,训练Tokens数量也达到了千亿级别。 尽管目前尚无原生支持FP4的硬件,研究人员通过在FP8 TensorCore上模拟实现了FP4训练。未来,如果采用真正的FP4硬件,效果有望进一步提升。不少网友表示,这种方法不仅提高了效率,还几乎不损失训练质量,堪称“游戏规则改...

David Baker 利用 AI 设计蛋白质创新方法,针对三指毒素开发抗蛇毒血清,有望彻底改变蛇咬伤治疗方案,提升计算机设计方法在医学领域的应用前景

蛇咬伤治疗的重大突破:AI设计蛋白质中和致命蛇毒 每年,全球约有10万人因蛇咬伤而死亡,另有30万人因此永久残疾,尤其是在医疗资源匮乏的地区。目前的抗蛇毒血清主要依赖于动物血浆提取的多克隆抗体,存在成本高、副作用大以及对某些毒素效果有限等问题。 今年诺贝尔化学奖得主David Baker团队的一项研究为蛇咬伤治疗带来了新的希望。研究人员通过深度学习方法从头设计了新型蛋白质,能够有效中和蛇毒中的致命毒素,有望成为传统抗蛇毒血清的更安全、更有效的替代品。这项研究成果以「De novo designed proteins neutrali...

微软CEO Satya Nadella赞誉DeepSeek,宣布将其集成至Azure AI Foundry,助力客户利用R1模型和人工智能技术——优化搜索引擎抓取的关键信息展示

微软CEO纳德拉赞赏中国AI初创公司DeepSeek,开源模型R1引发广泛关注 站长之家(ChinaZ.com)报道,微软公司首席执行官Satya Nadella在最近的投资者电话会议上对中国人工智能初创公司DeepSeek给予了高度评价。DeepSeek推出的开源人工智能模型R1在美国科技界引起了广泛关注,并导致微软股价出现波动。 DeepSeek声称其R1模型在性能上不仅能够与西方技术相抗衡,甚至在某些方面超越了它们,而成本仅为西方技术的一小部分。这一创新引发了美国科技行业的广泛关注和讨论。Nadella表示:“DeepSeek确实有一些真正的创新,这些技术...

DeepSeek利用AI模型R1独立发现成本控制核心思路,OpenAI首席研究官亲自证实,引发业内广泛关注,连奥特曼都不得不发声评论这一突破性进展!

DeeSeek掀起全球AI革命,改变科技格局 短短几天内,DeeSeek凭借其R1模型在Hugging Face中的like数飙升,迅速登顶美国App Store榜首,引发了全球科技股的集体重挫。这股来自东方的力量展示了其强大的影响力。甚至连OpenAI首席研究官Mark Chen也不得不承认,DeepSeek确实独立发现了一些关键的AI核心理念,并且未来将发布更多模型。 OpenAI的回应与技术突破 面对外界的各种分析,Mark Chen表示现代AI系统采用了「预训练」和「推理」两大范式,提供了更灵活的优化空间,在降低成本的同时提升模型性能。Noam Brown也强调,算...

罗永浩或将再度进军手机领域,推出搭载AIOS系统的全新AI手机,集成J1Assistant和涟漪触控技术

罗永浩再度进军手机行业,AIOS成关键 2025年初,罗永浩再次引发锤粉们的热议。他在微博上回应了一位忠实用户的留言,表示单纯再做手机已经没有意义,但为了实现AIOS(人工智能操作系统),他可能会重新涉足硬件领域。计算机先驱阿伦·凯曾说过:“真正重视软件的人会自己做硬件。”这句话似乎也在为罗永浩的决策提供理论支持。 AIOS背后的逻辑 罗永浩对AIOS的钟情不难理解。iOS和Android两大移动操作系统已经在移动互联网时代占据了主导地位,谷歌和苹果也因此获得了巨大的商业成功。App Store和Google Play更是成为了与Steam...
16667686970310