标签:大语言模型
人工智能资讯一站式平台:掌握生成式AI与大语言模型最新动态
当然可以!以下是对原文进行整理后的SEO优化版本,保留了原文核心信息,同时更符合搜索引擎优化要求,结构更清晰、关键词更突出。 ## (由多段落组成) 在人工智能技术迅猛发展的当下,各类创新成果、前沿产品和应用场景层出不穷。无论是技术从业者、创业团队,还是科技爱好者,都面临着一个共同难题:如何快速、全面地获取高质量的AI相关信息?为了解决这一信息获取难题,AIbase资讯平台应运而生,致力于打造一个专业、高效、实时更新的AI资讯整合平台,帮助用户掌握全球人工智能领域的最新动态和实用工具。 全球AI动...
GPT-5重磅发布,AI编程能力再上新台阶
北京时间8月8日凌晨1点,OpenAI正式发布了新一代大语言模型——GPT-5。这场备受瞩目的发布会持续了78分钟,远超以往任何一次产品发布,也充分体现了GPT-5在技术层面的重大突破。 OpenAI创始人Sam Altman在会前就放出豪言:“测试完GPT-5后,我感觉自己一无是处。”虽然听起来有些夸张,但从发布会现场展示的能力来看,这种评价并非空穴来风。 从“学生”到“专家”的进化 Altman在介绍GPT-5时表示,GPT-3像是一个高中生,GPT-4则更像是一名大学生,而GPT-5已经成长为一位“跨领域的专家”。这一代模型在推理能力、上下文处理、多模...
分布式训练与DeepSeek架构支持下的3090单卡部署:个人开发者如何高效训练400亿参数大语言模型Psyche Network
整理后的文章: 个人开发者如何训练400亿参数大模型:分布式算力、DeepSeek架构与3090单卡部署 近年来,AI技术的快速发展使得大规模语言模型(LLM)成为研究热点。然而,这些模型通常需要庞大的计算资源和时间才能完成训练,因此往往由科技巨头主导。而现在,这一局面正在被改变。 Nous Research推出了一项名为Psyche Network的新技术,旨在通过整合全球分布式算力来训练强大的人工智能模型。Psyche基于DeepSeek的V3 MLA架构,采用去中心化的方式进行训练。在测试网首次启动时,Psyche直接对一个拥有40B参数的LLM进行了预...
新型AI芯片助力大语言模型实现能耗降低数据中心迈向可持续发展未来
整理后的 随着人工智能技术的快速发展,大语言模型(LLM)已成为科技领域的焦点。然而,这些模型的高能耗问题也日益凸显。近日,美国俄勒冈州立大学的研究团队成功开发出一款新型AI芯片,这一突破性成果有望为解决大语言模型的能源消耗问题提供新的解决方案。 该研究成果在波士顿举行的IEEE定制集成电路会议上正式发布,引起了广泛关注。这款新型芯片通过引入先进的AI技术,显著降低了数据传输过程中的能耗。研究团队表示,当前以谷歌“双子座”和OpenAI的GPT-4为代表的大语言模型,由于其庞大的参数规模,导致算力需求和能...
标题:大语言模型GPT-4o出现人性化交互过度问题,OpenAI承认谄媚倾向并计划一周内修复
感谢IT之家网友GreatMOLA提供的线索! 4月28日消息,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)近日发文,针对用户对GPT-4o情感表现的反馈作出回应。他指出,最新版本的GPT-4o在最近几次更新后出现了“过度谄媚”的交互倾向,并承诺将在一周内发布修复方案。这一问题反映了大语言模型(LLM)在追求人性化交互时面临的伦理和技术双重挑战。 根据OpenAI的更新日志显示,GPT-4o于3月27日进行了全面升级,并在4月25日进一步优化了其记忆存储机制的选择策略,显著提升了其在科学、技术、工程及数学(STEM)领域的解答能力。同...
大语言模型与智能体融合:ICLR 2025北京论文分享会跨模态扩散模型最新进展本周日等你来探索
(由多段落组成) 从 OpenAI o1 到 DeepSeek R1,推理模型已经迈入了全新的发展阶段。这些模型所展现的「慢思考、强推理」能力正加速推动从语言智能到认知智能的演进,并为未来的人工通用智能(AGI)奠定了重要基础。与此同时,学术界对大语言模型的研究仍在深入展开,扩散模型不断向主流的自回归架构发起挑战。 在 2025 年智能体元年,大语言模型(LLM)驱动的智能体通过手机等移动终端落地,彻底改变了人机交互的方式。此外,多模态大模型的竞争也愈发激烈,各大厂商不仅致力于提升跨模态理解与生成能力,还注重实现低成...
大语言模型与推理模型进展:ICLR 2025论文分享会自回归架构与多模态大模型趋势解析,迈向AGI北京见
从 OpenAI o1 到 DeepSeek R1,推理模型已经迈入了全新的发展阶段。这些模型展现出的「慢思考、强推理」能力正在加速推动语言智能向认知智能的转变,并为未来的通用人工智能(AGI)奠定了重要基础。与此同时,学术界对大语言模型的研究仍在深入,扩散模型持续挑战主流的自回归架构。随着 2025 年智能体元年的到来,由大语言模型(LLM)驱动的智能体通过手机等移动终端实现落地,彻底改变了人机交互的传统模式。此外,多模态大模型的竞争日益激烈,不仅提升了跨模态的理解与生成能力,还注重低成本和低门槛的应用。 为了帮助...
AI代理与大语言模型结合:科技趋势下聊天机器人与AI助手的未来发展
近年来,AI技术的迅速发展使其成为全球关注的焦点。根据凤凰网科技讯报道,北京时间3月30日,《华尔街日报》指出,硅谷科技巨头们正在热烈讨论一个新概念——“AI Agents”(AI代理或AI智能体),并将其视为未来的重要趋势。然而,目前对于这一术语的定义尚未形成统一标准,这导致了市场上的一定混乱。 金融服务公司第一资本(Capital One)的首席科学家兼企业AI负责人普雷姆·纳塔拉詹(Prem Natarajan)形象地将这种现象比喻为“盲人摸象”。他表示,不同的人对AI代理的理解可能大相径庭,就像每个人都在触摸大象的不同部位,得出的...
人工智能大语言模型在时间推理任务上的挑战:时钟识别与日历任务为何难倒AI?
(由多段落组成) 随着人工智能技术的飞速发展,AI 已经能够生成逼真的图像、创作小说,甚至预测蛋白质结构。然而,一项最新的研究发现,这些看似无所不能的 AI 在一项非常基础的任务上却频频出错——那就是读取时间。爱丁堡大学的研究团队测试了七款知名的多模态大语言模型,评估它们通过时钟或日历图像回答时间相关问题的能力。 这项研究将在 4 月正式发布,但目前已在科研共享平台 arXiv 上公开。研究表明,即使是当前最先进的大型语言模型,在处理这种基础任务时也表现不佳。研究人员指出:“从视觉输入中解读时间并进行...
AI Agent与大语言模型:从思考到行动的数字员工革命及伦理问题探讨
2025年3月,一款名为Manus的AI产品在社交媒体上引起了广泛关注。它的内测邀请码一码难求,甚至被炒至数万元,并带动了超过150只AI智能体概念股涨停。Manus之所以受到如此关注,不仅因为它在GAIA基准测试中超越了OpenAI的Operator模型,达到了当前技术的最佳水平(SOTA),更因为它代表了一种全新的AI形态——AI Agent(人工智能智能体)。与我们熟悉的ChatGPT等生成式AI不同,AI Agent实现了从“思考”到“行动”的跨越。 ChatGPT更像是一个超级大脑,擅长回答问题和生成,但仅停留在思考层面。而AI Agent则更进一步,不仅能思考...