标签:Nvidia

英伟达NVIDIA推出AI智能体安全利器NeMo Guardrails,为大模型聊天提供内容安全保障微服务,确保智能交互更安全可靠。

NVIDIA 推出安全可信的AI智能体开发利器:NIM Al Guardrail微服务 近日,智东西报道了NVIDIA(英伟达)在国际消费电子展CES 2025上发布了一系列AI新品后,最新推出了一款用于开发安全、可信的AI智能体的工具——NVIDIA NIM Al Guardrail微服务。这款工具旨在解决企业在开发AI智能体时面临的信任、物理安全、网络安全和合规性等关键问题。 AI智能体,即生成式AI的重要发展方向之一,有望成为能够完成各种任务的“知识机器人”,大幅提升全球数十亿知识工作者的生产力。通过使用NIM微服务,开发的AI智能体将参考特定语境准则,做...

Nvidia 在人工智能领域的布局:探索其投资的顶级GPU驱动型初创公司

Nvidia引领人工智能投资热潮,助力AI生态系统发展 在当今的人工智能(AI)革命中,Nvidia无疑是最耀眼的明星之一。自2021年推出ChatGPT以来,Nvidia不仅在收入、盈利能力和现金储备方面实现了显著增长,还推出了多个具有竞争力的生成式AI服务。其股价更是在短短两年内飙升了八倍多。作为全球领先的高性能GPU制造商,Nvidia充分利用其不断膨胀的财富,大幅增加了对各种初创企业的投资,尤其是AI领域。 根据PitchBook的数据,2024年Nvidia参与了49轮AI公司融资,较2023年的34轮有显著增加。与前四年的总和相比,这是一个巨大...

NVIDIA发布全球最小AI超级计算机,搭载Blackwell GPU与Grace CPU,联发科参与共创迷你机大小的Project DIGITS

NVIDIA发布新一代个人AI超级计算机:Project DIGITS 1月7日,NVIDIA在快科技的报道中宣布,除了备受瞩目的RTX 50系列桌面和笔记本显卡外,还推出了一款代号为“Project DIGITS”的全新个人AI超级计算机。这款迷你型设备具备千万亿次级的性能,专为AI大模型的原型设计、微调和运行而打造。 核心硬件配置 Project DIGITS搭载了一颗名为“GB10”的超级芯片,该芯片结合了Blackwell GPU和Grace CPU,通过NVLink-C2C互连技术实现高效协作。值得一提的是,联发科也参与了这颗超级芯片的设计,尤其是在CPU部分和互连部分,提供了卓...

NVIDIA特供版H20 GPU在中国市场大放异彩,AI加速器助力数百亿美元增长浪潮

NVIDIA特供版AI GPU在中国市场表现强劲,H20成最大赢家 根据快科技12月30日的报道,NVIDIA为了将AI GPU加速器销售到中国市场,推出了一系列特供版产品。这些特供版GPU包括早期的A800、H800,以及后来的H20、L20和L2。其中,基于新Hopper架构的H20特别受到中国客户的青睐,主要用于训练任务,而L20和L2则是基于Ada架构的推理卡,需求相对较低。 根据分析机构Claus Aasholm的数据,H20在中国市场的销量非常出色,每个季度的环比增幅约为50%,成为NVIDIA在中国最成功的产品之一。尽管没有具体收入数据,但据信H20已经为NVIDIA...

NVIDIA全新nGPT助力大型语言模型训练速度大幅提升,归一化Transformer技术引领AI未来潮流,模型精度再创新高

快科技10月20日报道,NVIDIA的研究团队近期发布了一项可能彻底改变人工智能未来的创新成果——归一化Transformer(nGPT)。这一新型神经网络架构在超球面上进行表示学习,显著提升了大型语言模型(LLM)的训练速度,最高可达到20倍,同时保持了模型的精度。 nGPT的核心技术在于将所有向量,包括嵌入、多层感知机(MLP)、注意力矩阵和隐藏状态,归一化为单位范数。这种归一化处理使输入的token在超球面上移动,每一层模型通过位移来贡献最终的输出预测。实验结果显示,与标准Transformer模型相比,nGPT在训练时所需的步骤减少...

富士康利用4608块NVIDIA B200 GPU打造鸿海高雄超级计算中心,目标实现全球顶尖AI超级计算能力:将达到现有Top1中心性能的8.5倍,并迈进EFLOPS级计算时代。

近日,据媒体报道,富士康宣布与NVIDIA达成合作,共同打造全球最快的单体AI超级计算中心——鸿海高雄超级计算中心。该计算中心采用NVIDIA GB200 NVL72服务器作为基础节点,每个节点内置36个Grace CPU和72个B200 GPU。 不同机柜之间通过129.6TB/s带宽的NVLink总线进行互联,使72个GPU系统能够作为一个统一的整体运行,提供高达3240 TFLOPS的FP64和FP64 Tensor Core性能。预计该超级计算中心将部署64个机架的NVIDIA GB200 NVL72服务器,总共包含2304个Grace CPU和4608个B200 GPU,提供超过90 EFLOPS(每秒9000亿亿次浮点运算)...

NVIDIA GeForce RTX标志升级:引入AI与Tensor张量核心技术,助力DLSS超分辨率功能提升游戏体验!

近日,据快科技报道,NVIDIA 对其“GeForce RTX”品牌标志进行了低调更新,新增了一行小字“Powering Advanced AI”,即“打造先进AI”的意思。这一变化不仅体现在未来的RTX显卡零售包装盒上,还将出现在预装台式机和笔记本电脑中。 GeForce 作为 NVIDIA 的游戏显卡品牌,自早期的 GTX 系列到如今的 RTX 系列,一直专注于游戏领域。然而,近年来 GPU 成为了 AI 加速计算的强大芯片,并且 NVIDIA 在 CUDA 生态系统中的优势使其在这个领域几乎无可匹敌。尽管 Intel 和 AMD 提倡 CPU、GPU 和 NPU 三位一体的策略,但 NVIDIA 在 AI 计...

NVIDIA数据中心与AI领域的资本支出决策分析:股价一夜暴跌2000亿美元背后的原因

近期,关于AI需求是否强劲的话题引发了广泛关注,“卖铲人”最先感受到了市场的温度。随着云计算厂商资本支出的增加,市场上出现了“AI泡沫论”的声音。在这个背景下,NVIDIA迎来了一季度备受瞩目的财报发布。 周三收盘后,NVIDIA公布了2025财年第二季度的财报,营收达到了创纪录的300亿美元,同比增长122%。其中,数据中心业务的表现尤为突出,实现了263亿美元的历史新高。尽管如此,NVIDIA的股价在财报公布后依然下跌了6.6%。 股价下跌的主要原因是数据中心业务的环比增长率显著放缓,仅增长了16%。这表明,云厂商等大客户的...

英伟达NVIDIA NIM:几分钟内构建AI应用的全新升级工具 – NVIDIA, AI, 生成式人工智能, OpenUSD

NVIDIA 在 SIGGRAPH 2024 的重大突破 在备受瞩目的计算机图形学会议 SIGGRAPH 2024 上,NVIDIA 展示了其在渲染、仿真与生成式人工智能领域的最新成果。其中,最令人瞩目的无疑是 NVIDIA NIM 平台的全面升级。 NVIDIA NIM:AI 创新的加速器 NVIDIA NIM 是英伟达为应对生成式 AI 时代挑战而推出的关键平台。它允许用户在极短的时间内构建 AI 应用程序,极大地简化了从模型开发到部署的整个流程。英伟达创始人兼CEO 黄仁勋将其形象地称为“AI-in-a-Box”,意味着用户可以通过标准化的流程轻松部署复杂的 AI 模型,进一步提升...

自定义Llama 3.1模型的利器来了!NVIDIA打造生成式AI代工厂,还有加速部署的微服务

在科技界的一次重大突破中,NVIDIA携手Meta,为全球企业开辟了一条通往生成式AI未来的崭新道路。近日,NVIDIA宣布启动NVIDIA AI Foundry服务,同时推出了NVIDIA NIM推理微服务,旨在与Meta最新发布的Llama 3.1系列开源模型协同工作,为企业提供前所未有的AI支持。 Llama 3.1,这一大语言模型家族,包括8B、70B和405B三种不同参数规模的版本,它们在超过16000个NVIDIA Tensor Core GPU的强大算力下孕育而生,并被精心优化,以适应NVIDIA的加速计算和软件环境,无论是数据中心、云端,还是搭载RTX GPU的工作站或PC,都能发挥...
12