每日AI快讯

中信建投:AI服务器高集成度趋势下,铜连接或成为AI服务器的重要组成

中信建投证券于7月24日发布了一份研究报告,详细介绍了英伟达最新推出的GB200 NVL72服务器。这款服务器不仅显著提升了集成化水平,还在机柜内部采用了高速铜缆作为通信互连手段。通过采用无源DAC(直接模拟转换)作为主要的电通信解决方案,英伟达成功地实现了既经济又可靠的短距离数据传输方案。由于无源DAC不包含光电转换器模块,因此在成本效益和运营稳定性方面表现优异。 当前,铜缆技术已能够支持224G以太网Serdes高速通信技术,这使得它在短距离传输中展现出极高的性价比。基于这一技术进步,中信建投证券通过合理的...

自定义Llama 3.1模型的利器来了!NVIDIA打造生成式AI代工厂,还有加速部署的微服务

在科技界的一次重大突破中,NVIDIA携手Meta,为全球企业开辟了一条通往生成式AI未来的崭新道路。近日,NVIDIA宣布启动NVIDIA AI Foundry服务,同时推出了NVIDIA NIM推理微服务,旨在与Meta最新发布的Llama 3.1系列开源模型协同工作,为企业提供前所未有的AI支持。 Llama 3.1,这一大语言模型家族,包括8B、70B和405B三种不同参数规模的版本,它们在超过16000个NVIDIA Tensor Core GPU的强大算力下孕育而生,并被精心优化,以适应NVIDIA的加速计算和软件环境,无论是数据中心、云端,还是搭载RTX GPU的工作站或PC,都能发挥...

扎克伯格大招被扒光!开源大模型打脸GPT-4o商业化路径也已隐现

Meta的LLaMA 3.1 405B:一场开源AI的胜利? 科技界再次掀起波澜,Meta计划在当地时间7月23日揭晓其最新力作——LLaMA 3.1 405B,一款拥有4050亿个参数的巨无霸模型,具备多模态处理能力,能够轻松应对图像与文本的生成与理解任务。然而,这款备受期待的模型竟在正式亮相前遭遇意外泄露,信息迅速在开源AI社区Hugging Face上流传开来,引发广泛关注。 泄露的细节揭示,LLaMA 3.1 405B在多项关键AI基准测试中的表现令人瞩目,甚至超越了竞争对手Claude 3.5 Sonnet,成为MMLU-Pro评估中的新王者。虽然在某些特定测试中稍显逊色...

端到端自动驾驶的突破:北理工创新技术让性能翻番

在自动驾驶领域,一项由北京理工大学计算机学院主导的研究正在引起广泛关注。这项研究不仅在资源利用上更加高效,还在性能提升方面取得了显著成果,堪称端到端自动驾驶领域的重大突破。在最新一期的CVPR 2024会议上,该团队的研究成果荣获最佳论文奖,其创新性的“蒸馏”技术——PlanKD,成功地将端到端自动驾驶系统的性能提升了近100%,且无需牺牲系统可靠性或增加额外成本。 解决行业痛点:资源限制下的性能优化 长期以来,基于Transformer架构的自动驾驶大模型因庞大的参数量和高计算需求,使得在资源受限的车载环境下部署...

谷歌AI「神算」NeuralGCM震撼Nature:30秒完成22天天气模拟,效率提升10万倍!

在科技日新月异的今天,一种革命性的新技术——NeuralGCM,正在悄然改变我们对天气和气候预测的传统认知。想象一下,如果有一种方法能精准预测未来几天乃至数十年的天气变化,这将如何深远地影响我们的日常生活?这看似科幻电影中的情节,却正逐渐成为现实。 NeuralGCM,全称神经通用循环模型,是由Google Research等顶尖科研团队联合研发的一项创新技术。它巧妙地融合了传统天气模型的物理原理与前沿的机器学习算法,旨在提供覆盖短至几日长至数十年的全面预测服务。与传统的天气预报模型相比,NeuralGCM不仅提升了预测的精...

大模型的招投标订单都被谁抢走

大模型技术在全球范围内引发了一场科技革命,中国紧跟潮流,迅速将这项技术应用于各个领域,显著提高了企业运营效率与用户体验。然而,大模型企业在技术成熟性、成本控制、数据保护、行业适应性及市场接纳度等方面遭遇挑战,如何实现商业化成为亟待解决的难题。 大模型技术经过一年的实践,虽然To C领域的商业化路径尚未明晰,但在招投标市场上已展现出巨大潜力。据统计,2023年全年,大模型采购需求达到190次,市场规模高达5.95亿元;而至2024年上半年,仅半年时间,招投标市场就产生了498次相关招标项目,总额超过13.4亿...

马斯克xAI超级计算工厂:打造全球最强AI,震撼业界

在这个飞速发展的科技时代,埃隆·马斯克再次以其前瞻性的眼光和创新精神引领潮流。据最新报道,马斯克通过其社交平台宣布,他的xAI团队已经启动了一项雄心勃勃的计划——建立“全球最强大的AI集群”,旨在年底前创造出“史上最强大的人工智能”。 位于美国孟菲斯的超级计算工厂“Supercluster”是这一壮举的核心。它采用了先进的RDMA架构,集成了惊人的10万个液冷H100 GPU,这一规模不仅前所未有,更是在AI训练效率方面创造了新的记录,被誉为当今世界顶尖的AI训练平台。 令人瞩目的不仅是Supercluster的硬件配置,还有其超预期的...

中信证券:国内AI算力加速,关注算力与网络产业链

在2024年的科技浪潮中,人工智能(AI)产业犹如一颗璀璨的新星,迅速崛起并照亮了整个科技领域的天空。中信证券的一份深度研究报告指出,自年初以来,中国各大云服务提供商及电信运营商对AI领域的投资力度空前加大,展现出强烈的行业信心与市场潜力。据报告透露,三大运营商已联手推出了高达310亿元人民币的人工智能服务器采购计划,这一数字不仅彰显了中国在AI基础设施建设上的决心,也预示着未来市场的广阔前景。 然而,在全球科技竞争日益激烈的背景下,美国对华的技术出口限制为中国本土企业带来了前所未有的挑战与机遇...

2024国际基础科学大会“计算机之夜”

2024年国际基础科学大会的“计算机之夜”活动成功举行,吸引了众多计算机科学领域的专家和学者。丘成桐先生作为大会主席,强调计算机科学与人工智能在基础科学中的重要角色,并呼吁打破学科界限,共同促进科学发展。 Leslie Valiant教授则探讨了计算机科学与其他学科的交叉融合对科技进步的意义。腾讯的刘威博士和京东的何晓冬博士分别就腾讯混元大模型和生成式AI技术的发展进行了主旨演讲,展示了在多模态生成模型、图像和视频生成领域的创新。 圆桌讨论环节,各位嘉宾深入讨论了人工智能的正反面影响,呼吁平衡利用AI并关...

UMedPT模型在外部独立验证中表现出色,仅1%原始数据可达最佳性能

在生物医学成像领域,基础模型的预训练已成为一项关键技术,但受限于小规模和专业化的数据集。德国弗劳恩霍夫数字医学研究所(Fraunhofer MEVIS)的研究团队提出了一种创新的多任务学习策略,以解决数据稀缺的问题。他们开发的通用生物医学预训练模型(UMedPT)在多种成像任务上进行训练,包括CT、显微镜和X射线图像,采用分类、分割和物体检测等多种标记策略。 UMedPT模型在外部独立验证中表现出色,其成像特征的跨中心可转移性达到了新的高度。研究发表在2024年7月的《Nature Computational Science》上,题为“克服生物医...