标签:AI模型
Meta发布最强AI模型,扎克伯格公开信解释为何支持开源?
北京时间7月24日,Meta(脸书母公司)公布了其最新的大型语言模型——Llama 3.1。这款模型被标榜为迄今为止最强大的开源模型之一,其实力足以与OpenAI等公司的专有大型模型相匹敌。 Meta的CEO马克·扎克伯格(Mark Zuckerberg)发布了一封公开信,详细阐述了他对AI开源的支持态度。他在脸书上发表的文章标题为“开源AI:通往未来的道路”。 扎克伯格认为,AI技术不应该仅仅掌握在少数几家大企业手中,即使是自己所在的公司也不例外。通过开源AI,技术专家能够深入了解高级AI模型的构建过程,并据此开发自己的AI应用程序。 回顾...
自定义Llama 3.1模型的利器来了!NVIDIA打造生成式AI代工厂,还有加速部署的微服务
在科技界的一次重大突破中,NVIDIA携手Meta,为全球企业开辟了一条通往生成式AI未来的崭新道路。近日,NVIDIA宣布启动NVIDIA AI Foundry服务,同时推出了NVIDIA NIM推理微服务,旨在与Meta最新发布的Llama 3.1系列开源模型协同工作,为企业提供前所未有的AI支持。 Llama 3.1,这一大语言模型家族,包括8B、70B和405B三种不同参数规模的版本,它们在超过16000个NVIDIA Tensor Core GPU的强大算力下孕育而生,并被精心优化,以适应NVIDIA的加速计算和软件环境,无论是数据中心、云端,还是搭载RTX GPU的工作站或PC,都能发挥...
字节跳动AI新动向预览:文生图技术或将创新长视频产业,豆包大模型引领短剧制作,抢先布局的公司一览(附相关概念股)
在即将到来的7月19日,字节跳动计划披露其在人工智能领域的最新突破,包括创新的文生图技术与类似Sora的新视频模型。这些AI模型特别在长视频和高动态场景中展现出独特优势,可能与OpenAI的Sora模型形成竞争态势。据知情人士透露,字节跳动已将AI大模型视为集团最高优先级项目。 在新加坡举行的ByteDance AI Luminary Talks活动中,字节跳动的研究科学家周大权将详细介绍关于“连续高动态的长视频生成方案”的前沿研究。作为短视频行业的领头羊,字节跳动在AI技术的每一步发展都受到广泛关注。这次文生视频的布局预示着相关AI...
字节跳动AI技术新突破:7月19日揭晓文生图及长视频模型重大进展,豆包大模型引领语音识别创新
在即将到来的7月19日,字节跳动科技公司计划在其人工智能(AI)技术领域迈出重要一步。据钛媒体AGI报道,该公司将在本周五首次大规模展示其先进的AI模型技术,其中包括文生图和类Sora新视频技术。这些创新技术尤其在长视频和高动态图像处理方面展现出强大的潜力,有可能与Sora效果相媲美。内部消息透露,字节跳动已将AI大模型列为集团最高优先级P0项目。 不仅如此,抖音和剪映等多个内部团队也正致力于研发AI视频模型的应用,并有望在不久的将来对外公布。字节跳动将在新加坡主办一场名为“ByteDance AI Luminary Talks”的活...
AI模型遭遇常识挑战:数字比较出错,9.11与9.9大小分辨,tokenizer与角色扮演提示揭示问题所在
在人工智能的世界里,即使是最新最先进的模型也可能面临尴尬的挑战。近期,一些顶级大模型在面对“9.11 和 9.9 哪个大”的简单问题时,竟然给出了错误的答案。GPT-4o 和谷歌的 Gemini Advanced 付费版都认为 9.11 更大,而 Claude 3.5 Sonnet 提供了荒谬的计算方法。这个问题揭示了尽管AI在复杂数学问题上的能力日益增强,但在基本常识方面仍有不足。 一位名叫 Riley Goodside 的提示词工程师发现了这个问题,他在测试 GPT-4o 时发现模型错误地认为 9.11 更大。当他尝试改变提问方式或限定为实数比较时,结果并未改善。有趣的...
苏妈掷48亿现金吞下AI模型公司,英伟达有的AMD也要有
AMD近期宣布以48亿人民币的全现金交易收购AI模型公司Silo AI,旨在强化自身在AI领域的实力。Silo AI是欧洲最大的私营AI实验室,由多名业界知名人士共同创立,拥有300名AI专家。此次收购将加速AMD在AI解决方案的采用,扩展其开源AI软件能力。Silo AI专注于定制化AI模型和端到端解决方案,服务包括安联、飞利浦等知名企业。AMD的这一举措表明其正积极扩大AI生态系统,与英伟达展开竞争。AMD高级副总裁Boppana表示,尽管交易不会立即影响财务,但有可能释放未来商业潜力。 Silo AI的CEO Peter Sarlin将继续领导团队,成为AMD A...
Meta的LLM Compiler:AI模型驱动的代码优化利器,提升编译效率与生成质量
在近日,Meta 推出了一项创新技术——LLM Compiler,这是一款基于Code Llama构建的新型代码优化工具。这款模型已经在Hugging Face平台上发布,提供了70亿和130亿参数两种版本,供学术界和商业领域免费使用。欲了解更多详情,敬请访问该项目的官方链接(点此进入)。 Meta指出,虽然当前的多种语言模型在处理编程任务时表现出色,但在代码优化方面仍有提升空间。LLM Compiler应运而生,它是一个专门针对代码优化任务设计的预训练模型,能效仿编译器对代码进行智能优化,甚至可以将优化过的代码还原为原始语言形式。 为了实现...
高通骁龙X Elite平台赋能:AI模型开放,神经处理单元驱动开发者创新中心
在科技日新月异的今天,高通公司近期在Computex大会上推出的骁龙 X Elite平台备受关注。尽管在发布会上,高通主要突显了该平台的AI能力,但要充分利用其Hexagon神经处理单元(NPU)的45 TOPS强大性能,离不开配套的AI软件。现在,高通已经为开发者准备了针对Hexagon NPU的定制化、优化和验证过的AI模型,这些资源可在高通的AI Hub获取,助力快速创建AI应用程序。 高通AI Hub不仅提供多样化的边缘设备优化AI模型,覆盖图像识别、物体检测、语义分割及创新AI等多个领域,还配备工具和文档,使开发者能轻松将AI模型应用于视觉...
AI功能仅两款iPhone能用!苹果被存储卡了脖子
近期,苹果新推出的Apple Intelligence特性引发关注,但由于存储空间的局限,该功能无法在所有设备上运行,揭示了苹果在端侧人工智能(AI)发展的存储困境。据业内专家郭明錤分析,只有iPhone 15系列中的高端型号15 Pro和Pro Max才能享受到Apple Intelligence的支持,关键因素可能是这些型号搭载的DRAM内存大小。 虽然A16芯片的AI处理能力强大,可达到17TOPS,但其6GB的DRAM容量相对较小,相比之下,M1芯片设备的8GB内存可以支持Apple Intelligence运行。Apple Intelligence需要大约0.7-1.5GB的DRAM空间,如果苹果计划采用...
为什么斯坦福大学生要抄袭中国大模型?
斯坦福大学AI团队涉嫌抄袭中国面壁智能公司开源成果的事件引发了广泛关注。该团队发布的大模型Llama3V被指与面壁智能的MiniCPM-Llama3-V2.5高度相似,后者在5月中旬发布。尽管模型开源允许二次开发,但未标明基于面壁智能成果的行为被批评为不诚实。面壁智能团队证实,他们的模型曾用于识别战国古文字,而斯坦福团队的模型不仅识别出了同样的文字,连错误也一致,坐实了抄袭嫌疑。事件特别之处在于涉及的两方——斯坦福大学和清华大学,都在全球AI领域具有重要地位。斯坦福团队成员已道歉,指出是由于团队内一人为了快速成名而...