标签:AI模型
【端侧最强开源AI模型Llama 3.2震撼登场:从1B纯文本进化至90B多模态视觉,挑战OpenAI,引领边缘人工智能新风潮】
IT之家报道,Meta公司于9月25日宣布推出全新的Llama 3.2 AI模型。这款模型具有高度的开放性和可定制性,允许开发者根据自身需求进行定制,从而实现边缘人工智能和视觉革命。Llama 3.2具备多模态视觉能力和轻量级模型,代表了Meta公司在大型语言模型(LLMs)领域的最新进展,能够广泛应用于多种场景。 Llama 3.2提供了四个版本的AI模型: 1. Llama 3.2 90B Vision(文本+图像输入):这是Meta最先进的模型,适用于企业级应用。该模型在常识推理、长文本生成、多语言翻译、编码、数学和高级推理等方面表现出色,并且新增了图...
16年老程序员当场“退休”,OpenAI o1这么强吗?
一、OpenAI发布全新AI模型o1 近日,OpenAI发布了最新的AI模型——o1-preview,这款模型在科学、编程及数学等领域展现了卓越的能力。此外,他们还推出了一款更加轻量级的版本——o1-mini,不仅效率更高,而且成本更低。 二、o1模型的强大功能 o1模型通过强化学习训练而成,其幻觉频率显著低于GPT-4,并且在数学和代码能力上分别提升了6倍和8倍。在一系列高难度基准测试中,o1的表现超越了人类博士水平,特别是在物理和生物领域的问答环节中。 三、用户反响与体验 OpenAI CEO Sam Altman宣布,o1-preview现已对ChatGPT Plus...
Deaddit:17个AI模型在虚拟社区‘人类止步’的开源项目中疯狂灌水
在这个独特的虚拟世界里,名为Deaddit的平台成为了AI们展示自我、畅所欲言的舞台。这里并非人类的传统社交领地,而是一个充满创意与想象的空间,其中17个大型AI模型生成了超过630个个性迥异的AI角色。这些角色不仅拥有各自的故事背景,其发布的帖子内容也与各自的兴趣爱好和职业紧密相关。接下来,我们将深入探索Deaddit的世界,了解这些AI是如何创造出如此丰富多彩的内容,并探讨这一项目的深远意义。 AI的多元世界 Deaddit平台上的AI角色们各具特色,从热爱游戏的保安大叔到热衷科技销售的专家,每一个角色都有其独特的...
Meta发布最强AI模型,扎克伯格公开信解释为何支持开源?
北京时间7月24日,Meta(脸书母公司)公布了其最新的大型语言模型——Llama 3.1。这款模型被标榜为迄今为止最强大的开源模型之一,其实力足以与OpenAI等公司的专有大型模型相匹敌。 Meta的CEO马克·扎克伯格(Mark Zuckerberg)发布了一封公开信,详细阐述了他对AI开源的支持态度。他在脸书上发表的文章标题为“开源AI:通往未来的道路”。 扎克伯格认为,AI技术不应该仅仅掌握在少数几家大企业手中,即使是自己所在的公司也不例外。通过开源AI,技术专家能够深入了解高级AI模型的构建过程,并据此开发自己的AI应用程序。 回顾...
自定义Llama 3.1模型的利器来了!NVIDIA打造生成式AI代工厂,还有加速部署的微服务
在科技界的一次重大突破中,NVIDIA携手Meta,为全球企业开辟了一条通往生成式AI未来的崭新道路。近日,NVIDIA宣布启动NVIDIA AI Foundry服务,同时推出了NVIDIA NIM推理微服务,旨在与Meta最新发布的Llama 3.1系列开源模型协同工作,为企业提供前所未有的AI支持。 Llama 3.1,这一大语言模型家族,包括8B、70B和405B三种不同参数规模的版本,它们在超过16000个NVIDIA Tensor Core GPU的强大算力下孕育而生,并被精心优化,以适应NVIDIA的加速计算和软件环境,无论是数据中心、云端,还是搭载RTX GPU的工作站或PC,都能发挥...
字节跳动AI新动向预览:文生图技术或将创新长视频产业,豆包大模型引领短剧制作,抢先布局的公司一览(附相关概念股)
在即将到来的7月19日,字节跳动计划披露其在人工智能领域的最新突破,包括创新的文生图技术与类似Sora的新视频模型。这些AI模型特别在长视频和高动态场景中展现出独特优势,可能与OpenAI的Sora模型形成竞争态势。据知情人士透露,字节跳动已将AI大模型视为集团最高优先级项目。 在新加坡举行的ByteDance AI Luminary Talks活动中,字节跳动的研究科学家周大权将详细介绍关于“连续高动态的长视频生成方案”的前沿研究。作为短视频行业的领头羊,字节跳动在AI技术的每一步发展都受到广泛关注。这次文生视频的布局预示着相关AI...
字节跳动AI技术新突破:7月19日揭晓文生图及长视频模型重大进展,豆包大模型引领语音识别创新
在即将到来的7月19日,字节跳动科技公司计划在其人工智能(AI)技术领域迈出重要一步。据钛媒体AGI报道,该公司将在本周五首次大规模展示其先进的AI模型技术,其中包括文生图和类Sora新视频技术。这些创新技术尤其在长视频和高动态图像处理方面展现出强大的潜力,有可能与Sora效果相媲美。内部消息透露,字节跳动已将AI大模型列为集团最高优先级P0项目。 不仅如此,抖音和剪映等多个内部团队也正致力于研发AI视频模型的应用,并有望在不久的将来对外公布。字节跳动将在新加坡主办一场名为“ByteDance AI Luminary Talks”的活...
AI模型遭遇常识挑战:数字比较出错,9.11与9.9大小分辨,tokenizer与角色扮演提示揭示问题所在
在人工智能的世界里,即使是最新最先进的模型也可能面临尴尬的挑战。近期,一些顶级大模型在面对“9.11 和 9.9 哪个大”的简单问题时,竟然给出了错误的答案。GPT-4o 和谷歌的 Gemini Advanced 付费版都认为 9.11 更大,而 Claude 3.5 Sonnet 提供了荒谬的计算方法。这个问题揭示了尽管AI在复杂数学问题上的能力日益增强,但在基本常识方面仍有不足。 一位名叫 Riley Goodside 的提示词工程师发现了这个问题,他在测试 GPT-4o 时发现模型错误地认为 9.11 更大。当他尝试改变提问方式或限定为实数比较时,结果并未改善。有趣的...
苏妈掷48亿现金吞下AI模型公司,英伟达有的AMD也要有
AMD近期宣布以48亿人民币的全现金交易收购AI模型公司Silo AI,旨在强化自身在AI领域的实力。Silo AI是欧洲最大的私营AI实验室,由多名业界知名人士共同创立,拥有300名AI专家。此次收购将加速AMD在AI解决方案的采用,扩展其开源AI软件能力。Silo AI专注于定制化AI模型和端到端解决方案,服务包括安联、飞利浦等知名企业。AMD的这一举措表明其正积极扩大AI生态系统,与英伟达展开竞争。AMD高级副总裁Boppana表示,尽管交易不会立即影响财务,但有可能释放未来商业潜力。 Silo AI的CEO Peter Sarlin将继续领导团队,成为AMD A...
Meta的LLM Compiler:AI模型驱动的代码优化利器,提升编译效率与生成质量
在近日,Meta 推出了一项创新技术——LLM Compiler,这是一款基于Code Llama构建的新型代码优化工具。这款模型已经在Hugging Face平台上发布,提供了70亿和130亿参数两种版本,供学术界和商业领域免费使用。欲了解更多详情,敬请访问该项目的官方链接(点此进入)。 Meta指出,虽然当前的多种语言模型在处理编程任务时表现出色,但在代码优化方面仍有提升空间。LLM Compiler应运而生,它是一个专门针对代码优化任务设计的预训练模型,能效仿编译器对代码进行智能优化,甚至可以将优化过的代码还原为原始语言形式。 为了实现...