标签:开源

阿里巴巴开源新模型Qwen2-Math:人工智能领域的数学推理专家,超越GPT-4o,数学能力全球领先!

阿里巴巴发布Qwen2-Math:数学推理领域的全新突破 近期,阿里巴巴宣布开源了一款名为Qwen2-Math的强大数学模型,此模型旨在为数学推理领域带来革命性的进展。Qwen2-Math提供基础和指令微调两个版本,并包含了1.5B、7B和72B三种不同规模的参数配置。经过主流数学基准测试验证,Qwen2-Math-72B指令微调版展现出了超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro等知名闭源模型的卓越性能,甚至在与Meta的Llama-3.1-405B模型的竞争中也占据优势。这一成就确立了Qwen2-Math-72B在全球数学推理领域的领先地位。 基础模型的深度...

智谱AI的国产Sora视频生成模型开源发布!CogVideoX-2B优化至18G,单张4090显卡即可运行

智东西8月6日报道,智谱AI发布了其视频生成模型CogVideoX-2B的开源版本,这一消息无疑为业界带来了振奋。该模型已在GitHub和Hugging Face平台上线,支持FP16精度下的高效运行,显著降低了硬件门槛——仅需配备18GB显存即可进行推理,而微调所需显存也不过40GB,这意味着单张4090或A6000显卡就能胜任相应任务。 核心特点 - 提示词限制:CogVideoX-2B支持最多226个token的提示词; - 输出规格:生成视频长度为6秒,帧率为8帧/秒,分辨率为720 * 480; - 未来规划:计划发布性能更优、参数量更大的版本。 性能表现 根据相关论...

智谱AI的清影系统上线:开源技术实现AI生成6秒视频,探索商业化路径

智谱AI发布AI生成视频模型“清影”:初步成果与商业化探索 7月26日,智谱AI正式推出了其AI生成视频模型——清影(Ying)。该模型已在清言App上线,为广大用户提供文本生成视频及图片生成视频的功能。只需30秒,即可生成一段6秒的视频。清影采用了免费排队与付费加速的模式,用户可以选择24小时5元或一年199元的服务。此外,清影API也已在大模型开放平台bigmodel.cn上线,为企业和开发者提供了便捷的接入途径。 智谱AI CEO张鹏表示,清影是公司在这一领域取得的一项初步成果。从产品角度来看,清影将作为独立产品进行商业化运营...

英伟达推出 AI 代工业务:携手 Meta Llama 3.1 开源模型,为客户定制部署“超级模型”

在科技界的一则重大新闻中,英伟达公司——全球领先的图形处理器制造商,于7月23日宣布推出了革命性的'NVIDIA AI Foundry'代工服务及'NVIDIA NIM'推理微服务,此举旨在进一步推动AI技术的发展与应用。感谢IT之家网友Snailwang提供的线索,让我们能够第一时间分享这一重要信息。 'NVIDIA AI Foundry'作为英伟达的最新力作,为客户提供了前所未有的机会,让他们能够利用Meta公司的Llama 3.1 AI模型,结合英伟达的专业软件、计算能力和行业知识,量身定制出针对特定领域的“超级模型”。通过融合专有数据与由Llama 3.1 405B和英伟...

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源

随着OpenAI的GPT-4o mini、Mistral AI的Mistral NeMo,以及HuggingFace的小模型相继亮相,小模型市场正迅速升温。苹果最新加入这场竞争,推出了DCLM小模型,以其卓越性能和全面开源策略引发业界关注。 苹果推出的DCLM小模型拥有70亿和14亿参数两个版本,其中70亿参数版本超越了Mistral-7B,性能接近Llama3和Gemma。苹果的研究科学家Vaishaal Shankar强调,DCLM是目前性能最佳的真正开源模型,提供完整权重和训练代码,基于开放数据集DCLM-Baseline。苹果的这一举措赢得了广泛好评,与多数科技巨头的闭源模型形成鲜明对比。 ...

自动驾駛与智能体新篇章!联汇科技OmAgent框架开源发布,引领行业应用爆发式增长

在科技创新的前沿,自动驾驶和大模型的发展轨迹相互映照。Google不仅是自动驾驶的先驱,其Transformer模型也引领了大模型的革新。如今,自动驾驶技术已从概念变为现实,彻底改变了传统驾驶方式,而大模型行业正在经历相似的快速发展阶段,各大顶尖团队竞相角逐,推动技术边界不断扩展。 联汇科技,作为大模型赛道的领先者,始终走在行业的最前沿。早在行业关注大模型初期,他们便聚焦多模态大模型,并荣获了工信部的首个大模型检测证书。去年,他们发布了OmModel V3,并推出国内首批发起的大模型驱动的自主智能体应用。今年...

Open-Sora开源视频生成:一键创造720p高清16秒创意内容,效果优化再升级

潞晨 Open-Sora 团队在视频生成领域取得了重大突破,他们成功地开发出了一种能够生成高清720p短片的模型,且风格多样,包括海浪、森林、赛博朋克等。令人兴奋的是,该团队决定将整个项目开源,分享给全球的开发者和创作者。在GitHub(https://github.com/hpcaitech/Open-Sora)上,用户可以获取模型权重和训练代码,自由创建各种视觉效果,如动画镜头和电影级镜头,提供高度逼真的体验。潞晨团队通过创新的视频压缩网络(VAE)和 Stable Diffusion 3 模型,实现了质量和成本之间的平衡,同时提升了生成速度和图像质量。此外...

为什么斯坦福大学生要抄袭中国大模型?

斯坦福大学AI团队涉嫌抄袭中国面壁智能公司开源成果的事件引发了广泛关注。该团队发布的大模型Llama3V被指与面壁智能的MiniCPM-Llama3-V2.5高度相似,后者在5月中旬发布。尽管模型开源允许二次开发,但未标明基于面壁智能成果的行为被批评为不诚实。面壁智能团队证实,他们的模型曾用于识别战国古文字,而斯坦福团队的模型不仅识别出了同样的文字,连错误也一致,坐实了抄袭嫌疑。事件特别之处在于涉及的两方——斯坦福大学和清华大学,都在全球AI领域具有重要地位。斯坦福团队成员已道歉,指出是由于团队内一人为了快速成名而...

首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度

港大与百度携手开发的UrbanGPT是首个智慧城市大模型,该模型全面开源开放。UrbanGPT针对时空预测技术的挑战,如数据稀缺、高昂的训练成本和泛化能力不足,提出了一种新型时空大型语言模型。该模型通过时空依赖编码器和指令微调方法,强化了对时间和空间复杂关系的理解,即使在数据有限的情况下也能提供精确预测。实验表明,UrbanGPT在零样本学习和多种城市任务上表现出卓越性能,尤其在跨区域和跨城市预测中,展示了强大的泛化能力和对时空模式的精确理解。

最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊

中国电信推出创新语音大模型,星辰语音,能识别和理解30多种包括温州话在内的方言,打破了以往单一模型仅支持特定方言的局限。该模型在多项国际比赛中表现出色,如INTERSPEECH2024和NIST低资源粤语识别任务,并已在智能客服等领域应用。中国电信是首个完成大语言模型研发并开源的央企,其语音大模型以超大规模语音预训练和多方言联合建模为核心技术,有效降低了新方言的数据需求。此外,中国电信还构建了丰富的方言数据库,并拥有强大的算力资源。他们选择方言作为重点,旨在保护和传承语言文化,提高沟通效率,特别是帮助老...