标签：开源

阿里巴巴开源新模型Qwen2-Math：人工智能领域的数学推理专家，超越GPT-4o，数学能力全球领先!

阿里巴巴发布Qwen2-Math：数学推理领域的全新突破近期，阿里巴巴宣布开源了一款名为Qwen2-Math的强大数学模型，此模型旨在为数学推理领域带来革命性的进展。Qwen2-Math提供基础和指令微调两个版本，并包含了1.5B、7B和72B三种不同规模的参数配置。经过主流数学基准测试验证，Qwen2-Math-72B指令微调版展现出了超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro等知名闭源模型的卓越性能，甚至在与Meta的Llama-3.1-405B模型的竞争中也占据优势。这一成就确立了Qwen2-Math-72B在全球数学推理领域的领先地位。基础模型的深度...

来源：

AIGC开放社区公众号【阅读原文】
Tags：Qwen2-Math 人工智能开源数学推理阿里巴巴

2年前 (2024)

智谱AI的国产Sora视频生成模型开源发布！CogVideoX-2B优化至18G，单张4090显卡即可运行

智东西8月6日报道，智谱AI发布了其视频生成模型CogVideoX-2B的开源版本，这一消息无疑为业界带来了振奋。该模型已在GitHub和Hugging Face平台上线，支持FP16精度下的高效运行，显著降低了硬件门槛——仅需配备18GB显存即可进行推理，而微调所需显存也不过40GB，这意味着单张4090或A6000显卡就能胜任相应任务。核心特点 - 提示词限制：CogVideoX-2B支持最多226个token的提示词； - 输出规格：生成视频长度为6秒，帧率为8帧/秒，分辨率为720 * 480； - 未来规划：计划发布性能更优、参数量更大的版本。性能表现根据相关论...

来源：

智东西【阅读原文】
Tags：CogVideoX-2B 开源智谱AI 机器学习视频生成模型

2年前 (2024)

智谱AI的清影系统上线：开源技术实现AI生成6秒视频，探索商业化路径

智谱AI发布AI生成视频模型“清影”：初步成果与商业化探索 7月26日，智谱AI正式推出了其AI生成视频模型——清影（Ying）。该模型已在清言App上线，为广大用户提供文本生成视频及图片生成视频的功能。只需30秒，即可生成一段6秒的视频。清影采用了免费排队与付费加速的模式，用户可以选择24小时5元或一年199元的服务。此外，清影API也已在大模型开放平台bigmodel.cn上线，为企业和开发者提供了便捷的接入途径。智谱AI CEO张鹏表示，清影是公司在这一领域取得的一项初步成果。从产品角度来看，清影将作为独立产品进行商业化运营...

来源：

iFeng科技【阅读原文】
Tags：AI生成视频商业化开源智谱AI 清影

2年前 (2024)

英伟达推出 AI 代工业务：携手 Meta Llama 3.1 开源模型，为客户定制部署“超级模型”

在科技界的一则重大新闻中，英伟达公司——全球领先的图形处理器制造商，于7月23日宣布推出了革命性的'NVIDIA AI Foundry'代工服务及'NVIDIA NIM'推理微服务，此举旨在进一步推动AI技术的发展与应用。感谢IT之家网友Snailwang提供的线索，让我们能够第一时间分享这一重要信息。 'NVIDIA AI Foundry'作为英伟达的最新力作，为客户提供了前所未有的机会，让他们能够利用Meta公司的Llama 3.1 AI模型，结合英伟达的专业软件、计算能力和行业知识，量身定制出针对特定领域的“超级模型”。通过融合专有数据与由Llama 3.1 405B和英伟...

来源：

IT之家【阅读原文】
Tags：AI Meta 开源英伟达

2年前 (2024)

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

随着OpenAI的GPT-4o mini、Mistral AI的Mistral NeMo，以及HuggingFace的小模型相继亮相，小模型市场正迅速升温。苹果最新加入这场竞争，推出了DCLM小模型，以其卓越性能和全面开源策略引发业界关注。苹果推出的DCLM小模型拥有70亿和14亿参数两个版本，其中70亿参数版本超越了Mistral-7B，性能接近Llama3和Gemma。苹果的研究科学家Vaishaal Shankar强调，DCLM是目前性能最佳的真正开源模型，提供完整权重和训练代码，基于开放数据集DCLM-Baseline。苹果的这一举措赢得了广泛好评，与多数科技巨头的闭源模型形成鲜明对比。 ...

来源：

新智元公众号【阅读原文】
Tags：DCLM OpenAI 小模型开源性能数据集模型

2年前 (2024)

自动驾駛与智能体新篇章！联汇科技OmAgent框架开源发布，引领行业应用爆发式增长

在科技创新的前沿，自动驾驶和大模型的发展轨迹相互映照。Google不仅是自动驾驶的先驱，其Transformer模型也引领了大模型的革新。如今，自动驾驶技术已从概念变为现实，彻底改变了传统驾驶方式，而大模型行业正在经历相似的快速发展阶段，各大顶尖团队竞相角逐，推动技术边界不断扩展。联汇科技，作为大模型赛道的领先者，始终走在行业的最前沿。早在行业关注大模型初期，他们便聚焦多模态大模型，并荣获了工信部的首个大模型检测证书。去年，他们发布了OmModel V3，并推出国内首批发起的大模型驱动的自主智能体应用。今年...

来源：

机器之心【阅读原文】
Tags：大模型开源智能体联汇科技自动驾驶

2年前 (2024)

Open-Sora开源视频生成：一键创造720p高清16秒创意内容，效果优化再升级

潞晨 Open-Sora 团队在视频生成领域取得了重大突破，他们成功地开发出了一种能够生成高清720p短片的模型，且风格多样，包括海浪、森林、赛博朋克等。令人兴奋的是，该团队决定将整个项目开源，分享给全球的开发者和创作者。在GitHub（https：//github.com/hpcaitech/Open-Sora）上，用户可以获取模型权重和训练代码，自由创建各种视觉效果，如动画镜头和电影级镜头，提供高度逼真的体验。潞晨团队通过创新的视频压缩网络（VAE）和 Stable Diffusion 3 模型，实现了质量和成本之间的平衡，同时提升了生成速度和图像质量。此外...

来源：

机器之心【阅读原文】
Tags：创意内容开源效果优化潞晨 Open-Sora 视频生成

2年前 (2024)

为什么斯坦福大学生要抄袭中国大模型？

斯坦福大学AI团队涉嫌抄袭中国面壁智能公司开源成果的事件引发了广泛关注。该团队发布的大模型Llama3V被指与面壁智能的MiniCPM-Llama3-V2.5高度相似，后者在5月中旬发布。尽管模型开源允许二次开发，但未标明基于面壁智能成果的行为被批评为不诚实。面壁智能团队证实，他们的模型曾用于识别战国古文字，而斯坦福团队的模型不仅识别出了同样的文字，连错误也一致，坐实了抄袭嫌疑。事件特别之处在于涉及的两方——斯坦福大学和清华大学，都在全球AI领域具有重要地位。斯坦福团队成员已道歉，指出是由于团队内一人为了快速成名而...

来源：

吴晓波频道公众号【阅读原文】
Tags：AI模型开源抄袭斯坦福大学面壁智能

2年前 (2024)

首个智慧城市大模型UrbanGPT，全面开源开放｜港大&百度

港大与百度携手开发的UrbanGPT是首个智慧城市大模型，该模型全面开源开放。UrbanGPT针对时空预测技术的挑战，如数据稀缺、高昂的训练成本和泛化能力不足，提出了一种新型时空大型语言模型。该模型通过时空依赖编码器和指令微调方法，强化了对时间和空间复杂关系的理解，即使在数据有限的情况下也能提供精确预测。实验表明，UrbanGPT在零样本学习和多种城市任务上表现出卓越性能，尤其在跨区域和跨城市预测中，展示了强大的泛化能力和对时空模式的精确理解。

来源：

量子位【阅读原文】
Tags：UrbanGPT 大型语言模型开源时空预测泛化能力

2年前 (2024)

最难方言温州话被攻克！中国电信语音大模型支持30种方言，这题GPT-4o可不会做啊

中国电信推出创新语音大模型，星辰语音，能识别和理解30多种包括温州话在内的方言，打破了以往单一模型仅支持特定方言的局限。该模型在多项国际比赛中表现出色，如INTERSPEECH2024和NIST低资源粤语识别任务，并已在智能客服等领域应用。中国电信是首个完成大语言模型研发并开源的央企，其语音大模型以超大规模语音预训练和多方言联合建模为核心技术，有效降低了新方言的数据需求。此外，中国电信还构建了丰富的方言数据库，并拥有强大的算力资源。他们选择方言作为重点，旨在保护和传承语言文化，提高沟通效率，特别是帮助老...

来源：

量子位【阅读原文】
Tags：中国电信开源方言识别星辰语音语音大模型

2年前 (2024)

1 234 5