标签:开源
智谱AI的清影系统上线:开源技术实现AI生成6秒视频,探索商业化路径
智谱AI发布AI生成视频模型“清影”:初步成果与商业化探索 7月26日,智谱AI正式推出了其AI生成视频模型——清影(Ying)。该模型已在清言App上线,为广大用户提供文本生成视频及图片生成视频的功能。只需30秒,即可生成一段6秒的视频。清影采用了免费排队与付费加速的模式,用户可以选择24小时5元或一年199元的服务。此外,清影API也已在大模型开放平台bigmodel.cn上线,为企业和开发者提供了便捷的接入途径。 智谱AI CEO张鹏表示,清影是公司在这一领域取得的一项初步成果。从产品角度来看,清影将作为独立产品进行商业化运营...
英伟达推出 AI 代工业务:携手 Meta Llama 3.1 开源模型,为客户定制部署“超级模型”
在科技界的一则重大新闻中,英伟达公司——全球领先的图形处理器制造商,于7月23日宣布推出了革命性的'NVIDIA AI Foundry'代工服务及'NVIDIA NIM'推理微服务,此举旨在进一步推动AI技术的发展与应用。感谢IT之家网友Snailwang提供的线索,让我们能够第一时间分享这一重要信息。 'NVIDIA AI Foundry'作为英伟达的最新力作,为客户提供了前所未有的机会,让他们能够利用Meta公司的Llama 3.1 AI模型,结合英伟达的专业软件、计算能力和行业知识,量身定制出针对特定领域的“超级模型”。通过融合专有数据与由Llama 3.1 405B和英伟...
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
随着OpenAI的GPT-4o mini、Mistral AI的Mistral NeMo,以及HuggingFace的小模型相继亮相,小模型市场正迅速升温。苹果最新加入这场竞争,推出了DCLM小模型,以其卓越性能和全面开源策略引发业界关注。 苹果推出的DCLM小模型拥有70亿和14亿参数两个版本,其中70亿参数版本超越了Mistral-7B,性能接近Llama3和Gemma。苹果的研究科学家Vaishaal Shankar强调,DCLM是目前性能最佳的真正开源模型,提供完整权重和训练代码,基于开放数据集DCLM-Baseline。苹果的这一举措赢得了广泛好评,与多数科技巨头的闭源模型形成鲜明对比。 ...
自动驾駛与智能体新篇章!联汇科技OmAgent框架开源发布,引领行业应用爆发式增长
在科技创新的前沿,自动驾驶和大模型的发展轨迹相互映照。Google不仅是自动驾驶的先驱,其Transformer模型也引领了大模型的革新。如今,自动驾驶技术已从概念变为现实,彻底改变了传统驾驶方式,而大模型行业正在经历相似的快速发展阶段,各大顶尖团队竞相角逐,推动技术边界不断扩展。 联汇科技,作为大模型赛道的领先者,始终走在行业的最前沿。早在行业关注大模型初期,他们便聚焦多模态大模型,并荣获了工信部的首个大模型检测证书。去年,他们发布了OmModel V3,并推出国内首批发起的大模型驱动的自主智能体应用。今年...
Open-Sora开源视频生成:一键创造720p高清16秒创意内容,效果优化再升级
潞晨 Open-Sora 团队在视频生成领域取得了重大突破,他们成功地开发出了一种能够生成高清720p短片的模型,且风格多样,包括海浪、森林、赛博朋克等。令人兴奋的是,该团队决定将整个项目开源,分享给全球的开发者和创作者。在GitHub(https://github.com/hpcaitech/Open-Sora)上,用户可以获取模型权重和训练代码,自由创建各种视觉效果,如动画镜头和电影级镜头,提供高度逼真的体验。潞晨团队通过创新的视频压缩网络(VAE)和 Stable Diffusion 3 模型,实现了质量和成本之间的平衡,同时提升了生成速度和图像质量。此外...
为什么斯坦福大学生要抄袭中国大模型?
斯坦福大学AI团队涉嫌抄袭中国面壁智能公司开源成果的事件引发了广泛关注。该团队发布的大模型Llama3V被指与面壁智能的MiniCPM-Llama3-V2.5高度相似,后者在5月中旬发布。尽管模型开源允许二次开发,但未标明基于面壁智能成果的行为被批评为不诚实。面壁智能团队证实,他们的模型曾用于识别战国古文字,而斯坦福团队的模型不仅识别出了同样的文字,连错误也一致,坐实了抄袭嫌疑。事件特别之处在于涉及的两方——斯坦福大学和清华大学,都在全球AI领域具有重要地位。斯坦福团队成员已道歉,指出是由于团队内一人为了快速成名而...
首个智慧城市大模型UrbanGPT,全面开源开放|港大&百度
港大与百度携手开发的UrbanGPT是首个智慧城市大模型,该模型全面开源开放。UrbanGPT针对时空预测技术的挑战,如数据稀缺、高昂的训练成本和泛化能力不足,提出了一种新型时空大型语言模型。该模型通过时空依赖编码器和指令微调方法,强化了对时间和空间复杂关系的理解,即使在数据有限的情况下也能提供精确预测。实验表明,UrbanGPT在零样本学习和多种城市任务上表现出卓越性能,尤其在跨区域和跨城市预测中,展示了强大的泛化能力和对时空模式的精确理解。
最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊
中国电信推出创新语音大模型,星辰语音,能识别和理解30多种包括温州话在内的方言,打破了以往单一模型仅支持特定方言的局限。该模型在多项国际比赛中表现出色,如INTERSPEECH2024和NIST低资源粤语识别任务,并已在智能客服等领域应用。中国电信是首个完成大语言模型研发并开源的央企,其语音大模型以超大规模语音预训练和多方言联合建模为核心技术,有效降低了新方言的数据需求。此外,中国电信还构建了丰富的方言数据库,并拥有强大的算力资源。他们选择方言作为重点,旨在保护和传承语言文化,提高沟通效率,特别是帮助老...
微软发布Phi-3 Mini:3.8B参数小到能塞进手机,性能媲美GPT-3.5
微软近日在其官网上开源了名为 Phi-3-mini 的小型语言模型,这是 Phi-3 系列的第一个模型,拥有38亿参数和丰富的训练数据。Phi-3-mini 在多项语言、推理、编码和数学基准测试中表现出色,超越了许多百亿参数规模的模型。该模型有两种上下文长度变体,经过预训练和指令调整,能更好地理解和执行各种指令。与大型语言模型相比,Phi-3-mini 更易于操作,适合在端侧部署和运行。微软表示,该模型的成本远低于类似功能的模型,例如可能是GPT-3.5成本的十分之一。Phi-3-mini 的出色性能得益于合成数据集的训练,该数据集由过滤的网...
大模型开源还是闭源好,周鸿祎与李彦宏针尖对麦芒
在大模型的开源与闭源之争中,360创始人周鸿祎与百度创始人李彦宏发表了不同的看法。李彦宏认为闭源大模型在能力和商业模式上优于开源,而开源可能无法聚集足够的资源。在百度AI开发者大会上,他进一步指出开源模型可能会落后。周鸿祎则坚信开源的力量,认为开源模型能推动技术进步,且发展迅速。然而,尽管开源模型在某些方面取得进步,如Llama3,但目前它们在技术和应用上仍落后于闭源模型,如GPT-4、Claude-3和Gemini Ultra。 周鸿祎支持开源可能是为了360智脑在市场竞争中的位置,鼓励创业者使用开源模型,避免重复研发...