标签:开源大模型

阿里通义Qwen2拿下美国最新测评榜单开源大模型全球第一

在人工智能领域,一项新的评测基准——LiveBench AI近日由图灵奖得主杨立昆及其合作机构推出,该基准对全球顶尖的开闭源大模型进行了评估。在首次发布的测评榜单上,阿里云通义千问的开源大模型Qwen2-72B脱颖而出,成为全球第一的开源大模型,且是中国唯一进入前十的模型,超越了Meta的Llama3-70B。GPT-4o虽然位居榜首,但Qwen2-72B作为开源模型的优异表现备受瞩目。 LiveBench AI的测评覆盖了34个领先模型,Qwen系列共有7款模型上榜,显示出强大的整体实力。除了Qwen2-72B外,还包括Qwen1.5的多个版本,它们是除GPT系列之外...

性能对标Llama 3,算力消耗仅1/19!源2.0-M32大幅提升模算效率

浪潮信息发布了开源大模型源2.0-M32,该模型基于MoE技术,拥有32个专家模块和400亿参数,但在运行时仅需37亿激活参数,大大降低了算力需求。相比700亿参数的Llama 3,源2.0-M32在训练、微调和推理过程中的算力消耗显著减少,实现了性能与效率的双重提升。在模型推理阶段,源2.0-M32的算力需求仅为Llama 3的1/19。此外,源2.0-M32在微调训练阶段的算力消耗也远低于Llama 3。通过算法结构创新,如门控网络技术和局部注意力过滤增强机制,源2.0-M32提升了模型精度,同时降低了算力消耗。浪潮信息致力于为企业提供更经济、高效的...

重建Meta帝国:用AI“回敬”TikTok

在2023年5月的美国白宫AI闭门会议上,Meta缺席引发了业界讨论。尽管如此,Meta通过开源大模型在AI领域取得突破,打破了OpenAI和谷歌的垄断,实现了AI界的“安卓时刻”。Meta的业绩增长得益于AI技术的运用,特别是在内容推荐和广告业务上的创新。例如,Meta利用AI创建了一个发现引擎,提高了内容理解与用户行为分析的精确度,增强了用户体验,从而增加了用户在Facebook和Instagram上的停留时间。此外,Meta的Reels功能对TikTok构成了竞争,用户增长逐渐恢复。 在广告业务方面,Meta面临苹果的隐私新规挑战,但随着中国电商如Te...

LobeChat支持通过网页版直接调用Ollama 本地模型 体验媲美ChatGPT

LobeChat,一款创新的网页平台,最近引起了关注。这个平台特别之处在于它允许用户直接在网页上利用Ollama本地模型进行互动,无需复杂的设置或第三方API。用户在安装了Ollama之后,便能与开源大模型如llama3、wizardLM、Gemma等进行无缝对话。LobeChat确保了高速的对话体验,只要用户的设备性能足够强大,其速度可比肩商业API。 在用户界面方面,LobeChat的设计简洁明了,提供与ChatGPT类似的优质体验。对于新用户,平台提供详尽的引导,帮助他们轻松上手。如果需要下载模型,LobeChat也提供了内置功能,使得整个过程更为便...

周鸿祎谈对“2024年AI产业发展的十六个趋势”预测

周鸿祎揭示2024年AI发展趋势:从开源大模型到人形机器人 在近日的一加ACE 3V手机发布会上,网络安全专家周鸿祎分享了他对2024年人工智能产业的展望。他预测,AI领域将迎来一系列重大变革,包括: 1. 开源大模型的繁荣,预示着大模型将在各个领域普及。 2. 云端超级大模型将成为大国间AGI竞赛的核心,模型规模将持续扩大。 3. 同时,小型化大模型将嵌入智能设备,赋予终端更多智能。 4. 企业级市场将见证垂直大模型的广泛应用,企业将拥有多个定制模型。 5. 多模态能力将成为大模型的关键,推动AIGC功能如文生图和视频的创...
12