清北爸爸李永乐都搞不定的事情,这个隐身的大模型在发起挑战
文章: 在当前的教育环境中,家长辅导孩子作业的压力日益增大,甚至出现了“清北精英也无法幸免”的热议话题。近期,一条新闻在社交媒体上引发了广泛关注,标题为“知名科普博主李永乐老师辅导孩子数学也感到困扰”。李永乐,这位北京大学本科、清华大学研究生的学霸,同时也是中...
一上线就爆火出圈!中文语音AI天花板ChatTTS官网上线
ChatTTS,中文语音AI的杰出代表,近日推出官方网站,让用户可以直接在线体验其文本转语音的强大功能。这款备受瞩目的项目自上线以来,在GitHub上迅速积累了超过16.9K的Star,成为了替代GPT-4o的热门选择。ChatTTS不仅提供基础的文字转语音服务,还能实现实时语音对话,用户可以...
中国发布《生成式AI安全基本要求》,涵盖训练数据、生成内容等
全国网络安全标准化技术委员会最近在其官方网站上发布了《网络安全技术 生成式人工智能服务安全基本要求》征求意见稿,旨在强化生成式人工智能开发和应用的安全性。该标准分为三个部分:标准文本、意见汇总处理表和编制说明。标准文本详细规定了训练数据安全、模型安全等方面的...
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
在多模态生成领域,纯解码器模型通过预测下一个 token 来生成各种模态的新序列,如音频、图像或状态-动作序列。这些模型通常通过词汇扩展技术将多模态表征转化为离散 token,然后在预训练或微调阶段进行跨模态对齐。然而,这种方法存在局限性,如无法处理新模态的添加,且缺乏...
2024过半,AI卷到哪儿了?
在AI大模型领域,创业者和公司面临诸多挑战,如模型更新迅速、与业务结合困难、预算限制及行业内卷现象。大模型公司的价格战导致资源浪费,而真正有价值的产品和技术并未随之提升。行业内的浮躁氛围,如过度营销和排名竞争,掩盖了技术的实际进展。尽管一些大模型公司经历动荡...
科技早报|Siri大升级或推迟至2025年;英伟达推出AI模型推理微服务NVIDIA NIM
夏普与KDDI携手,计划将即将停产的日本堺工厂转变为AI数据中心,以实现业务转型。堺工厂作为夏普的全资子公司,原本生产大型液晶面板,但随着此次改造,将标志着日本国内电视机面板生产的终结。此举旨在推动夏普轻资产化,利用英伟达的Blackwell GPU提升数据中心能力。另一方面...
LLM 的“母语”是什么?
在探索大语言模型(LLM)的内部运作机制时,EPFL的研究人员对Llama 2家族进行了深入研究,挑战了普遍认为英语是多语言LLM“母语”的观点。他们通过一系列实验,使用特定提示来揭示模型在处理多语言任务时的思考过程。研究发现,尽管Llama 2在最后的输出层倾向于使用中文,但在中...
效率2倍于Transformer!彩云科技推出全新模型架构,高分登机器学习顶会ICML
彩云科技近期发布了一项创新的AI通用模型结构——DCFormer,它通过改进注意力矩阵,使得在相同的训练数据和算力下,计算效率可提高至Transformer的两倍。DCFormer改变了Transformer中的向量矩阵推理路径,允许任意线性组合,提供了更多的组合可能性。据实验,一个69亿参数的DCFor...
科大讯飞:讯飞星火 V4.0 正在训练中,对标 GPT-4o 的产品也在研发
科大讯飞在最新的互动交流中宣布,其正在研发的讯飞星火V4.0模型,一款与GPT-4相当的人工智能产品,预计将于2024年6月底面世。此外,公司还透露了一个针对GPT-4o的项目正处于研发阶段。科大讯飞致力于将人工智能的最新进展应用于智慧教育领域,以提升产品体验和市场覆盖率。此...
阿里蔡崇信最新发声!训练AI就像教育孩子 三四年就能赶超博士
在最近的一次交流活动中,阿里巴巴集团的资深领导者蔡崇信就人工智能的快速发展及其未来潜力发表了独到见解。他巧妙地将训练人工智能模型比作养育孩子,指出尽管培育一个孩子需要长达22年,但AI只需短短几年就能在知识和特定数学能力上媲美人类,甚至在某些专业领域展现出相当...
