每日AI快讯
苹果智能突破!iPhone15 Pro在iOS18.1 Beta版中开启通话录音、Siri及自然语言搜索功能首测
随着苹果公司最新推出的iOS18.1开发者预览版Beta1版本,一项备受瞩目的新功能——Apple Intelligence(苹果智能)测试版正式亮相。这一创新功能目前仅限于部分设备使用,例如iPhone15 Pro、iPhone15 Pro Max,以及配备M1及以上版本芯片的Mac和iPad设备。 尽管国行版iPhone用户暂时无法体验苹果智能服务,但对于非国行版用户来说,只需在设置中申请加入等待列表,便有机会获得使用权限。值得注意的是,在尝试使用苹果智能时,需确保设备的语言与地区设置为美式英语及美国地区。 对于国行iPhone用户而言,本次Beta更新带来的最...
英伟达与Meta在SIGGRAPH图形大会上支持人工智能大模型开源,黄仁勋扎克伯格展示友好交流
在最近举办的第51届SIGGRAPH图形大会上,两位科技巨头的创始人——英伟达的黄仁勋和Meta的马克·扎克伯格进行了一场引人入胜的对话,共同探讨了人工智能(AI)以及仿真技术的未来发展。这次盛会于7月29日在美丽的美国城市丹佛拉开帷幕。 对话中,黄仁勋高度赞扬了Meta在开源大型模型领域的贡献,并表达了双方对于继续支持开源路线的一致看法。这种合作的态度不仅展现了两家公司在推动技术创新方面的共同愿景,也预示着未来可能的合作机会。 值得注意的是,在这次会谈即将结束之际,现场大屏幕展示了一张非常特别的照片:黄仁...
可灵AI Sora引领视频生成新趋势:快手短视频的人工智能过弯点?
自从Sora在今年初亮相以来,这款能够创建长达一分钟视频的文生视频模型迅速引起了国内科技公司的关注。不久之后,快手自主研发的视频生成大模型“可灵”也正式上线,它采用了与Sora类似的技术路径,能够生成符合物理规则且动作合理的视频片段。目前,已经有超过一百万人申请内测资格,其中三十多万人已经获得了体验资格,并产生了超过七百万条短视频。 近日,可灵AI宣布全面开放内测,并启动了付费会员体系。与此同时,其他公司也在紧锣密鼓地跟进。例如,智谱AI在七月推出了能够免费生成六秒视频的智谱清言模型。尽管大部分...
苹果利用谷歌硬件和数据中心投资来训练人工智能模型
随着人工智能领域的竞争日益激烈,各大科技巨头都在积极布局,力求在这一前沿领域占据领先地位。近日,苹果公司在一份技术文档中透露,在构建其核心AI系统——Apple Intelligence时,采用了一种非同寻常的方式。据IT之家7月30日报道,苹果的人工智能模型最初是在谷歌设计的云端处理器上进行预训练的。 该技术文档标题为《Apple Intelligence 基础语言模型》,详细阐述了苹果如何构建这些基础模型以及所使用的数据源。文档指出,苹果的基础模型(AFMs)及其支持的服务器技术最初是在谷歌的“v4 和 v5p 云端 TPU 集群”上构建完成的...
Sora全球上线:Vidu视频生成模型打造动画风格的二次元世界 — 首发实测展示AI创作工具如何在30秒内制作出精彩大片
国产视频生成模型“Vidu”:打造独特动画风格与高效创作工具 国产视频生成模型“Vidu”由清华系初创企业生数科技推出,该模型专攻动画风格视频生成,具备快速生成、高质量渲染及多镜头切换等特色功能。Vidu支持4秒和8秒固定时长的高清视频输出,并能够根据文本描述精确还原场景细节,适用于二次元文化爱好者及动画创作者。 快速生成与细节呈现:Vidu的亮点 - 高速生成:仅需30秒即可完成4秒视频的渲染。 - 精准语义理解:即使面对长文本描述,也能准确捕捉并展现关键信息。 - 多镜头切换:单一文本提示即可实现不同视角的视...
利用NVIDIA Llama 3.1:通过合成数据微调语言模型以提升RAG系统性能的实战指南与代码分享
随着Llama 3.1模型的发布,英伟达分享了一篇技术指南,教大家如何有效利用这一强大的开源模型来生成合成数据,特别适用于领域模型或RAG系统的微调。面对“数据墙”的逼近,英伟达推出了拥有340B参数的开源模型Nemotron,预训练数据中有98%都是合成数据,这意味着真实数据的稀缺性可能不再是限制因素。 合成数据的本质与LLM的关系 合成数据并非凭空创造新信息,而是通过对现有信息进行转换来生成不同的变体。这种技术在AI领域已有十多年的历史,例如在物体检测或分类系统中的数据增强。近年来,随着模型对大量训练数据的需求...
利用斯坦福的人工智能方法加速新材料的发现:为自动驾驶实验奠定基础与贝叶斯优化的应用
传统的材料探索方法不仅耗时且成本高昂,尤其当面对庞大的材料空间时,挑战更加艰巨。为了克服这一难题,斯坦福大学及美国能源部SLAC国家加速器实验室的研究团队研发出了一种AI驱动的方法,显著提升了新材料探索的效率与精准度。 研究人员提出了一种框架,通过简单的用户定义过滤算法来捕捉实验目标。这些算法会被自动转换为三种智能、无参数的顺序数据采集策略(SwitchBAX、InfoBAX 和 MeanBAX),从而避免了传统方法中繁琐的任务特定采集函数设计过程。在TiO2纳米粒子合成以及磁性材料表征的数据集上验证了该方法的有效性...
AMD发布Amuse 2.0 Beta:集成XDNA超分辨率技术,打造锐龙AI 300系列的强力AI图像生成工具
AMD发布Amuse 2.0 Beta:强化图像生成体验与超分辨率技术 AMD近期宣布推出Amuse 2.0 Beta版本,旨在为AMD平台用户带来更为便捷且高效的AI图像生成体验。该版本不仅提升了图像生成的质量,还增强了用户的使用便捷性。用户可以通过指定链接进行下载。 XDNA超分辨率技术:显著提升图像分辨率 Amuse 2.0 Beta的一大亮点是引入了AMD XDNA超分辨率方案。这项技术可以在图像生成完成后,将输出图像的尺寸放大两倍,例如将512x512分辨率的图片放大至1024x1024,极大地改善了图像的清晰度和细节表现。 多样化的图像处理功能 除...
中国黑科技闪耀奥运:AI技术在女性运动员表现中的惊艳应用——巴赫主席致谢阿里巴巴修复技术
随着2024年巴黎奥运会的热烈展开,一项融合了现代技术和历史情怀的项目吸引了全世界的目光。这段被命名为《永不失色的她》(To the Greatness of HER)的“奥运8分钟”短片,不仅展现了科技的力量,更是向那些在奥运舞台上留下不朽足迹的女性运动员致敬。阿里巴巴与国际奥委会合作推出的这部短片,不仅运用了AI技术为历史画面增添色彩,还融入了大模型和AIGC技术,使得这些珍贵的历史瞬间以一种全新的方式呈现在世人面前。 历史的变迁与技术的进步 从100年前的奥运会到2024年巴黎奥运会,女性运动员的地位发生了翻天覆地的...
Meta与OpenAI的对决:AI开源拐点已至? Llama3.1405B引领多模态AI未来 | 智者访谈
近期,Meta发布了Llama3.1405B,这款开放权重的大模型性能首次媲美顶级封闭模型,标志着AI行业进入了一个重要的转折点。扎克伯格亲自撰文支持“开源AI即未来”的观点,再次引发开源与封闭的讨论。本文采访了AI开源生态专家黄之鹏,探讨AI开源的现状与未来。 开源与封闭的博弈 - OpenAI的转变:早期OpenAI遵循非营利模式,开源GPT-1和GPT-2。但在2019年微软注资后,转为商业实体,从GPT-3开始转向闭源。 - 安全与商业考量:尽管官方声称闭源是为了安全,但实际上更多出于商业竞争的考虑。 Google与Meta的战略 - Google的...