每日AI快讯
AI视频生成平台评比:Odyssey, Dreamflare, Fable Studio — 谁将引领好莱坞级别视觉效果的未来趋势?
AI时代的视频创作:探索好莱坞级别的视觉盛宴 随着AI技术的迅猛发展,视频创作领域正经历一场前所未有的变革。Odyssey、Dreamflare以及Fable Studio等初创公司正积极探索AI视频生成的新边界,力求打造好莱坞级别的视觉体验。 Odyssey,一家专注于构建好莱坞级别视觉AI视频生成模型的公司,正致力于通过强大的底层模型实现高质量视频的自动化生产。其核心技术团队来自于自动驾驶领域,这种跨界背景使得他们能够将自动驾驶技术中的三维世界理解能力应用于视频生成中。Odyssey不仅关注视频的质量,还重视用户对视频创作过程的...
英伟达NVIDIA NIM:几分钟内构建AI应用的全新升级工具 – NVIDIA, AI, 生成式人工智能, OpenUSD
NVIDIA 在 SIGGRAPH 2024 的重大突破 在备受瞩目的计算机图形学会议 SIGGRAPH 2024 上,NVIDIA 展示了其在渲染、仿真与生成式人工智能领域的最新成果。其中,最令人瞩目的无疑是 NVIDIA NIM 平台的全面升级。 NVIDIA NIM:AI 创新的加速器 NVIDIA NIM 是英伟达为应对生成式 AI 时代挑战而推出的关键平台。它允许用户在极短的时间内构建 AI 应用程序,极大地简化了从模型开发到部署的整个流程。英伟达创始人兼CEO 黄仁勋将其形象地称为“AI-in-a-Box”,意味着用户可以通过标准化的流程轻松部署复杂的 AI 模型,进一步提升...
腾讯量子实验室联合医图生科发布药物设计新突破:运用量子计算与混合编程框架的时代来临
量子计算开启药物设计新篇章:腾讯与医图生科共创未来 近期,医图生科携手腾讯量子实验室,联合中国药科大学和宁波工程学院,共同发表了题为《A hybrid quantum computing pipeline for real world drug discovery》(面向真实世界药物发现的混合架构量子计算框架)的论文。该研究不仅标志着药物设计领域进入了一个崭新的时代,同时也预示着量子计算在医药行业中的潜在影响力。研究团队成功构建了一个结合经典与量子计算的混合编程框架,并将其应用于两个真实的药物设计案例中,证实了量子计算在此领域的巨大潜力。 经典...
苹果智能突破!iPhone15 Pro在iOS18.1 Beta版中开启通话录音、Siri及自然语言搜索功能首测
随着苹果公司最新推出的iOS18.1开发者预览版Beta1版本,一项备受瞩目的新功能——Apple Intelligence(苹果智能)测试版正式亮相。这一创新功能目前仅限于部分设备使用,例如iPhone15 Pro、iPhone15 Pro Max,以及配备M1及以上版本芯片的Mac和iPad设备。 尽管国行版iPhone用户暂时无法体验苹果智能服务,但对于非国行版用户来说,只需在设置中申请加入等待列表,便有机会获得使用权限。值得注意的是,在尝试使用苹果智能时,需确保设备的语言与地区设置为美式英语及美国地区。 对于国行iPhone用户而言,本次Beta更新带来的最...
英伟达与Meta在SIGGRAPH图形大会上支持人工智能大模型开源,黄仁勋扎克伯格展示友好交流
在最近举办的第51届SIGGRAPH图形大会上,两位科技巨头的创始人——英伟达的黄仁勋和Meta的马克·扎克伯格进行了一场引人入胜的对话,共同探讨了人工智能(AI)以及仿真技术的未来发展。这次盛会于7月29日在美丽的美国城市丹佛拉开帷幕。 对话中,黄仁勋高度赞扬了Meta在开源大型模型领域的贡献,并表达了双方对于继续支持开源路线的一致看法。这种合作的态度不仅展现了两家公司在推动技术创新方面的共同愿景,也预示着未来可能的合作机会。 值得注意的是,在这次会谈即将结束之际,现场大屏幕展示了一张非常特别的照片:黄仁...
可灵AI Sora引领视频生成新趋势:快手短视频的人工智能过弯点?
自从Sora在今年初亮相以来,这款能够创建长达一分钟视频的文生视频模型迅速引起了国内科技公司的关注。不久之后,快手自主研发的视频生成大模型“可灵”也正式上线,它采用了与Sora类似的技术路径,能够生成符合物理规则且动作合理的视频片段。目前,已经有超过一百万人申请内测资格,其中三十多万人已经获得了体验资格,并产生了超过七百万条短视频。 近日,可灵AI宣布全面开放内测,并启动了付费会员体系。与此同时,其他公司也在紧锣密鼓地跟进。例如,智谱AI在七月推出了能够免费生成六秒视频的智谱清言模型。尽管大部分...
苹果利用谷歌硬件和数据中心投资来训练人工智能模型
随着人工智能领域的竞争日益激烈,各大科技巨头都在积极布局,力求在这一前沿领域占据领先地位。近日,苹果公司在一份技术文档中透露,在构建其核心AI系统——Apple Intelligence时,采用了一种非同寻常的方式。据IT之家7月30日报道,苹果的人工智能模型最初是在谷歌设计的云端处理器上进行预训练的。 该技术文档标题为《Apple Intelligence 基础语言模型》,详细阐述了苹果如何构建这些基础模型以及所使用的数据源。文档指出,苹果的基础模型(AFMs)及其支持的服务器技术最初是在谷歌的“v4 和 v5p 云端 TPU 集群”上构建完成的...
Sora全球上线:Vidu视频生成模型打造动画风格的二次元世界 — 首发实测展示AI创作工具如何在30秒内制作出精彩大片
国产视频生成模型“Vidu”:打造独特动画风格与高效创作工具 国产视频生成模型“Vidu”由清华系初创企业生数科技推出,该模型专攻动画风格视频生成,具备快速生成、高质量渲染及多镜头切换等特色功能。Vidu支持4秒和8秒固定时长的高清视频输出,并能够根据文本描述精确还原场景细节,适用于二次元文化爱好者及动画创作者。 快速生成与细节呈现:Vidu的亮点 - 高速生成:仅需30秒即可完成4秒视频的渲染。 - 精准语义理解:即使面对长文本描述,也能准确捕捉并展现关键信息。 - 多镜头切换:单一文本提示即可实现不同视角的视...
利用NVIDIA Llama 3.1:通过合成数据微调语言模型以提升RAG系统性能的实战指南与代码分享
随着Llama 3.1模型的发布,英伟达分享了一篇技术指南,教大家如何有效利用这一强大的开源模型来生成合成数据,特别适用于领域模型或RAG系统的微调。面对“数据墙”的逼近,英伟达推出了拥有340B参数的开源模型Nemotron,预训练数据中有98%都是合成数据,这意味着真实数据的稀缺性可能不再是限制因素。 合成数据的本质与LLM的关系 合成数据并非凭空创造新信息,而是通过对现有信息进行转换来生成不同的变体。这种技术在AI领域已有十多年的历史,例如在物体检测或分类系统中的数据增强。近年来,随着模型对大量训练数据的需求...
利用斯坦福的人工智能方法加速新材料的发现:为自动驾驶实验奠定基础与贝叶斯优化的应用
传统的材料探索方法不仅耗时且成本高昂,尤其当面对庞大的材料空间时,挑战更加艰巨。为了克服这一难题,斯坦福大学及美国能源部SLAC国家加速器实验室的研究团队研发出了一种AI驱动的方法,显著提升了新材料探索的效率与精准度。 研究人员提出了一种框架,通过简单的用户定义过滤算法来捕捉实验目标。这些算法会被自动转换为三种智能、无参数的顺序数据采集策略(SwitchBAX、InfoBAX 和 MeanBAX),从而避免了传统方法中繁琐的任务特定采集函数设计过程。在TiO2纳米粒子合成以及磁性材料表征的数据集上验证了该方法的有效性...