标签:图像生成

OpenAI推出GPT-4o:超强人工智能生成图像,多模态模型引领图像生成新时代,与谷歌同场竞技,奥尔特曼AGI梗图现场直出引发关注

感谢IT之家网友华南吴彦祖和软媒用户1392612提供的线索!最近,OpenAI在深夜直播中发布了GPT-4o的原生图像生成技术的重大升级。奥尔特曼亲自上阵,展示了自拍变梗图、相对论漫画等功能。然而,与谷歌刚刚发布的Gemini 2.5 Pro相比,OpenAI的动作显得有些不足。 奥尔特曼带领团队展示了GPT-4o图像生成技术的各种大升级,包括制作梗图、文本渲染、多轮交互生成和指令遵循等。其中最亮眼的演示是一张官方玩梗的表情包。这项功能已经在ChatGPT和Sora中向所有用户提供。 新版Sora生成图像的时间比以往更长,但OpenAI认为生图的...

谷歌Gemini 2.0 Flash模型:强大人工智能图像生成与水印去除技术,是否突破版权保护界限?

谷歌近期推出的Gemini 2.0 Flash模型在社交媒体上引发了广泛关注和争议。用户发现,这款模型能够有效去除图片中的水印,甚至包括来自知名图库Getty Images的水印。上周,谷歌进一步扩大了对Gemini 2.0 Flash模型图像生成功能的访问权限。这一功能允许用户生成和编辑图像,展现了强大的技术能力。然而,该功能似乎缺乏必要的使用限制,例如生成包含名人形象或受版权保护角色的图像,以及去除现有照片中的水印。 根据X和Reddit上的多位用户反馈,Gemini 2.0 Flash模型不仅能够去除水印,还能自动填补因水印删除而产生的空白区...

借助文心4.0和iRAG技术,百度图像生成实现AI拜年新突破,春节营销自家萌宠拜年图片更准确生动

春节营销活动中的AI创新玩法 随着农历新年的临近,各大互联网平台纷纷推出了丰富多彩的春节营销活动。除了传统的集“五福”和集卡游戏,今年还出现了许多结合人工智能(AI)的新玩法。百度搜索推出的“AI拜年”活动就是其中之一。用户只需在百度搜索框中输入“祝福语”,点击“做贺卡”,根据需求调整文案并选择“创意照片”,就能定制出各种充满趣味的新年祝福卡片。 例如,你可以上传自己的证件照,生成一张在天坛前的专属拜年海报;或者上传宠物照片,生成一张充满年味的“萌宠贺岁图”。这些功能不仅展示了AI对文化元素的精准理解,...

埃隆·马斯克旗下xAI公司再推重磅:网页版Grok AI聊天机器人上线,无需X账户,支持图像生成功能

埃隆·马斯克旗下xAI公司推出网页版Grok AI聊天机器人 感谢IT之家网友風見暉一的线索提供。近日,埃隆·马斯克(Elon Musk)旗下的xAI公司在推出iOS版Grok AI聊天机器人之后,正式上线了网页版。这意味着用户无需访问X.com或拥有X账户,即可体验Grok的强大功能。通过访问grok.com,用户只需输入出生年份即可开始使用,进行实时信息收集、获取问题答案,甚至可以生成图像。 Grok网页版的功能与操作 在网页版Grok中,用户可以通过输入框下方的菜单添加附件,并支持切换“自动”、“可视化”、“搜索”和“仅模型”模式,从而更好地控...

阶跃星辰推出 Step-1X-Medium AI 模型:图像生成提速30%,支持图生图垫图玩法,升级中国风创作工具

感谢IT之家网友 Skyraver 提供的线索!12月26日,据IT之家报道,“阶跃星辰”官方公众号于12月25日发布了一则重要消息,宣布推出全新的 Step-1X-Medium 增强 AI 模型。这款升级版模型在生成速度、理解能力、细节质感以及创作功能等方面都有显著提升,旨在成为创作者们更得力的助手。 Step-1X-Medium 的主要改进包括: 1. 生成速度提升:基于 MMDit 架构,新模型的生成速度提升了超过30%,大大缩短了等待时间。 2. 更强的理解能力:经过针对性训练,Step-1X-Medium 能更精准地理解用户指令,确保生成的与需求高度一致。 3. 自...

AI教母 斯坦福大学教授李飞飞重大突破,单张图像生成三维世界

近日,由华裔科学家、被誉为“AI教母”的斯坦福大学教授李飞飞创立的人工智能创业公司World Labs宣布了一项重大突破——在“空间智能”领域迈出了重要一步。这项技术的核心在于通过单张图像生成三维世界,使用户能够“进入任何图片,并以三维方式探索”。 World Labs的这一创新技术不仅展示了人工智能在图像处理和三维建模方面的巨大潜力,还为虚拟现实和增强现实应用提供了新的可能性。用户可以通过简单的图像输入,快速生成一个逼真的三维环境,从而实现更加沉浸式的体验。 据李飞飞教授介绍,这项技术的背后是强大的深度学习算...

深入解析计算机视觉领域中的自回归模型:图像生成与视觉词元的3D生成应用全面综述

计算机视觉领域自回归模型综述 近日,由香港大学、清华大学、普林斯顿大学、杜克大学、俄亥俄州立大学、北卡罗来纳大学、苹果公司、字节跳动、香港理工大学等多所高校和研究机构共同发布的综述论文,深入探讨了自回归模型在计算机视觉领域的最新进展。随着计算机视觉技术的飞速发展,自回归模型作为重要的生成模型之一,在图像生成、视频生成、3D 生成和多模态生成等多个任务中展现出显著的优势。然而,面对快速变化的研究环境,及时掌握自回归模型的最新动态显得尤为重要。 论文标题为《视觉领域的自回归模型综述》,旨在...

Mistral AI强势出击,全面升级le Chat,推出Pixtral Large超大杯多模态模型图像生成新体验

一觉醒来,Mistral AI 再次带来了惊喜。今天,Mistral AI 宣布推出其多模态家族的第二位成员——Pixtral Large。这款模型基于 Mistral Large 2 构建,拥有 1240 亿参数,不仅具备强大的图像理解能力,还能处理文档、图表和自然图像,同时保持了 Mistral Large 2 在纯文本理解方面的优势。 除了发布新模型,Mistral AI 还对其免费聊天机器人 le Chat 进行了重大升级,新增了图像生成、网络搜索和交互式画布功能,全面对标 ChatGPT。所有这些功能都以免费测试版的形式开放,引起了 AI 社区的广泛关注。有人感慨道:“六个月前,...

Canva与Leonardo.ai在AI设计领域的7年8次收购行动:图像生成技术引领未来设计趋势

Canva 收购 Leonardo.ai 强化 AI 设计能力 近日,设计软件巨头 Canva 宣布成功收购了澳大利亚的人工智能图像生成平台 Leonardo.ai。据知情人士透露,这次交易的金额高达3亿美元,是 Leonardo.ai 在去年12月A轮融资时估值的四倍。收购完成后,Leonardo.ai 的全体员工将加入 Canva 团队。 Leonardo.ai 是一家专注于图像生成的技术公司,其网站流量在今年2月份超越了 Midjourney,成为图像生成领域网站流量第一的产品。尽管 Midjourney 在8月向所有用户开放了图像生成功能,但 Leonardo.ai 的网站流量仍高出 Midjourney 133万...

刚刚,苹果在iPhone 16中集成了ChatGPT,借助Apple Intelligence与Siri的力量,革新了手机交互体验,图像生成能力也得到了显著提升!

苹果公司于今日凌晨1点举行的发布会中宣布,其最新研发的“Apple Intelligence”技术将全面集成到iPhone 16、iPad平板电脑以及Mac笔记本电脑中,标志着苹果正式迈入生成式AI时代。其中,Siri已整合了OpenAI的ChatGPT(GPT-4o)功能,显著增强了理解和执行任务的能力。例如,在规划旅行时,用户可以通过Siri获取目的地的景点推荐、美食特色及文化信息。此外,“Apple Intelligence”还被广泛应用于图片、文档和应用程序中。以下是“AIGC开放社区”为您带来的详细介绍。 Siri集成ChatGPT功能 此次更新后,Siri在iPhone 16、iPad和...
123