标签:图像推理

ChatGPT AI 工具 能照片查位置

近年来,随着人工智能技术的快速发展,ChatGPT 等生成式 AI 工具逐渐成为用户关注的焦点。近日,有外媒报道指出,越来越多的人开始利用 ChatGPT 来破解照片中的拍摄地点,这种现象迅速在网络上蔓延,并引发了广泛的隐私担忧。 本周,OpenAI 推出了两款全新模型——o3 和 o4-mini。这两款模型不仅具备强大的图像推理功能,还能够通过上传的照片分析画面细节。即使面对模糊或变形的图片,它们也能完成裁剪、旋转和放大等操作,从而实现更深入的识别。这种能力结合了 ChatGPT 的网页搜索功能,使其成为一种高效的“定位工具”。 X...

o1满血版泄露!奥特曼剧透图像推理挑战,GPT-4解析奥数题细节

o1满血版泄露!奥数题图片推理手拿把掐,奥特曼上线剧透 不小心还是故意的? 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI o1满血版泄露了!没想到,OpenAI还在说“今年一定”,不少网友已经率先体验到了(doge)。事情是这样的:有网友发现,OpenAI已经在ChatGPT官网上部署了完整版o1,大家都能直接使用! 最初发现此事的网友,测试确认泄露模型具有强大的图像推理能力。日志显示,该模型确实是o1本模。 于是,在OpenAI修复漏洞之前,网友们抓紧时间尽情体验了一番—— 满血o1到底有多牛 与已发布的o1-preview、o1-mini...

融合ChatGPT+DALLE3,贾佳亚团队新作开源:识图推理生图一站解决

贾佳亚团队的最新开源项目Mini-Gemini结合了ChatGPT和DALL·E 3的功能,提供了一站式的图像推理和生成解决方案。这款多模态模型在多个指标上表现出色,甚至可与商业闭源模型相媲美。Mini-Gemini支持高清图像处理,能进行精确理解、图像解析推理,以及生成相关图像。其Demo展示出的性能令网友赞叹,能进行手把手的教学、识别图像元素并提供建议,还能通过多轮对话生成连环故事。 Mini-Gemini的核心技术包括高清图像的双编码器机制、高质量训练数据和生成模型数据拓展。它使用Transformer的Attention机制,结合ViT和卷积网络,...