每日AI快讯

AI无人商店竟是靠人工识别商品!七成交易需要人为

亚马逊的AI无人商店项目“Just Walk Out”最近引发关注,尽管它号称采用先进的计算机视觉和深度学习技术实现自动化结算,但据透露,实际上这个系统很大程度上依赖于人力。据报道,亚马逊有一个由上千名员工组成的团队,他们在印度负责观看和标注视频,以确保交易的准确性。数据显示,在每1000次交易中,有高达700次需要人工审核。这导致顾客在离开商店后可能需要等待数小时才能收到收据。对此,亚马逊否认了完全依赖人工监控的说法,指出他们的机器学习模型会通过合成数据和实际视频注释不断优化。

小米 14 / Pro 获得大师人像、AISP 功能更新推送

小米近日为旗下的小米14和小米14Pro智能手机推送了一项重大系统升级,这次更新特别引入了小米14Ultra的高级影像技术,显著提升了拍照性能。其中,新加入的大师人像模式成为关注焦点,该模式提供大师人像和徕卡人像两种不同的画质风格,让用户在拍摄人像时拥有更多创意选择。此外,人像模式的图像清晰度和美颜效果也经过改进,使照片呈现更清晰、自然的质感。 更重要的是,本次更新还为小米14和小米14Pro配备了先进的AI大模型计算摄影平台——Xiaomi AISP。这个平台首次在小米14Ultra的发布活动中展示,它深度整合硬件资源,利...

8.3K Stars!《多模态大语言模型综述》重大升级

本文介绍了《多模态大语言模型综述》的重大升级,该综述详尽梳理了多模态大语言模型(MLLM)的发展和趋势。随着以GPT-4V为代表的MLLM迅速进步,该领域展现出新特点,如模型规模扩大和新的训练范式。MLLM在处理多模态信息方面表现出强大的新能力,例如视觉信息的理解和推理。文章探讨了MLLM的基础构成、拓展应用和相关研究课题,包括模型架构、训练策略、数据处理和评测标准。此外,还分析了多模态幻觉、多模态上下文学习、多模态思维链和LLM辅助的视觉推理等技术方向。最后,指出了MLLM面临的挑战,如长上下文理解、复杂指令...

Arm CEO 示警:美国未来 20%-25% 的电量将被 AI 数据中心消耗

Arm CEO警示:AI数据中心电力消耗激增,ChatGPT成焦点 随着人工智能(AI)技术的迅速发展,Arm公司CEO雷内·哈斯揭示了一个严峻的问题:AI模型的智能提升与其能源消耗同步增长。以OpenAI的ChatGPT为例,这类大型语言模型对电力的需求日益庞大,预计到2030年,AI数据中心可能占据美国20%至25%的电力消耗,远超目前的4%。ChatGPT每日处理的海量请求使得其日耗电量超过50万千瓦时,是普通美国家庭日用电量的1.7万倍。面对这一挑战,Arm正在致力于减少AI技术的能耗。国际能源机构(IEA)报告显示,全球AI数据中心的电力需求将在未来...

7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

在软件开发领域,代码大模型的实用性是开发者关注的关键,尤其是其在企业级项目中的适用性、效率和定制化能力。近期,各大公司如OpenAI、谷歌DeepMind和HuggingFace推出的代码大模型,如CodeX、AlphaCode和StarCoder,已经在提升程序员编码效率方面取得了显著成效。然而,北京大学软件工程研究所的aiXcoder团队在10年前就开始了深度学习在软件开发中的应用研究,并在全球范围内处于领先地位。他们最新发布的aiXcoder 7B代码大模型,不仅在代码生成和补全任务中超越同类,而且在个性化训练、私有化部署和定制化开发方面独具优...

谷歌向微软英特尔全面宣战:首款自研Arm CPU,最强大模型公测,AI视频对垒Sora

在昨晚的Google Cloud Next 2024大会上,谷歌发布了多款创新产品和模型,展现出在AI领域的决心。首先,Gemini1.5Pro模型现在对公众开放,具备强大的音频处理能力,能无缝处理跨媒体信息。此外,谷歌宣布了首款自研Arm架构CPU——Axion,目标直指微软和亚马逊。AI图像生成工具Imagen2.0新增视频生成功能,而新代码模型CodeGemma,尤其适合代码补全和多语言处理,其华人团队占比高达60%。谷歌还升级了TPU v5p,并与英伟达合作,加速AI开发。在存储解决方案方面,谷歌推出了Hyperdisk ML和Cloud Storage FUSE等,提升AI训练和推理...

刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁

Mistral AI,一家初创公司,再次引起人工智能(AI)领域的轰动,通过发布一个281GB的磁力链,解禁了其最新的8x22B MoE(Mixture of Experts)模型。这款创新MoE模型拥有56层深度,48个注意力头,包含8个专家和2个活跃专家,上下文长度达到65k,彰显出强大的计算与处理能力。该模型的出现让社区用户兴奋不已,期待其与其他最先进的(SOTA)模型进行详细对比。 去年12月,Mistral AI首次发布的8x7B MoE模型就获得了广泛赞誉,其在基准测试中超越了参数量更大的Llama2模型。该模型能处理长达32k的上下文,并支持多种语言,如英...

谷歌推出 Gemini 1.5 Pro 公共预览版,现已支持处理音频

谷歌近期在其AI应用平台Vertex AI上推出了Gemini 1.5 Pro的公共预览版,这是一个具备音频处理能力的中量级模型,能分析音频文件并进行内容总结。据称,Gemini 1.5 Pro在性能上已超过大型模型Gemini Ultra,且能理解复杂指令,无需额外微调。虽然Gemini Ultra提供更丰富功能,但处理速度不及Gemini 1.5 Pro。同时,谷歌的文生图模型Imagen 2也升级了,新增图片修复和扩充功能,并引入了数字水印“SynthID”以确保图像来源可追溯。值得注意的是,这些功能在其他文生图模型和一些先进设备中已有应用。谷歌还计划在公开预览阶段探...

消息称三星、SK海力士推进移动内存堆叠封装技术量产,满足端侧AI需求

三星电子与SK海力士正在引领移动DRAM技术的新潮流,致力于开发堆叠封装技术,以增强移动设备的内存带宽,应对日益增长的端侧AI需求。传统的HBM内存堆叠策略因移动DRAM芯片尺寸小及TSV连接方案不适用而遇到挑战。为解决这些问题,这两家公司采取了垂直布线扇出技术(VFO),这是一种创新的封装方法,能够提供更多的IO数据引脚,减少电信号传输路径,提高能效。 SK海力士的VFO技术结合FOWLP和DRAM堆叠,显著缩短信号传输距离,能效提升4.9%,且封装厚度减少27%,尽管稍有增加1.4%的散热。三星则研发了名为LLW DRAM的产品,具...

估值180亿美元,马斯克造了一家“AI独角兽”

xAI,一家成立不足一年的AI初创公司,已估值达到180亿美元,计划进行一轮高达30亿美元的融资。该公司的投资者包括与马斯克有密切关系的Gigafund。xAI最近开源了参数量最大的大模型Grok-1,挑战AI行业的巨头。xAI由马斯克和其他来自知名科技公司和学术机构的专家共同创立,旨在利用AI解决复杂问题,如理解宇宙的本质。Grok是一款具有讽刺风格的聊天机器人,能够实时了解世界,并敢于回答敏感问题。xAI的产品与马斯克的其他企业如特斯拉有潜在的整合机会,Grok可能替代特斯拉的语音控制系统。此外,xAI起诉OpenAI,指责其违背...