刚刚,OpenAI 开源 SimpleQA:轻松进行大型语言模型的基准测试与模型校准

今天凌晨,OpenAI 发布了一个新的基准测试集 SimpleQA,旨在帮助开发者有效检测和校准大型语言模型的真实性能。当前,许多大型模型在回答问题时会出现“一本正经胡说八道”的现象,例如,当问及 NBA 历史上得分最多的人是谁时,模型可能会错误地回答是迈克尔·乔丹,而实际上应该是勒布朗·詹姆斯。OpenAI 自己的 GPT-4、o1-preview 和 o1mini 等先进模型也存在类似的“幻觉”问题。因此,SimpleQA 对于开发者来说是一个重要的工具,可以精确测试模型的准确性,并进一步优化其性能。 SimpleQA 的开源地址为:https://github.com/...

华泰证券分析:苹果FY4Q24财报即将发布,重点关注iPhone 16与Apple Watch Series 10的市场反馈及AI技术在人机交互中的应用变化

华泰证券最新发布的研究报告指出,苹果公司将于北京时间11月1日凌晨5点公布其2024财年第四季度(24年7月至9月)的财务业绩。 在这一季度,苹果推出了多款备受瞩目的新产品,如iPhone 16系列、Apple Watch Series 10和AirPods 4。报告认为,AI技术在智能手机行业的应用才刚刚开...

扎克伯格重金投资 AI,Meta 力推美国政府采用 Llama 模型开展合作

Meta 推动 Llama AI 模型在美国政府中的应用 10 月 31 日,Meta 公司首席执行官马克·扎克伯格在第三季度财报电话会议上宣布,Meta 正与公共部门合作,推动 Llama AI 模型在美国政府机构中的应用。这一消息引发了广泛关注,人们纷纷猜测哪些政府部门将使用该模型,以及这些模型...

华人领军小扎亲自督战!Meta秘密研发8个月,推出自家AI聊天机器人搜索引擎,助力用户数据与网络索引优化,抢占数字广告市场先机

Meta正着手打造属于自己的搜索引擎,旨在为使用其AI聊天机器人的用户提供实时的对话式回答。这款搜索引擎将专供Meta用户使用,标志着该公司长期计划的一部分。当前,Meta AI在处理新闻、体育和股票等问题时仍需依赖微软和谷歌平台的服务,且受到苹果应用商店的限制,这使得Meta...

ChatGPT网页版更新:新增聊天记录搜索功能,让OpenAI应用更加实用高效

ChatGPT 更新带来更实用的网页版聊天记录搜索功能 作者:克雷西 日期:2024-10-30 来源:量子位 网页版可搜索聊天记录 克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 近日,OpenAI 宣布在 ChatGPT 网页版中新增了聊天记录搜索功能。这一功能已于今日(美国当地时间29日...

智谱AI推出自主人工智能AutoGLM,谷歌和微软纷纷入局多模态模型与行为数据强化学习领域

昨天,微软突然发布了一款新的模型,该模型可用于网页自动化操作。微软此举也正式加入了与智谱AutoGLM类似的自主人工智能竞争。而在前天,《The Information》网站上报道了一则消息,标题为“Google Preps AI That Takes Over Computers”,意即谷歌正在准备推出接管计算机的人工...

灵宝CASBOT

10月30日,北京中科慧灵机器人技术有限公司正式推出了其通用人形机器人品牌“灵宝CASBOT”。此次品牌发布不仅带来了全新的Logo,还通过一支前瞻性的品牌概念片,详细阐述了灵宝CASBOT的商业化路径。公司同步上线了官方网站casbot.tech,标志着灵宝在人形机器人和具身智能领域的技...

苹果AI新突破:iPhone 16搭载先进AI功能,用户反馈褒贬不一,疑似GPT套壳?

iPhone 16 系列核心竞争力 Apple Intelligence 上线 终于,备受瞩目的 iPhone 16 系列核心竞争力——Apple Intelligence(苹果智能)正式上线了!虽然中文市场的 Apple Intelligence 要等到 2025 年 4 月才会推出,但这对国内消费者来说未必是坏事。我们可以根据首批用户的反馈...

GitHub Copilot 强势登陆 Windows Terminal 与 Xcode,全面提升代码补全与内容过滤功能,助力开发者效率飞跃

GitHub Copilot 更新登陆 Windows Terminal 和 Xcode 10 月 30 日,GitHub 在 GitHub Universe 大会上宣布了备受瞩目的 GitHub Copilot 重大更新。此次更新使得这款智能代码助手不仅登陆了 Windows Terminal,还推出了 Xcode 开发环境的公开预览版。 Windows Terminal 支持 ...

呼和浩特市智慧城市建设:京蒙合作推进智慧交通管理和医疗保险应用

近日,内蒙古和林格尔新区管理委员会发布消息称,在北京市海淀区与内蒙古呼和浩特市联合举办的算力及人工智能供需对接会上,呼和浩特市正式发布了首批28个人工智能应用场景需求清单,涵盖14个政府部门。这些应用场景涉及多个领域,包括智慧城市治理、智慧行政审批、智慧交通管...