标签：Llama 2

Llama 2 在 Windows 98 奔腾 II 上成功运行：每秒39个token，探索26年前的老年机如何支持现代人工智能普及

让 Llama 2 在 Windows 98 奔腾 II 上成功运行最近，EXO Labs 成功地让 Llama 2 模型在一台 26 年前的硬件上运行，这台机器配备了英特尔奔腾 II CPU 和 128MB 的内存。令人惊讶的是，模型的输出速度达到了每秒 39.31 个 token。这项实验不仅展示了 Llama 模型的强大适应性，还证明了即使在资源极其有限的情况下，现代人工智能模型仍然可以运行。 EXO Labs 的使命与背景 EXO Labs 是一个由牛津大学研究人员和工程师组成的组织，成立于今年 9 月，其使命是“让人工智能普及大众”。该组织认为，少数几家大公司控制人工智能...

来源：

机器之心【阅读原文】
Tags：BitNet EXO Labs Llama 2 Windows 98 WordPress 人工智能普及

2年前 (2024)

LLM 的“母语”是什么？

在探索大语言模型（LLM）的内部运作机制时，EPFL的研究人员对Llama 2家族进行了深入研究，挑战了普遍认为英语是多语言LLM“母语”的观点。他们通过一系列实验，使用特定提示来揭示模型在处理多语言任务时的思考过程。研究发现，尽管Llama 2在最后的输出层倾向于使用中文，但在中间层的“思考”阶段，它似乎使用了一种偏向英语的“内部语言”，并非直接的英语单词，而是与抽象概念相关联的表示。研究人员通过翻译任务、重复任务和完形填空任务，观察Llama 2的内部状态是否与特定自然语言对应。实验结果显示，模型在大部分前向传递...

来源：

IT之家【阅读原文】
Tags：Llama 2 内部语言大语言模型抽象概念英语

2年前 (2024)

欧洲最火AI独角兽发布旗舰大模型！性能直逼GPT-4，微软宣布合作投资

欧洲人工智能公司Mistral AI最近推出了其最新的大语言模型——Mistral Large，不同于以往，这个模型不会开源。该模型支持五种语言，具有32K tokens的上下文窗口，但具体参数规模未公开。在多语言理解任务基准MMLU上，Mistral Large仅次于GPT-4，优于Llama 2。在价格方面，Mistral Large比GPT-4 Turbo定价更低。同时，微软宣布与Mistral AI建立多年合作关系，并对其进行小额投资，Mistral AI的大模型将在Azure云平台上提供，成为继OpenAI之后第二个在此托管的公司。 Mistral Large拥有四大亮点：多语言支持、大上下文窗口、...

来源：

智东西【阅读原文】
Tags：AI research and development Azure GPT-4 Llama 2 Mistral AI

2年前 (2024)