翻译

翻译的一些我觉得不错的科技文章。

FunSearch：利用大语言模型在数学科学领域探索新奇发现 [译]

通过搜索编写在计算机代码中的“函数”，FunSearch 利用大语言模型 (LLMs) 首次在数学科学的未解之谜中取得突破

December 15, 2023

大语言模型真的需要这么多层吗？ [译]

研究表明，移除 70% 的注意力头和 20% 的前馈网络对上下文学习影响甚微，这暗示大语言模型或许训练得不够充分。

December 15, 2023

探讨人工智能对经济的影响 [译]

人工智能对经济的影响将受到其技术发展和实施的速度与有效性的双重影响。我们在这里分享我们对这个日渐丰富的研究领域的理解和我们如何实时跟踪这一发展趋势。

December 15, 2023

开发者视角：项目管理的智慧 [译]

谈谈如何管理一个软件项目。

December 14, 2023

如何避免 12 大软件架构常见误区 [译]

虽然构建成功的软件架构的过程看似简单，实际上却颇具挑战。要理解 QARs，并在此基础上做出最优权衡，需要深刻的洞察力和丰富的经验，而这些往往需要通过对架构本身的不断试验和调整来积累。虽然过程本质上不复杂，但所涉及的权衡决策通常充满挑战，而且难以找到简单的解决方案。

December 14, 2023

AI 时代的商业市场新风貌 [译]

在不断演进的市场商业模式中，每一种新兴平台都在重新定义交易的方式和地点。互联网时代，我们从传统的分类广告和布告栏转向了亚马逊（Amazon）、eBay 和克雷格列表（Craigslist）这样的网站；而移动互联网时代，则催生了 DoorDash、优步（Uber）和 Instacart 这样的应用程序。现在，生成式 AI（Generative AI）技术的兴起预示着市场将迎来又一次革新。它不仅将改变商品和服务的销售方式，更重要的是，它也将改变这些商品和服务的制造方式。

December 14, 2023

2024 年科技领域的重大创新思想 [译]

智能能源网格、语音先行的伴侣应用、可编程药品、针对儿童的 AI 工具。我们向 a16z 的超过 40 位合作伙伴征询了他们认为将在 2024 年成为创新动力的重要理念。

December 14, 2023

在 iPad 或 iPhone 上本机离线运行大语言模型 [译]

本教程将指导您如何在苹果设备上本地安装一个类似于 ChatGPT 的大语言模型（LLM）。

December 13, 2023

开发者与企业，是时候用 Gemini Pro 打造你的应用了 [译]

想了解如何将 Gemini Pro 融入你的应用或业务，请访问 ai.google.dev。

December 13, 2023

人工智能辅助程序员的三种类型 [译]

像 ChatGPT 这样的大语言模型 (LLM) 能够编写引人信服的代码片段。2023 年初，这一发现在 LinkedIn 上引起了不少热议，许多人误以为这意味着不再需要经验丰富的开发人员及其专业知识、挑剔的态度和高昂的薪酬了。如今，任何一个有网络连接的人似乎都能轻而易举地让 AI 编写下一个大型社交媒体应用，用 JavaScript 编写，并融合一些区块链技术。

December 13, 2023

大语言模型 API 市场的变迁之路 [译]

随着越来越多公司加入这个领域，大语言模型 API 市场将如何发展？

December 13, 2023

利用 AI 进行角色扮演：对作家和教育者来说是个重要工具 [译]

或者说，GPT-4 能有多好地模拟 1963 年的 LSD 旅程？

December 13, 2023

人工智能即将全面改变我们使用电脑的方式 [译]

人工智能即将全面改变我们使用电脑的方式并彻底重塑软件行业。

December 13, 2023

Phi-2：小语言模型的非凡实力 [译]

近几个月里，微软研究院的机器学习基础团队推出了一系列被命名为“Phi”的小型语言模型（SLMs），在众多基准测试中表现卓越。

December 12, 2023

功能标记（Feature Flags）管理指南 [译]

在软件开发这个不断演变的领域，迅速适应、实验和高效发布功能显得至关重要。功能标记（Feature Flags），也称为功能开关，正是这种动态环境的核心。它们赋予开发者将代码部署与功能发布分离的能力，从而提高开发的灵活性，并减少推出新功能时的风险。功能标记为软件发布提供了一种受控且灵活的方法，这在持续集成/持续部署（CI/CD）的环境中尤为重要。本文将深入探讨功能标记的关键原理，并重点介绍在大型系统中实施和管理它们的有效方法。这些方法涉及运行时控制、隐私保护、性能优化和可扩展性，旨在为开发人员、项目经理和决策者提供理论与实践方面的洞见。本指南旨在提供掌握软件开发项目中功能标记的必要知识和策略。

December 11, 2023

探索编写提示词的乐趣：蒙特卡洛方法、木偶剧和笑声的融合 [译]

内部生产力工具中所采用的各种提示技术。这些技术结合了行业与学术研究以及我们自身的小规模内部开发成果。建议你在自己的评估环境下对这些技术进行测试，并根据你的具体需求进行调整。

December 11, 2023

深入解析“混合专家模型（Mixtral of Experts）” [译]

自从 Mixtral 8x7B（发布公告、模型说明）亮相以来，“混合专家模型”（Mixture of Experts，简称 MoEs）这类 Transformer 成了开放 AI 领域的焦点话题。在这篇博客中，我们将深入探讨 MoEs 的基础构架、训练方式，以及在实际应用中需要权衡的各种因素。

December 11, 2023

Mixtral 8x7B -- 混合专家模型（Mixtral of Experts） [译]

Mistral AI 团队致力于为开发者社区提供顶尖的开源模型。在 AI 领域，要实现突破，不仅要超越现有的架构和训练方法，更重要的是让社区能够利用创新模型，激发新的发明和应用。

December 11, 2023

TBM 258: “只需招募有才华的人并赋予他们权力” [译]

人们常认为，一个杰出的领导者的任务就是招聘员工，并授权他们去做出色的工作。但如果你不深入了解细节，你怎么能判断他们的工作是否出色呢？因此，我确保自己深入到细节中，并且我们真正推动了产品的发展。

December 11, 2023

深入探索：AI 驱动的 PDF 布局检测引擎源代码解析 [译]

上周，PDF 转 Markdown 的工具 Marker 成为 Hacker News 首页的热门话题。作为一个对机器学习（ML）充满好奇的学生，我觉得这是一个绝佳的机会，深入了解这款出色的文档 AI 工具的内部机制。

December 11, 2023

什么是“专家混合模型”（Mixture-of-Experts，MoE）？ [译]

“专家混合模型”是一种创新的神经网络架构设计，它在 Transformer 架构中融合了众多的专家/模型层。在这种设计中，数据流动时，每一个输入的 Token 都会被动态分配给一些专家进行处理。这种做法使得计算更高效，因为每个专家都能在其擅长的特定任务上发挥出色。

December 10, 2023

再现亚马逊新的人工智能生成功能：产品评论摘要 [译]

如何使用 OpenAI 大语言模型 (LLM) 在 Weaviate 向量数据库中用 Python 生成摘要，运用所谓的“生成式反馈循环”概念

December 10, 2023

把大语言模型封装成桌面应用 [译]

最近，我一直忙于开发 Ollama，因此投入了大量时间研究如何在本地系统上运行大语言模型（大语言模型），并探索如何将它们封装进应用程序。一般而言，大部分桌面应用程序只要求用户输入 OpenAI API 密钥，或者从源代码编译 Python 项目即可集成大语言模型。尽管这些方法在理论上可行，但对于许多用户来说，它们的技术门槛仍然较高。我追求的是用户能够一键下载并立即运行的应用程序。

December 10, 2023

利用客户端技术开发基于大语言模型（LLM）的 Web 应用 [译]

虽然关于通过 OpenAI、Anthropic、Google 等公司的 API 调用 LLM 来构建应用的文章层出不穷，但我选择了一条不同的道路，尝试仅使用本地模型和技术来构建网页应用，尤其是那些能在浏览器中运行的技术！

December 10, 2023

一些有价值的职场建议 [译]

职业生涯就像是一个漫长的旅程，最难的地方在于你的目的地是未知的，甚至没有地图来指引你如何前行。

December 10, 2023

Netflix 的技术架构解析 [译]

本文汇集了许多来自 Netflix 工程团队的博客和开源项目的研究成果。如果您在阅读中发现任何不准确之处，请不吝告知。

December 10, 2023

在 RAG 流程中提高检索效果：融合传统关键词与现代向量搜索的混合式搜索技术 [译]

探讨如何结合传统关键词搜索与现代向量搜索来获得更相关的搜索结果

December 9, 2023

如何构建高质量软件：一个被忽略的课题 [译]

目前，我主要的工作是兼任部分时间的 CTO 服务。坦白说，在进行创新的同时担任这个角色对我来说颇有挑战。同时兼顾这两者非常艰难，所以我暂时放下创新者的角色，专注于规划发展路线图和招聘事宜。招聘其实是一个挑战，需要精准识别不同职位和所需资源。

December 8, 2023

为你的生活打造 AI 旁白的指南 [译]

在本文中，我会详细介绍如何打造你专属的 AI 旁白。文章末尾，我还会分享一些实用的代码。

December 8, 2023

苹果是如何做到严格保密的？ [译]

出于恐惧？我早就想分享这个故事了。

December 8, 2023

如何理解关于 OpenAI Q* 的流言 [译]

OpenAI 还没具体说明 Q* 是什么，但已经透露了许多线索。

December 8, 2023

检索增强生成（RAG）：从理论到 LangChain 实践 [译]

从学术论文的理论到利用 OpenAI、Weaviate 和 LangChain 的 Python 应用实现

December 7, 2023

12 种调整策略指南：为生产环境打造高效的 RAG 应用 [译]

如何通过这些“超参数”和调整策略优化你的检索增强生成（RAG）流程

December 7, 2023

为忙碌人士准备的大语言模型（LLM）速览 [译]

这篇博客的灵感完全来自 Andrej Karpathy 在 YouTube 上的视频“忙碌人士的大语言模型速览”。在我看来，这是对大语言模型的最精彩解释。对于更喜欢阅读而不是观看的朋友，这篇文章是你的理想之选。

December 7, 2023

我们是如何利用大语言模型 (LLM) 改进 GitHub Copilot 的探索之旅 [译]

深入了解我们如何使用生成式 AI 模型进行创新实验，从而拓宽 GitHub Copilot 在开发者整个生命周期中的应用。

December 7, 2023

针对 Claude 2.1 的长篇幅提示技巧 [译]

Claude 2.1 在处理高达 20 万 Token 的庞大上下文时，检索特定句子的能力令人瞩目。我们通过实验发现，利用精心设计的提示技巧，可以引导 Claude 更准确地回忆出相关信息。

December 7, 2023

“Emoji”一词的由来 [译]

“emoji”这个词与情绪并无直接关联。很多人误以为“emoji”一词源自“emotion”（情感），其实这只是个巧合。它实际上来自于日语中的“絵”（图片，发音 _eh_）加上“文字”（字母或字符，_mōji_）。简而言之，这个词指的是一种图画文字。尽管这个词本身与“情感”这个词在词源上并无关联，但我们使用 emoji 的方式却能深刻反映我们的自我特性以及我们如何与他人建立联系。

December 6, 2023

谷歌如何简化代码审查流程，实现 97% 开发者满意度 [译]

很多离开谷歌的工程师表示，他们最怀念的内部工具之一是 Critique，谷歌的代码审查工具。探究谷歌的代码审查工具（Critique）：AI 助力的创新与最新统计

December 6, 2023

Gemini 介绍：我们的超级 AI 模型 [译]

让 AI 更贴近每个人的生活

December 6, 2023

AI 工程师的崛起 [译]

新兴技能的出现催生了一个新职称：要掌握这些技能，我们需要超越简单的命令行编程，转而开发软件。

December 6, 2023

AI 之后软件开发领域的 3 个预测 [译]

必须采用多模型战略，新兴 AI 基础设施的发展，以及大语言模型（LLM）作为新的抽象层次。

December 6, 2023

RAG 与 GPT-4 的上下文窗口比较：准确性、成本和响应速度 [译]

在大语言模型应用阶段，重点是让回答变得非常具体，无论是针对数据集、用户、使用场景，还是特定的调用请求。

December 5, 2023

提示工程、RAGs 与微调的对比 [译]

提示工程、RAGs 与微调的对比是每位搭建基于大语言模型（LLM）应用的 AI 工程师都面临的关键选择。

December 5, 2023

构建更佳大语言模型（LLM）应用的四大要诀 [译]

这里为您提供了一些建议和技巧，旨在提高大语言模型应用的精准度，并介绍了选择合适大语言模型的要点。

December 5, 2023

人工智能是伟大的均衡器 [译]

未来，个性化的 AI 助手将可以在设备上离线运行，将衍生出很多出人意料的创新

December 5, 2023

令人难以置信！用这项新技术在仅有 4GB GPU 的设备上运行 70B 大语言模型推理 [译]

通常，大语言模型需要大量的 GPU 内存才能运行。但是，有没有可能仅用单个 GPU 来进行推理计算呢？如果可以，最少需要多少 GPU 内存呢？

December 4, 2023

多面性：大语言模型的语言回音室 [译]

我花了许多时间仔细研究大语言模型（LLM）的输出。有一点引起了我的注意：LLM 生成的文章似乎有一种特殊的…感觉。这种感觉很难用言语描述，但在大语言模型发展的初期，你可以很明显地感觉到自己在阅读一个 AI 生成的文章。

December 4, 2023

构建企业级大语言模型应用的秘诀：GitHub Copilot 的实践之路 [译]

GitHub Copilot 团队分享了如何打造一个既能满足个人用户也能满足企业用户需求的大语言模型（LLM）应用程序的心得。若你希望利用大语言模型 (LLM) 打造并扩展你的应用程序，这篇文章将是你的不二之选。

December 4, 2023

构建企业级大语言模型应用的秘诀：GitHub Copilot 的实践之路 [译]

GitHub Copilot 是目前最成功的大语言模型应用之一，可以帮程序员自动生成可用的代码，已经有超过一百万付费用户。GitHub Copilot 开发团队分享了构建这个产品时的经验教训。整个产品的开发历时三年，尽力了三个阶段：发现、实现和扩展。这三个阶段对于其他产品的研发也非常具有借鉴价值。

December 4, 2023

局外人/边缘人（Outsider）思维与人工智能时代 [译]

在我们的分析领域，不同背景的人才聚集一堂。这已经是众所周知的事实，以至于我们往往对此视而不见。有些人对此感到遗憾，比如会想：“如果我能早些投身于分析领域，了解得更多就好了。”也有人会调整自己的简历，试图营造一种与事实不尽相符的职业连贯性。

December 4, 2023