APPLICATION LLM代码生成中的幻觉问题 我经常看到开发人员尝试使用LLM编写代码时遇到幻觉——通常是LLM发明了一个不存在的方法,甚至是一个完整的软件库——这让他们对LLM作为编写代码工具的信心崩溃。
PROMPT ENGINEERING 提示工程:从思维链到草稿链 草稿链(Chain of Draft)是一种旨在简化推理而不牺牲准确性的提示技术。可以将其视为更详细的思维链(CoT)方法的“言简意赅”版本。
APPLICATION 金融分析多智能体系统 当我们构建QuantJourney时——这是为零售投资者和量化分析师提供的最全面框架时,我们相信投资者需要上下文感知的基于GPT的可适应系统,而不仅仅是提供原始数据。
APPLICATION AI驱动的投资平台 当我更深入地进入投资世界时,我发现了一个改变游戏规则的东西:像Gemini和ChatGPT这样的AI工具。突然间,我可以比以往任何时候都更高效地进行深入的定性和定量研究。
MODEL-ZOO VPTQ低位LLM量化算法 在 MMLU 等任务上,使用 VPTQ 的 2 位量化几乎实现了与原始 16 位模型相当的性能。此外,它能够在单个 GPU 上运行 Llama 3.1 405B,同时使用的内存比 70B 模型少!
MODEL-ZOO 从零实现2B参数LLM 我们将使用 Pile 数据集从头开始训练一个 20 亿参数的 LLM。结果,我们得到了一个 LLM,它在响应中输出完美的语法和标点符号,较短的上下文有意义,但不是整个响应。
APPLICATION LLM增强的Web抓取 在网络抓取过程中,通过集成 LLMs 可以在很大程度上优化流程。我们需要从网页获取 HTML 代码,并将其馈送到 LLM,LLM 从中提取出它所指的对象。
APPLICATION AI代理的架构、工具与实现 代理是扩展LLM能力的程序,使其能够观察、推理并自主行动,使用各种工具完成任务。在本文中,我们将探讨AI代理的世界,涵盖其架构、核心组件以及在实际应用中的实现。
APPLICATION 打造智能家居的AI代理 近十年来,我一直在研究智能家居 API。我购买了许多系统,构建了多个版本的集成 API、移动应用程序和聊天机器人,但它们从未完全实现真正的目标——像钢铁侠系列中的 JARVIS 一样的真正的AI驱动的家。
MODEL-ZOO PaliGemma2微调优化图像理解 通过使用自定义数据集(例如知名的 VQA)对 PalliGema2 进行微调,可以在高度特定的任务上实现最先进的性能,以连续且可扩展的方式弥合文本和视觉理解之间的差距。
LIBRARY Stagehand:Web自动化AI框架 Stagehand 是 Playwright 的 AI 继任者,提供三个简单的 API(act、extract 和 observer),为自然语言驱动的 Web 自动化提供构建模块。
TOOL Unstract零代码AI文档处理平台 Unstract是一个功能强大的基于 AI 的平台,可简化文档处理。本文探讨了 AI 文档处理的来龙去脉,以及 Unstract 如何简化你企业的文档处理需求。
APPLICATION 基于多模态LLM的PDF处理管道 我们的管道是一个两步过程。首先将每个页面分割成重要的块并总结每个块。其次对块进行一次索引,然后在每次收到请求时搜索这些块,并在 LLM 上下文中包含每个检索到的块的完整上下文。