APPLICATION OmniParser提取小红书数据 通过将 Omniparse 基于视觉的理解与语言模型 (LLM) 相结合,它可以成为 RPA 的可行替代方案,用于复杂的 Web 抓取,类似于 AgentQL 的功能。
APPLICATION 基于计算机视觉的自动分拣 使用计算机视觉的自动分拣根据特定特征识别、分类和路由物品或材料,广泛应用于制造业、物流业、农业和回收业等行业,以提高效率、降低劳动力成本并最大限度地减少错误。
APPLICATION 用Ollama打造本地生产力工具 在本文中,我们将深入探讨本地 AI 的世界,探索 Ollama 等工具以及 Gemma 2 和 LLaVA 等最先进的模型如何改变你的日常工作流程。
APPLICATION 打造免费的本地AI助手 在本文中,我将介绍使用 LangChain、Chroma 实现 RAG 管道的 Flask 应用程序的开发。该应用程序允许用户上传 PDF 文档、存储嵌入并查询它们以进行信息检索。
APPLICATION 从PDF文章生成幻灯片和演讲视频 和大多数人一样,NotebookLM 及其从一组文档生成播客的能力让我大吃一惊。然后,我开始思考:“他们是如何做到这一点的,我在哪里可以获得这种魔力?”复制起来有多容易?
APPLICATION 基于多模态LLM的PDF处理管道 我们的管道是一个两步过程。首先将每个页面分割成重要的块并总结每个块。其次对块进行一次索引,然后在每次收到请求时搜索这些块,并在 LLM 上下文中包含每个检索到的块的完整上下文。
APPLICATION LLM驱动的房地产行业知识库 房地产公司在其运营的每个阶段都会生成大量文件——从土地可行性研究和市场研究到建筑设计和合规报告。这些数据的庞大数量和多样性使得传统的存储和检索方法效率低下,常常导致决策延迟和错失良机。