APPLICATION 基于计算机视觉的自动分拣 使用计算机视觉的自动分拣根据特定特征识别、分类和路由物品或材料,广泛应用于制造业、物流业、农业和回收业等行业,以提高效率、降低劳动力成本并最大限度地减少错误。
MODEL-ZOO PaliGemma2微调优化图像理解 通过使用自定义数据集(例如知名的 VQA)对 PalliGema2 进行微调,可以在高度特定的任务上实现最先进的性能,以连续且可扩展的方式弥合文本和视觉理解之间的差距。
APPLICATION 用Ollama打造本地生产力工具 在本文中,我们将深入探讨本地 AI 的世界,探索 Ollama 等工具以及 Gemma 2 和 LLaVA 等最先进的模型如何改变你的日常工作流程。
LIBRARY Stagehand:Web自动化AI框架 Stagehand 是 Playwright 的 AI 继任者,提供三个简单的 API(act、extract 和 observer),为自然语言驱动的 Web 自动化提供构建模块。
APPLICATION 打造免费的本地AI助手 在本文中,我将介绍使用 LangChain、Chroma 实现 RAG 管道的 Flask 应用程序的开发。该应用程序允许用户上传 PDF 文档、存储嵌入并查询它们以进行信息检索。
APPLICATION 从PDF文章生成幻灯片和演讲视频 和大多数人一样,NotebookLM 及其从一组文档生成播客的能力让我大吃一惊。然后,我开始思考:“他们是如何做到这一点的,我在哪里可以获得这种魔力?”复制起来有多容易?
LIBRARY 17个最好的文本转语音API 文本转语音(TTS),也称为语音合成,可用于各种应用,包括个人助理、导航系统、电子学习平台以及视障人士或阅读困难人士的辅助工具。本文介绍开发者最常用的17个语音合成API。
TOOL Unstract零代码AI文档处理平台 Unstract是一个功能强大的基于 AI 的平台,可简化文档处理。本文探讨了 AI 文档处理的来龙去脉,以及 Unstract 如何简化你企业的文档处理需求。
TOOL Langflow零代码AI代理开发 在本文中,我们将在 Langflow 中从头开始构建一个简单的代理,还将介绍可观察性工具 LangSmith 和 Langwatch,看看我们的代理在幕后做了什么。