GOOGLE-COLAB - Software 2.0 - 汇智网

Tagged

GOOGLE-COLAB

A collection of 24 posts

用RAG实现语义路由

本文深入探讨如何通过集成向量数据库增强我们系统的语义路由能力。我们将探索架构、实现细节和优势，重点介绍这种方法如何提升LLM处理复杂和多样化任务的能力。

用Unsloth微调Gemma-3

用Unsloth微调Gemma-3

当大家都在竞相构建基于 ChatGPT 的应用程序时，精明的开发人员正在悄悄发现这个新轻量级 Gemma-3 的微调能力，这是一个隐藏的宝石，可以将通用人工智能转化为你的专业数字专家。

Zonos TTS 简明教程

Zonos是一个令人印象深刻的开源 TTS 系统，提供高质量的语音合成和多语言支持。

Google Colab运行DeepSeek R1

Google Colab运行DeepSeek R1

最近我在测试本地运行DeepSeek R1，但CPU温度太高了。我的朋友说你为什么不使用 Google Colab？因为它为你提供了一个免费GPU。

车辆图像结构化数据抽取

在本教程中，我们将构建一个车辆文档系统，从车辆图像中提取重要细节。这些细节将以结构化格式提取，以便进一步供下游使用。

DeepSeek LLM微调指南

DeepSeek LLM微调指南

在本指南中，我们将介绍使用监督微调 (SFT) 和 Hugging Face 数据集对 DeepSeek LLM 进行微调的过程，并提供针对特定领域数据集进行训练的分步代码演示。

LayoutLM文档提取指南

LayoutLM 是一种革命性的模型，结合了文本识别和布局理解的强大功能，可以准确地从结构化文档中提取实体。

微调PaliGemma优化目标检测

微调PaliGemma优化目标检测

虽然 PaliGemma 具有零样本能力（这意味着模型无需微调即可识别物体），但这种能力是有限的。Google 强烈建议对模型进行微调，以在特定领域获得最佳性能。

PaliGemma2微调优化图像理解

PaliGemma2微调优化图像理解

通过使用自定义数据集（例如知名的 VQA）对 PalliGema2 进行微调，可以在高度特定的任务上实现最先进的性能，以连续且可扩展的方式弥合文本和视觉理解之间的差距。

Llama3微调优化关系提取

在 Llama3–70B 的帮助下，我们构建了一个旨在进行关系提取的监督微调数据集。然后，我们使用该数据集对 Llama3–8B 进行微调，以增强其关系提取能力。

基于VLM的图像聊天应用

在本教程中，我们将学习如何使用开源 Llama 3.2-Vision 模型与我们的图像聊天，你会惊叹于它的 OCR、图像理解和推理能力。

Colab+Drive微调大模型

Colab+Drive微调大模型

Google Colab 慷慨地为你提供了一种访问免费GPU计算的方法，使用 Google Drive 保存任何中间结果或模型参数。

用Agent Builder构建地图搜索

用Agent Builder构建地图搜索

我们将使用 Agent Builder 为理发店构建一个搜索系统。可以将其视为创建一个专用的搜索微服务，可通过 REST API 访问，并可与你的应用集成。

gptpdf：基于gpt的pdf解析库

gptpdf：基于gpt的pdf解析库

gptpdf是一个开源的python库，使用 VLM（如 GPT-4o）将 PDF 解析为 markdown。

基于Agent的图生视频自动化

基于Agent的图生视频自动化

本文介绍如何使用LangGraph的AI代理实现从单张图像到视频的自动化处理。

LlamaIndex构建AI实时交易系统

LlamaIndex构建AI实时交易系统

本教程演示了如何使用 Kafka 流式传输 EUR/USD 数据、使用 LlamaIndex 工作流进行无缝逻辑处理以及使用 GPT-4o 进行图像分析来构建实时交易机器人。

Qwen2.5-Coder 模型微调教程

Qwen2.5-Coder 模型微调教程

本文介绍如何在Continue代码助手的开发数据记录基础上，使用 Unsloth 微调Qwen2.5-Coder 7B模型，以完善其代码自动完成能力。

哼唱搜歌原理及实现

想象一下，你哼唱的歌曲直接出现在屏幕上？这就是我们今天要做的。

Legal-BERT 法律大模型微调

Legal-BERT 法律大模型微调

通过微调在法律语料库上预先训练的Legal-BERT模型，我们可以在合同分析、合规性监控和法律文件检索等任务中实现更高的准确性和可靠性。

Llama-3.1微调实现函数调用

Llama-3.1微调实现函数调用

本文探讨如何使用 Unsloth微调 Llama-3.1–8B 模型以实现函数调用功能，并使用 vLLM 进行高性能模型推理和服务。

SAM 2 自定义数据集微调

虽然 SAM 2 开箱即用，但它在罕见或特定领域的任务上的表现可能并不总是符合预期。微调允许你根据特定需求调整 SAM2，从而提高其针对特定用例的准确性和效率。

Parler-TTS 微调和推理技巧

Parler-TTS 微调和推理技巧

本文介绍如何使用Gemini制作自己的数据集，如何微调Parler-TTS，以及如何使用Parler-TTS模型进行推理。

用LlamaFactory微调Qwen-2 VL

用LlamaFactory微调Qwen-2 VL

在这篇博文中，我们将探索如何使用 LlamaFactory 框架微调多模态大模型Qwen-2 VL。

Gemini目标检测实测

我们熟悉 Gemini 令人印象深刻的多模态能力，尤其是在推理图像数据时——无论是字幕、OCR、分类还是识别图像中的特定内容。与其开放模型对手 PaliGemma 不同，Gemini 模型并未专门针对对象检测任务进行训练。这一事实促使我进行了一些实验并撰写了这篇博客。注意：在这里，当我们谈论对象检测时，我们的意思是通过绘制边界框来识别和定位对象，就像 YOLO、DETR、EfficientDet、Florence-2 和 PaliGemma 等模型一样。所以，事不宜迟，让我们来看看 Gemini 是否可以执行对象检测和定位。如果是，在多大程度上？ 1、代码实现我们只需要 Gemini API 密钥—不需要其他任何东西。我假设你已经熟悉 Gemini API。如果还不熟悉，请查看此博客以了解如何在 Google AI Studio 上创建 Gemini API 密钥。