MODEL-ZOO - Software 2.0 (Page 3) - 汇智网

Tagged

MODEL-ZOO

A collection of 158 posts

DeepSeek Janus Pro 7B

DeepSeek Janus Pro 7B

在本文中，我们将探讨 Janus-Pro-7B 的架构、功能、训练方法和潜在应用。此外，我们将提供在实际应用中利用此模型的代码片段。

DeepSeek R1 + Claude Sonnet

DeepSeek R1 + Claude Sonnet

我的想法是提供来自 DeepSeek 的思维链，帮助 Sonnet 表现更好。

DeepSeek-R1训练过程解密

DeepSeek-R1训练过程解密

作为一个花大量时间与 LLM 合作并指导他人如何使用它们的人，我决定仔细研究一下 DeepSeek-R1 的训练过程。

DeepSeek-R1蒸馏模型

DeepSeek-R1蒸馏模型

DeepSeek-R1已经在多个基准测试中超越了 SOTA 推理模型 OpenAI-o1。在这篇文章中，我们将深入研究DeepSeek-R1的6 个蒸馏模型。

DeepSeek-R1内部工作原理

DeepSeek-R1内部工作原理

在这篇文章中，让我们从什么是 DeepSeek-R1 模型开始，深入了解它的内部工作原理。

DeepSeek-R1图形界面Agent指南

DeepSeek-R1图形界面Agent指南

本文将指导你完成设置 DeepSeek R1 和 Browser Use 的过程，以创建能够执行复杂任务的 AI 代理，包括 Web 自动化、推理和自然语言交互。

DeepSeek-R1本地运行指南

DeepSeek-R1本地运行指南

在本指南中，我将向你展示如何在本地安装 DeepSeek-R1，利用其编码能力，并可能每月节省数百美元。

Object Eraser图像对象橡皮擦

Object Eraser图像对象橡皮擦

在这个博客中，我们将介绍设置和使用对象橡皮擦的过程，以便根据文本提示生成图像并随后删除特定对象。

DeepSeek LLM微调指南

DeepSeek LLM微调指南

在本指南中，我们将介绍使用监督微调 (SFT) 和 Hugging Face 数据集对 DeepSeek LLM 进行微调的过程，并提供针对特定领域数据集进行训练的分步代码演示。

UI TARS：最好的GUI Agent模型

UI TARS：最好的GUI Agent模型

UI-TARS 代表用户界面 - 任务自动化和推理系统，是字节跳动创建的创新型原生 GUI 代理模型。

DeepSeek R1 vs. OpenAI O1

DeepSeek R1 vs. OpenAI O1

在DeepSeek R1出现之前，我认为 OpenAI O1 模型是自 ChatGPT 以来 AI 领域发生的最好的事情。

Kokoro-82M：最好的TTS小模型

Kokoro-82M：最好的TTS小模型

最近，一种名为 Kokoro-82M 的革命性模型已经发布，它只有 8200 万个参数，并在 TTS 领域获得了 SOTA 结果。

从零实现2B参数LLM

我们将使用 Pile 数据集从头开始训练一个 20 亿参数的 LLM。结果，我们得到了一个 LLM，它在响应中输出完美的语法和标点符号，较短的上下文有意义，但不是整个响应。

Qwen2-Audio微调探索音乐转录

Qwen2-Audio微调探索音乐转录

自动音乐转录是将 MP3 和 WAV 等音频文件转换为乐谱、吉他指法谱以及音乐家可能想要用乐器学习歌曲的任何格式的过程。

SPAR3D快速指南

SPAR3D 是一种最先进的开源模型，用于通过点云调节从单个图像快速前馈 3D 网格重建，以提高重建质量。

ModernBERT微调实现文本分类

ModernBERT微调实现文本分类

ModernBERT 是最近发布的传统 BERT 模型的改进版本，本文将深入研究针对文本分类任务对 ModernBERT 进行微调。

Donut模型微调实用指南

在本指南中，我将向你介绍我用来微调 Donut 模型的确切步骤，以便你可以根据特定领域的需求对其进行调整。

DONUT：无需OCR的文档理解

DONUT：无需OCR的文档理解

从非结构化文档中提取数据始终是一项挑战。以前，我们曾经使用基于规则的方法来解决此类问题，现在DONUT是最先进的解决方案之一。

LayoutLM文档提取指南

LayoutLM 是一种革命性的模型，结合了文本识别和布局理解的强大功能，可以准确地从结构化文档中提取实体。

EasyOCR微调简明教程

你使用的 OCR 可能无法满足你的特定需求。在这种情况下，微调 OCR 引擎是可行的方法。在本教程中，我将向你展示如何微调 EasyOCR。

微调PaliGemma优化目标检测

微调PaliGemma优化目标检测

虽然 PaliGemma 具有零样本能力（这意味着模型无需微调即可识别物体），但这种能力是有限的。Google 强烈建议对模型进行微调，以在特定领域获得最佳性能。

FLUX.1微调实现自拍生成

本指南将引导你完成通过微调 FLUX.1 生成自己的 AI 头像的过程。

LLM微调综合指南

训练和微调模型是一项昂贵的苦差事，如果可以的话，你真的应该避免它，把省下的钱花在去阿鲁巴岛或任何你喜欢的度假胜地的旅行上。

NuExtract简明教程

NuExtract 是专为结构化提取任务而设计的专用 LLM，本文介绍如何使用NuExtract提取文本中的结构化数据。

Llama Guard保障LLM对话安全

Llama Guard保障LLM对话安全

LLM对话安全在这里指的是保护整个客户体验—不允许他们查看个人信息，防范有毒内容、有害内容，以及基本上任何他们不应该看到但不会影响他们整体体验的内容。