MODEL-ZOO Reve Image 1.0神秘的文生图模型 来自halfmoon公司的一款名为 REVE Image 1.0 的新文本到图像模型是一款由一小群充满热情的研究人员、构建者、设计师和讲故事的人打造的创意工具初创公司。自昨天发布以来,它一直在图像基准列表中名列前茅。
MODEL-ZOO RF-DETR模型微调指南 RF-DETR于2025年3月19日发布,是由Roboflow开发的一种基于Transformer的物体检测模型架构。 RF-DETR在COCO和新推出的RF100-VL数据集上实现了最先进的性能,超越了LW-DETR和YOLOv11等模型。RF100-VL是一个基准测试,旨在验证检测能力模型在各种领域的泛化能力。 通过将分辨率扩展到728,RF-DETR在NVIDIA T4 GPU上达到了60.5 mAP,速度为25 FPS,成为第一个在Microsoft COCO基准测试中突破60mAP障碍的实时模型。该模型在NVIDIA T4上也达到了25 FPS。 RF-DETR按照Apache 2.0许可证授权,允许免费商业使用。 RF-DETR在RF100-VL上的评估表现RF-DETR在Microsoft COCO上的评估表现在这篇指南中,我们将介绍如何在自定义数据集上训练一个RF-DETR模型。我们将以识别麻将牌为例进行训练,这是一个涉及多个不同类别的任务。 以下是我们将要训练的模型的结果示例(右侧),以及真实标签(左侧): 我们的模型结果几乎与真实标签一致,这是对RF-DETR预测质量的一个证明。 不多说了,让我们开始吧! 💡你可以使用我们的Colab训练笔记本跟随本指南。我们建议使用A100进行训练。 1、准备数据集首先,我们需要准备一个数据集。在这个指南中,我们将使用一个麻将牌识别数据集,这是RF100-VL基准测试中的一个数据集之一。该数据集包含超过2000张麻将牌图像,并且是根据Apache 2.0许可证授权的。 你可以在Roboflow Universe上的麻将牌页面下载数据集。
MODEL-ZOO 用Unsloth微调Gemma-3 当大家都在竞相构建基于 ChatGPT 的应用程序时,精明的开发人员正在悄悄发现这个新轻量级 Gemma-3 的微调能力,这是一个隐藏的宝石,可以将通用人工智能转化为你的专业数字专家。
MODEL-ZOO Gemma 3:多语言多模态长上下文 Gemma 3是 Gemma 系列模型的新一代。这些模型的参数范围从 1B 到 27B,具有高达 128k 个标记的上下文窗口,可以处理图像和文本,并支持 140 多种语言。
MODEL-ZOO Claude 3.7 Sonnet:最好的代码AI 传统的AI编码工具就像才华横溢但缺乏经验的实习生。他们会热切地建议一个巧妙的React钩子优化,却意外地破坏了三个模块外的身份验证流程。Claude 3.7 Sonnet打破了这些限制。
MODEL-ZOO Tiny-R1小模型比肩DeepSeek-R1 Tiny-R1–32B-Preview模型是由Qihoo360开发的第一代推理模型,旨在利用仅占全R1模型5%的参数的情况下提供接近R1的性能。
MODEL-ZOO 字节跳动GOKU视频生成模型 字节跳动推出了 Goku,这是一种专为高质量视频生成而设计的高级 AI 模型。通过利用文本到视频和图像到视频的合成,Goku 重新定义了 AI 驱动的内容创作并突破了创意界限。
MODEL-ZOO 在CPU上运行DeepSeek-R1 在 CPU 上运行 LLM 提供了一种扩大可访问性的替代方案,允许更多用户在现有硬件上利用 AI。本指南探讨了在 CPU 上有效使用 DeepSeek R1 的方法。
MODEL-ZOO 3个DeepSeek-R1平替推理模型 人工智能在逻辑推理、问题解决和可解释性方面正在迅速发展。虽然 DeepSeek 的 R1 引起了关注,但它并不是唯一在推理任务中表现出色的免费 AI 模型。
MODEL-ZOO VPTQ低位LLM量化算法 在 MMLU 等任务上,使用 VPTQ 的 2 位量化几乎实现了与原始 16 位模型相当的性能。此外,它能够在单个 GPU 上运行 Llama 3.1 405B,同时使用的内存比 70B 模型少!
MODEL-ZOO DeepSeek R1 vs. V3:如何选择? 在手机或桌面上使用 DeepSeek 应用程序时,我们可能会不确定何时选择 R1(也称为 DeepThink),而不是日常任务的默认 V3 模型。