ComfyUI-DataSet 简明手册
ComfyUI-Dataset是一个ComfyUI的自定义节点包,为模型训练师和艺术家提供用于数据研究、准备和操作的节点。
0、安装ComfyUI-DataSet
可以使用ComfyUI-Manager安装这个包:
- 在 ComfyUI 内部 > 单击侧面的管理器按钮。
- 单击自定义节点管理器并搜索
Dataset
并安装此节点:
也可以使用comfy-cli 安装:
comfy node registry-install ComfyUI-DataSet
还可以手工安装:
- 转到 Comfyui > 自定义节点文件夹路径 > 运行 CMD
- 复制并粘贴此命令:
git clone https://github.com/daxcay/ComfyUI-DataSet.git
- 然后使用
cmd
进入 ComfyUI-DataSet 或打开新文件。 - 输入
pip install -r requirements.txt
以安装依赖项
ComfyUI-Dataset安装后,可以在 Dataset
分类下找到节点,如下图所示:
ComfyUI-Dataset提供了14个与数据集操作相关的节点,如下图所示:
1、DataSet_Visualizer
DataSet_Visualizer
节点旨在可视化数据集标题。它生成提供各种标记分析视角的图表。词云用不同大小的字体表示标记频率。网络图说明了标记之间的关系。频率图提供了每个标记在标题中出现频率的精确指标。
输入:
- TextFileContents(STRING,必需):要处理的文本文件的内容。
- Seperator(['逗号', '冒号', '空格', '竖线'],必需):用于分隔文本文件中的标记的分隔符。
- WordCloudTop(INT,最小值:1,最大值:9999,必需):要在 WordCloud 中绘制的顶级标记数。
- NetworkGraphTop(INT,最小值:1,最大值:9999,必需):标题中互连性最高的顶级标记数。
- FrequencyGraphTop(INT,最小值:1,最大值:9999,必需):从最高到最低频率最高的顶级标记数。
输出:
- GraphsPaths(STRING,列表):生成的可视化文件路径。它包括以下路径
- WordCloud 图像、NetworkGraph 图像、FrequencyTable 图像
- GraphsImages(IMAGE,列表):为可视化生成的图像,可与 PreviewImage 和 SaveImage 节点一起使用。
2、DataSet_CopyFiles
DataSet_CopyFiles
节点提供了一种使用不同模式将文件从源文件夹复制到目标文件夹的方法:BlindCopy 和 CopyByDestinationFiles。
输入:
- source_folder(STRING,默认值:“目录路径”,必填):文件的源文件夹路径。
- destination_folder(STRING,默认值:“目录路径”,必填):复制文件的目标文件夹路径。
- copy_mode(['BlindCopy', 'CopyByDestinationFiles'],必填):BlindCopy:将所有文件从源复制到目标文件夹;CopyByDestinationFiles:仅当目标中已经存在匹配文件(基于基本名称)时,才将文件从源文件夹复制到目标。
3、DataSet_TriggerWords
DataSet_TriggerWords
节点旨在从字幕中提取触发词。该节点将触发词标识为包含字母和数字的标记。
输入:
- TextFileContents(STRING,必需):要处理的文本文件的内容。
- search(['trigger_word_only', 'trigger_word_phrase'], 必需):'trigger_word_only':仅提取单个触发词;'trigger_word_phrase':提取包含触发词的整个短语(包含在两个逗号内)
输出:
- Words(STRING,列表):提取的触发词或包含触发词的短语
4、DataSet_TextFilesLoadFromList
DataSet_TextFilesLoad
节点旨在处理 txt 文件的基本属性。例如,它可以提取文件名或不带扩展名、文件路径和文件内容的文件名。对某些批处理工作流很有用。它以文件目录路径作为输入
输入:
- TextFilePathsList(STRING,必需):要加载的文本文件的文件路径列表。仅处理以 .txt 结尾的路径。
输出:
- TextFileNames(STRING,列表):文本文件的名称。
- TextFileNamesWithoutExtension(STRING,列表):不带扩展名的文本文件的名称。
- TextFilePaths(STRING,列表):文本文件的文件路径。
- TextFileContents(STRING,列表):文本文件的内容。
5、DataSet_TextFilesLoad
与上面相同,但使用文件目录的小部件路径进行输入
输入:
- directory(STRING,必需):文本文件所在的目录路径。路径应指定为字符串。
输出 - TextFileNames(STRING,列表):目录中文本文件的名称。
- TextFileNamesWithoutExtension(STRING,列表):文本文件的名称(不带扩展名)。
- TextFilePaths(STRING,列表):目录中文本文件的文件路径。
- TextFileContents(STRING,列表):目录中文本文件的内容。
6、DataSet_TextFilesSave
DataSet_TextFilesSave
节点用于将文本文件内容保存到指定目录。支持以下模式:覆盖、合并、创建新文件和合并后保存新文件 不明白这一点。
输入:
- TextFileNames(STRING,必需):要保存的文本文件的名称。
- TextFileContents(STRING,必需):要保存的文本文件的内容。
- destination(STRING,必需):将保存文本文件的目录路径。
- save_mode(['Overwrite', 'Merge', 'SaveNew', 'MergeAndSaveNew'], required): 保存文件的模式:Overwrite:覆盖同名的现有文件;Merge:将内容附加到同名的现有文件;SaveNew:如果已经存在同名文件,则保存具有唯一名称的新文件;MergeAndSaveNew:如果已经存在同名文件,则将内容与现有文件合并,然后另存为具有唯一名称的新文件。
7、DataSet_FindAndReplace
DataSet_FindAndReplace
节点在字幕文本文件中查找并替换文本模式。
输入:
- TextFileContents(STRING,必需):要处理的文本文件内容
- SearchFor(STRING,默认值:“search-text”,必需):在 TextFileContents 中搜索的文本模式。支持多行输入。
- ReplaceWith(STRING,默认值:“replacement-text”,必需):SearchFor 模式的替换文本。支持多行输入。
输出:
- TextFileContents(STRING,列表):文本文件的修改内容
8、DataSet_PathSelector
DataSet_PathSelector
可用于识别子数据集中缺少来自较大图像文本配对父存储库的标题文本文件的图像。节点将在一个目录中搜索孤立的文本/图像文件,这些文件需要另一个目录中具有匹配名称的缺失配对文件。
输入:
- search_in_directory(STRING,必需):缺少配对的子数据集目录
- search_for_extensions(STRING,必需):孤立文件的扩展名,用逗号分隔(例如 .txt、.csv)。
- select_from_directory(STRING,必需):包含完整文本-图像配对的存储库目录。
- select_extensions(STRING,必需):要添加的所需文件的扩展名,以逗号分隔(例如,.txt、.csv)。
输出:
- SelectedNamesWithExtension(STRING,列表):所需文件的名称及其扩展名。
- SelectedNamesWithoutExtension(STRING,列表):所需文件的名称,不带扩展名。
- SelectedPaths(STRING,列表):所需文件的完整路径。
9、DataSet_ConceptManager
DataSet_ConceptManager
节点旨在添加/删除标题文件内的标记,它将允许您将这些标记放置在标题内的指定位置
输入:
- TextFileContents(STRING,必需):要处理的文本文件的内容。
- Mode(STRING,必需):操作模式:'add' 添加 token 或 'remove' 删除 token。
- Concepts(STRING,必需):要添加或删除的概念,格式为文本 + 位置(例如,添加时为“tag1 0, tag2 2”,删除时为“tag1, tag2”)。
输出:
- TextFileContents(STRING,列表):修改后的字幕文件内容
10、DataSet_OpenAIChat
DataSet_OpenAIChat
使用 OpenAI GPT 聊天来帮助你生成提示。
输入:
- model(STRING,必需):选择 OpenAI 模型。选项包括“GPTo”、“gpt-3.5-turbo”等。
- api_url(STRING,默认值:“https://api.openai.com/v1”):API 的基本 URL。
- api_key(STRING,必需):用于身份验证的 API 密钥。
- prompt(STRING,默认值:“”):查询聊天。提示 GPT 生成提示
- token_length(INT,默认值:1024):最大标记数(单词)。
输出:
- STRING:GPT 生成的新提示
11、DataSet_LoadImage
DataSet_LoadImage
节点为使用 DataSet_OpenAIChat
节点进行字幕处理提供了必要的图像文件属性。它利用了 Pillow 和 Numpy 库。
输入:
- image(STRING,必需):要从输入目录加载的图像文件的名称。
输出:
- IMAGE:图像文件。
- MASK:与图像关联的掩码。
- STRING:图像文件的名称。
- STRING:不带扩展名的图像文件的名称。
- STRING:图像文件的完整路径。
- STRING:图像文件的目录路径。
12、DataSet_SaveImage
DataSet_SaveImage
节点使用可选的 PNG 元数据批量将图像保存到指定目录。还使用 Pillow 和 Numpy。
输入:
- Images(IMAGE,必需):要保存的图像列表。
- ImageFilePrefix(STRING,默认值:“Image”):已保存图像文件名的前缀。
- destination(STRING):图像将被保存的目录路径。
13、DataSet_OpenAIChatImage
DataSet_OpenAIChat
在聊天框架中使用 OpenAI GPTo 多模态视觉 API,以便为图像添加字幕。
输入:
- image(IMAGE,必需):要处理的图像。
- image_detail(STRING,默认值:“high”:图像的细节级别(“低”或“高”)。
- prompt(STRING,默认值:“”):AI 模型的文本提示。
- model(STRING,默认值:“gpt-4o”):选择 OpenAI 模型。选项包括“GPTo”、“gpt-3.5-turbo”等。
- api_url(STRING,默认值:“https://api.openai.com/v1”):OpenAI API 端点 URL。
- api_key(STRING):用于身份验证的 API 密钥。
- token_length(INT,默认值:1024):生成的响应的最大令牌长度。
输出:
- STRING:生成的字幕
14、DataSet_OpenAIChatImageBatch
DataSet_OpenAIChatImageBatch
类扩展了 DataSet_OpenAIChatImage
的功能,可以使用 OpenAI 的聊天 API 处理批量图像以生成文本字幕。
输入:
- images(IMAGE,必需):要处理的图像列表。
- image_detail(STRING,默认值:“high”):图像的细节级别(“低”或“高”)。
- prompt(STRING,默认值:“”):AI 模型的文本提示。
- model(STRING,默认值:“gpt-4o”):选择 OpenAI 模型。选项包括“GPTo”、“gpt-3.5-turbo”等。
- api_url(STRING,默认值:“https://api.openai.com/v1”):OpenAI API 端点 URL。
- api_key(STRING):用于身份验证的 API 密钥。
- token_length(INT,默认值:1024):生成的响应的最大令牌长度。
输出:
- STRING:生成的字幕列表
原文链接:ComfyUI-Dataset
汇智网翻译整理,转载请标明出处