5个适合忙碌人士的AI项目
提升你的AI技能的最佳方法是通过构建项目。然而,对于忙碌的专业人士和领导者来说,找到时间坐下来实际编写项目可能会成为一个挑战。在这里,我分享了5个可以在一小时(或更少)内完成的AI项目,分为三个复杂程度。对于每个想法,我都提供了逐步说明和示例代码以帮助你开始。
AI给了我们最宝贵的资源:时间。这来自于自动化和加速可能需要我们花费数小时才能完成的任务。
对于程序员来说,最好的利用方式是使用像ChatGPT、Cursor或Co-pilot这样的工具来帮助你更快地编写代码。这些工具已经将我的“下午项目”压缩成我可以在一个小时内或更短的时间内完成的东西。
在这里,我分享了我在不到一个小时的时间里完成的5个项目。你可以直接使用这些项目,或者(更好的是)使用它们作为灵感来自动化你经常重复的任务。
1、YouTube博客转换器(初学者)
内容创作是我作为企业家的一部分工作。虽然这是独资创始人让客户了解他们的产品和服务的最佳方式之一,但这是一个耗时的过程。
一个帮助我将博客文章写作速度提高3倍的自动化方法是使用GPT-4o将YouTube视频字幕翻译成文章。尽管这并不自动化整个内容创作过程,但它仍然为我节省了开发初始草稿的时间。
关键步骤:
- 使用正则表达式从视频链接中提取YouTube视频ID
- 使用视频ID通过youtube-transcript-api提取字幕
- 编写一个提示,重新利用视频字幕生成一篇博客文章
- 使用OpenAI的Python API发送提示
资源:提取字幕的示例代码 | OpenAI API调用的示例代码
# (第2步) 从YouTube视频中提取字幕
from youtube_transcript_api import YouTubeTranscriptApi
# 视频ID(来自第1步)
video_id = "bAe4qwQGxlI"
# 获取字幕
transcript = YouTubeTranscriptApi.get_transcript(video_id)
# 合并字幕文本
transcript_text = "\n".join([entry["text"] for entry in transcript])
附注:我将这个项目转化为一个正式的网络应用程序y2b.io。
2、PDF问答聊天机器人(初学者)
虽然ChatGPT是一个很好的快速文档问答工具,但对于包含敏感信息的文件来说,这不是一个合适的解决方案(上传到ChatGPT的数据可以用于未来模型训练)。
一种解决方案是在本地机器上设置一个LLM聊天系统。这里有一个使用ollama的方法。
关键步骤:
- 下载ollama
- 使用PyMuPDF从PDF中提取文本
- 使用ollama拉取你最喜欢的LLM
- 编写一个系统消息,将PDF文本传递给模型的上下文
- 传递用户关于文档的问题的消息
- (可选)使用gradio创建一个简单的UI
资源:本地聊天机器人的示例代码 | 提取PDF文本的示例代码
# Ollama的基本用法(注意:你需要先本地安装ollama)
import ollama
import time
# 拉取模型
ollama.pull('llama3.2-vision')
# 与模型交互(本地)
stream = ollama.chat(
model='llama3.2-vision',
messages=[
{
'role': 'user',
'content': '什么是LLM?',
}
],
stream=True,
)
# 流式输出文本
for chunk in stream:
print(chunk['message']['content'], end='', flush=True)
3、RAG聊天机器人(中级)
有时,你不仅想在单个PDF中查找信息,还想在分散在多个文件中的信息中查找。这就是检索增强生成(RAG)发挥作用的地方。
RAG 在将查询传递给LLM之前会自动检索与用户查询相关的上下文。这里有一个使用LlamaIndex简单实现的方法。
关键步骤:
- 将文档读取并存储到向量数据库中
- 创建一个搜索函数,根据查询从数据库中检索上下文
- 构建一个提示模板,结合用户查询和检索到的上下文,并将其传递给LLM
- 将组件连接在一个简单的链中:查询 -> 检索 -> 提示 -> LLM
- 编写查询并将其传递到链中
- (可选)使用gradio创建一个简单的UI
资源:RAG的示例代码 | gradio UI的示例代码
4、聚类客户反馈(中级)
RAG的核心组成部分之一是向量数据库,它使检索过程成为可能。更具体地说,这些“向量”是所谓的文本嵌入,对一段文本语义意义的数值表示。
然而,RAG并不是唯一使用嵌入的应用场景。这些向量可以与传统的机器学习方法相结合,解锁无数应用。我最近使用它们来分析和总结客户开放式调查响应中的模式。
关键步骤:
- 加载调查数据
- 使用sentence transformers Python库对开放性回答进行编码
- 使用KMeans(scikit-learn)按相似度聚类回答
- 编写一个提示,总结给定聚类中的回答
- 使用GPT-4o-mini总结每个聚类中的回答
资源:示例代码
# Sentence Transformers库的基本用法
from sentence_transformers import SentenceTransformer
# 加载模型
model = SentenceTransformer("all-distilroberta-v1")
# 计算嵌入
embeddings = model.encode(text_list)
5、领英帖子撰写器(高级)
一个流行的AI应用是将其用于内容营销。然而,在实践中这样做却很棘手,因为一方面内容听起来像是AI生成的,另一方面搜索引擎和社会媒体平台积极检查并抑制AI生成的内容。
我们可以通过微调一个LLM来缓解这些问题,使其适应个人独特的写作风格和声音。我最近使用OpenAI的微调API来训练GPT-4o在我的领英帖子上。以下是你也可以做到的方法。
关键步骤:
- 创建一个包含(10-50)个想法-帖子配对的.csv文件
- 设计一个提示模板,结合响应指令和领英帖子想法
- 生成消息-响应示例并将其存储为字典列表
- 可选地将数据集拆分为训练集和验证集
- 保存数据为.jsonl格式,以便OpenAI的微调API使用
- 将.jsonl文件上传到OpenAI
- 创建一个微调作业
- 比较微调模型和GPT-4o
资源:示例代码
6、结束语
如今的AI编程工具(如ChatGPT、Cursor)使得构建项目变得前所未有的快速。更广泛的影响是新程序员可以在几小时内开始构建实用项目,而有经验的程序员可以在一个周末内构建一个完整的产品。
在这里,我分享了跨越三个复杂程度的5个AI项目。我希望其中一个项目能够帮助那些因构建AI而停滞不前的人打破僵局。
原文链接:5 AI Projects For People in a Hurry
汇智网翻译整理,转载请标明出处