APPLICATION

DeepSeek R1驱动的简历自动分析

本文深入探讨了通过 Together.ai 平台集成 DeepSeek R1 以创建 Resume Roaster 的过程——一种用于详细简历审查的 AI 驱动工具。

admin

Feb 1, 2025 • 7 min read

DeepSeek R1 已用于通过自动化简历审查和为招聘经理提供可操作的见解来简化招聘流程。这些模型在理解和处理结构化文档方面表现出色，使其对于简历分析等任务非常有用。

本文深入探讨了通过 Together.ai 平台集成 DeepSeek R1 以创建 Resume Roaster 的过程——一种用于详细简历审查的 AI 驱动工具。无论你是开发人员还是技术爱好者，本指南都将帮助你利用 DeepSeek R1 构建可靠的生产级解决方案。

1、为什么选择 DeepSeek R1？

DeepSeek R1 是文档分析的首选，尤其是对于专业用例。与 GPT-3 等类似模型相比，DeepSeek R1 提供了更高的成本效益，并且更加注重结构化文档分析。原因如下：

深度理解：对专业文档的出色理解。
结构化分析：提供详细、格式良好的输出。
一致性：跨各种输入的可靠性能。
成本效益：与大型模型相比更实惠。

克隆存储库：

git clone https://github.com/allglenn/resume-roasrer-ai-agent.git
cd resume-roasrer-ai-agent

使用 Docker Compose 启动
docker-compose up - buil
设置集成
步骤 1：配置 Together.ai 客户端

首先设置 Together.ai 客户端。这可确保与 API 进行安全高效的交互：

from typing import Optional
import together
from app.core.config import settings

class TogetherAIService:
def init(self):
together.api_key = settings.TOGETHER_API_KEY
self.model = "deepseek-ai/DeepSeek-R1"
步骤 2：制作结构化提示

有效的提示工程（即制作输入以指导 AI 响应的过程）是获得一致且可操作的输出的关键：

def _construct_prompt(self, resume_content: str, career_interests: Optional[str] = None) -> str:
base_prompt = f"""请分析此简历并以以下格式提供详细反馈：

简历内容：
{resume_content}

请以 JSON 格式提供您的分析，结构如下：
{{
"summary": "简历简要概述",
"strengths": ["关键优势列表strengths"],
"weaknesses": ["需要改进的地方"],
"recommendations": ["具体建议"],
"keywords_missing": ["应该添加的重要关键词"],
"formatting_suggestions": ["改进格式的建议"],
"impact_score": "满分 10 分",
"detailed_feedback": {{
"experience": "经验部分反馈",
"education": "教育部分反馈",
"skills": "技能部分反馈"
}}
}}"""

if career_interests:
base_prompt += f"\n\n职业兴趣/目标:\n{career_interests}\n请根据这些职业兴趣定制反馈。"

return base_prompt
步骤 3：与 DeepSeek R1 的 API 交互

使用 Together.ai 的 API 有效处理简历：

def _construct_prompt(self, resume_content: str, career_interests: Optional[str] = None) -> str:
base_prompt = f"""请分析此简历并以以下格式提供详细反馈：

简历内容：
{resume_content}

请以 JSON 格式提供您的分析，结构如下：
{{
"summary": "简历简要概述",
"strengths": ["主要优势列表"],
"weaknesses": ["需要改进的领域"],
"recommendations": ["具体建议"],
"keywords_missing": ["应添加的重要关键字"],
"formatting_suggestions": ["更好格式的建议"],
"impact_score": “满分 10 分”,
“detailed_feedback”: {{
“experience”: “经验部分反馈”,
“education”: “教育部分反馈”,
“skills”: “技能部分反馈”
}}
}}“”

if career_interests:
base_prompt += f“\n\n职业兴趣/目标:\n{career_interests}\n请根据这些职业兴趣定制反馈。”

return base_prompt
步骤 3：与 DeepSeek R1 进行 API 交互

使用 Together.ai 的 API 有效处理简历：

async def analyze_resume(self, resume_content: str, career_interests: Optional[str] = None) -> dict:
try:

构造提示

prompt = self._construct_prompt(resume_content, career_interests)

添加系统提示来指导模型

system_prompt = “您是一位专业的简历审阅者，在人力资源和招聘方面拥有多年的经验。请就简历提供详细的建设性反馈

sumes。"
full_prompt = f"{system_prompt}\n\n{prompt}"

调用 API

response = together.Completion.create(
prompt=full_prompt,
model=self.model,
max_tokens=2048,
temperature=0.7,
top_p=0.9,
top_k=50,
repetition_penalty=1.0,
stop=['']
)

提取输出

text = response.output.choices[0].text if hasattr(response, 'output') else response.choices[0].text

return self._parse_response(text)

except Exception as e:
raise Exception(f"Error calling Together AI API: {str(e)}")
步骤 4：解析和验证响应

确保响应已解析和验证以保持可靠性：

def _parse_response(self, response_text: str) -> dict:
尝试:
start_idx = response_text.find('{')
end_idx = response_text.rfind('}') + 1
如果 start_idx == -1 或 end_idx == 0:
引发 json.JSONDecodeError("响应中未找到 JSON", response_text, 0)

json_str = response_text[start_idx:end_idx]
analysis = json.loads(json_str)

required_fields = [
"summary", "strengths", "weaknesses", "recommendations",
"keywords_missing", "formatting_suggestions", "impact_score",
"detailed_feedback"
]

对于 required_fields 中的字段:
如果字段不在分析中:
analysis[field] = []

返回分析

除外json.JSONDecodeError:
return {
"error": "无法解析 AI 响应",
"raw_response": response_text
}
集成最佳实践
优化模型参数

经过严格测试，以下参数最适合简历分析：

Temperature：0.7（平衡创造力和一致性）
Max Tokens：2048（确保详细响应）
Top-p 和 Top-k：0.9 和 50（保持多样性）
Repetition Penalty：1.0（避免冗余反馈）
错误处理

强大的错误管理确保无缝的生产级性能。例如，在测试期间，我们遇到了由于网络问题导致 API 响应失败的情况；重试和详细日志有助于保持系统可靠性：

尝试：
response = together.Completion.create(...)
except together.error.TogetherError as e:
logger.error(f"Together API 错误：{str(e)}")
raise
except Exception as e:
logger.error(f"意外错误：{str(e)}")
raise
响应验证

彻底验证响应：

检查 JSON 结构
验证必填字段
妥善处理缺失或无效字段
性能增强

为了优化集成的性能和可靠性，可以采用几种关键策略：

缓存：将分析后的简历存储在缓存中以减少冗余 API 调用。这不仅可以节省 API 成本，还可以加快对类似或相同简历的后续分析。例如，您可以使用 Redis 缓存根据简历内容的唯一哈希值存储和检索结果。
批处理：同时处理多个简历分析请求。通过将请求打包成批，您可以最大限度地提高吞吐量并最大限度地减少延迟。这在企业环境中处理批量上传时尤其有用。
超时：设置合理的超时以防止处理延迟。例如，配置您的 API 客户端，如果未收到响应，则在指定的持续时间后重试，以确保系统范围内的延迟不会级联。
速率限制：通过实施速率限制来确保遵守 API 配额。这有助于避免因超出使用限制而导致的服务中断。NGINX 或 API Gateway 等工具可以帮助有效地管理请求速率。
未来方向

为了进一步改进 Resume Roaster 工具及其功能，请考虑这些未来的增强功能：

微调：通过在特定领域的数据集上对其进行微调，为特定于简历的任务定制 DeepSeek R1。这可以提高模型检测行业特定术语和细微差别的能力，从而产生更具针对性的反馈。
提示优化：根据用户反馈不断完善提示，以提高输出的准确性和相关性。通过尝试措辞和结构，您可以引导模型提供更多可操作的见解。
多语言支持：扩展工具的功能以支持多种语言。这对于希望分析来自不同候选人的简历的全球公司来说尤其有价值。
行业特定模板：为医疗保健、IT 或金融等特定行业开发定制的反馈格式。例如，医疗保健简历可能需要详细分析认证和临床经验，而 IT 简历可以侧重于技术技能和项目组合。

原文链接：FastAPI: Building an AI-Powered Resume Analyzer (code & demo)

汇智网翻译整理，转载请标明出处