翊行代码

企业AI编程合规指南：私有化大模型部署的负责任实践

2025-06-30T10:00:00+08:00

💡 核心观点预览

• 技术突破：开源大模型推动企业AI编程私有化部署 • 效率革命：AI编程工具显著提升开发者生产力 • 合规关键：MCP治理框架成为企业AI编程安全核心 • 实践指南：从技术架构到治理框架的完整合规方案

🚀 引言：企业AI编程合规的新挑战

2025年，随着DeepSeek R1、Qwen Coder等开源大模型的爆发式增长，AI编程工具在企业中的应用呈现出爆发式增长。据IDC 2024年Q4报告显示，全球企业私有化AI部署增长率达37.6%，其中金融、医疗、制造三大行业占比超60%。

然而，在追求开发效率提升的同时，企业面临着前所未有的合规挑战：如何在享受AI编程红利的同时，确保数据安全、算法公平、流程透明？如何建立既能释放AI潜力又能满足监管要求的治理框架？

GitHub最新研究数据显示：使用AI编程工具的开发者生产力提升26%-55%，但78%的企业对AI编程的合规性表示担忧。本文将从合规要求、技术架构、治理框架等维度，为企业提供负责任AI编程的完整实践指南。

📊 市场现状：AI编程工具的爆发式增长

🔥 开发者采用趋势

Uplevel最新研究发现：使用GitHub Copilot的开发者错误率上升41%，但同时编码速度提升21%-26%，这一矛盾现象引发了业界对AI编程工具质量的深度思考。

📈 企业投资趋势

OpenAI 2025年训练和推理成本预计达70亿美元
DeepSeek V3部署需要高达1532GB VRAM
企业私有化部署年均增长率：37.6%

这些数据表明，企业对AI编程工具的需求急剧增长，但同时也暴露出质量控制和合规管理的重要性。

🏗️ 技术架构：企业级私有化部署方案

🧠 模型选型与硬件配置

推理引擎选择：VLLM + Kubernetes + GPU Share

代码工具推荐配置

应用场景	推荐模型	硬件要求	性能表现	适用工具
代码提示	Qwen Coder 32B AWQ	A100	快速响应，30并发	Continue(IDEA/VSCode)
代码生成	DeepSeek R1/V3	8*H100	效果最佳，复杂任务，20	AutoCoder, Cline/Roo Code
轻量部署	Qwen3 32B/8B AWQ	1*A100	高性价比	AutoCoder, Cline/Roo Code
企业级	Qwen3 235B-A22 AWQ	2*H100	超强性能	AutoCoder, Cline/Roo Code

推荐工具组合：

代码提示：Continue + Qwen Coder 32B AWQ（快速响应）
代码生成：Cline/Roo Code + DeepSeek R1（高质量输出）
推理引擎：VLLM（30 tokens/s，企业级稳定）

🔧 MCP合规治理：构建安全可控的AI编程生态

Model Context Protocol (MCP) 作为AI编程工具与企业系统的重要桥梁，如果缺乏有效治理，可能成为合规风险的重要来源。

🎯 企业内部MCP服务体系

核心MCP服务组件：

编码脚手架MCP
- 标准化项目模板生成
- 企业级框架集成
- 安全配置默认值
编码规范MCP
- 代码风格自动检查
- 安全编码最佳实践
- 合规性规则验证
知识库MCP
- 企业内部文档检索
- API规范和示例
- 最佳实践案例库
安全审计MCP
- 代码安全扫描
- 敏感信息检测
- 合规性评估

🛡️ MCP安全治理框架

1. 访问控制与权限管理

MCP权限矩阵
├── 开发者级别
│   ├── 初级：基础脚手架 + 编码规范
│   ├── 中级：+ 知识库访问
│   └── 高级：+ 架构模板
├── 团队级别
│   ├── 前端团队：前端专用MCP
│   ├── 后端团队：后端专用MCP
│   └── 全栈团队：全量MCP访问
└── 项目级别
    ├── 核心项目：严格审计MCP
    ├── 一般项目：标准MCP套件
    └── 实验项目：宽松MCP策略

2. MCP内容安全管控

敏感信息防护：

数据脱敏：MCP响应中自动脱敏敏感信息
内容过滤：过滤包含机密信息的代码示例
访问日志：记录所有MCP交互的详细日志

代码质量保障：

安全代码模板：MCP仅提供经过安全审查的代码模板
漏洞检测：集成SAST工具检测MCP生成的代码
版本控制：MCP内容的版本管理和回滚机制

🔧 企业级增强策略

RAG（检索增强生成）：集成企业代码库和文档
Fine-tuning：基于企业代码风格和规范训练
Multi-Agent：代码生成、审查、测试多智能体协作

性能优化建议：

✅ 推荐：VLLM推理引擎，推理速度可达 30 tokens/s 左右
❌ 避免：Ollama（存在外网访问风险，不适合企业环境）
🔧 调优：根据并发需求调整GPU内存分配，弹性扩缩容副本数
📊 监控：实时监控推理延迟和吞吐量指标

⚠️ 风险评估与最佳实践

🚨 常见部署陷阱与解决方案

错误做法	正确做法	关键要点
盲目追求大模型	根据需求选择合适版本	考虑团队规模和业务复杂度
忽视网络架构设计	预留足够带宽	考虑峰值并发场景
先上线再考虑安全	设计阶段内置安全机制	合规前置，预防为主
使用外网访问工具	选择企业级推理引擎	避免数据泄露风险

✅ 成功部署要素

🎯 明确业务目标 - 聚焦解决具体痛点
👥 高层支持 - 确保资源投入
🔄 持续优化 - 保持技术迭代
📊 性能监控 - 动态调整资源分配

🔮 未来展望

🌟 技术发展趋势

模型轻量化：量化技术成熟，边缘部署成为可能
多模态融合：图像+代码的联合理解能力
全流程自动化：代码生成+测试+部署一体化

💡 企业策略建议

渐进式部署：从小规模试点到核心业务
混合云策略：敏感数据本地，非敏感任务云端
人才培养：AI工程师团队建设

🎯 结论：负责任AI编程的关键要素

企业AI编程合规需要在技术、治理、文化三个维度协同发力：

技术合规： 私有化部署 + 数据安全防护 + 模型透明度 治理框架： 跨部门AI委员会 + 详细使用政策 + 持续改进机制
文化建设： 负责任AI意识培训 + 开放沟通 + 创新实践鼓励

只有建立完整的合规体系，企业才能真正释放AI编程的巨大潜力，实现可持续的数字化转型。

本文首发于技术博客。如需转载，请联系作者授权。

让我们一起推动AI编程在企业中的负责任落地应用！ 🚀✨

🚀 Claude Code + Cursor：AI编程的黄金组合来了！

2025-06-25T00:00:00+08:00

🚀 Claude Code + Cursor：AI编程的黄金组合来了！

💭 一个意外的发现

说起来有点不好意思，我断更了两个月 😅

这段时间一直在疯狂测试各种AI编程工具：从每月20美元的Cursor，到刚出来就要10美元(早期用户优惠)的Windsurf，再到只能试用14天的Augment；从免费但体验一般的TRAE，到需要自己配置的开源AutoCoder（早于Claude Code的国产版Claude Code），最后到最近让我惊艳的Claude Code…

我甚至还兴冲冲地加入了公司的”AI编程变革小组”，想着要在团队里推广这些新工具。结果发现我可能更沉迷于一个人的快乐。最后我索性退出了，回到自己的个人探索节奏。

直到上周，我突然意识到一个问题：我一直在纠结选哪个工具，但其实根本不用选择！ 💡

想象一下这个场景：

早上用Claude Code花5分钟搭建整个项目架构
白天在Cursor里舒舒服服地写代码，享受丝滑的Tab补全
遇到复杂重构时，切回Claude Code让AI帮我处理
调试时又回到Cursor的可视化界面

这不就是最理想的工作流吗？

Claude Code + Cursor = 我梦寐以求的AI编程体验 🔥

� 核心发现：不是选择题，而是配合题！让专业的工具做专业的事

⚡ Claude Code：在终端里遇见AI架构师

为什么终端工具突然变香了？

刚开始用Claude Code的时候，我其实是拒绝的。毕竟已经习惯了Cursor的可视化界面，突然回到黑乎乎的终端，感觉像是在”倒退”。

但用了几天后，我发现了一个神奇的现象：有些事情，只有在终端里才能做得这么流畅！

比如说，当我想要重构一个包含20多个文件的模块时：

在Cursor里，它需要一个文件一个文件地打开、修改、保存穿行操作
在Claude Code里，我只需要描述需求，它就能同时处理多个相关文件

这就是超大上下文和架构级思考的威力：

🔥 200K token上下文：能理解大多数项目的每一行代码
🧩 全局架构视角：不只是改代码，而是重新设计
🧙‍♂️ 复杂任务自动化：基于Claude 4 Sonnet的强大推理能力
🤖 多文件协同处理：一次操作，影响整个项目

🛠️ 18个专业工具，就像有了一个AI团队

更让我惊喜的是，Claude Code不只是一个”聊天机器人”，它更像是一个内置了18种专业工具的AI开发团队：

这种感觉就像是，你不再是一个人在战斗，而是有了一个全能的AI助手团队。

🎨 Cursor：我的舒适编码空间

有些体验，只有IDE能给你

说完了Claude Code的强大，我也得为Cursor说几句公道话。

作为一个深度定制的VSCode，Cursor在日常编码体验上相对于被断供Claude4的Windsurf真的无可替代，相对于每个月50美元的AugmentCode 还是能体现出一点性价比：

想象一下你在写代码时：

刚打了一个函数名的前几个字母，Tab键一按，完整的函数就出现了
想要重命名一个变量，Ctrl+D全选，一次性改完所有引用
代码有错误？红色波浪线立刻提醒，鼠标悬停就能看到解决方案
想要调试？断点、单步执行、变量监控，一应俱全

这些看似平常的功能，背后是几十年IDE进化的积累：

⚡ 毫秒级响应：Tab补全几乎是瞬间出现
🎯 上下文精准理解：知道你现在在哪个函数、哪个类里
🖥️ 可视化界面：文件树、搜索面板、终端，布局随心所欲
🔧 生态无缝集成：Git、调试器、插件市场，什么都有

这种舒适感，是任何终端工具都无法替代的。

🤝 黄金组合：1+1>2的神奇化学反应

🏆 终于不用纠结选择了

花了两个月测试各种工具后，我终于想明白了一个道理：

Claude Code和Cursor根本不是竞争对手，它们是天作之合的搭档！

想想看：

Claude Code就像一个AI架构师：擅长规划、设计、重构这些”大事”
Cursor就像一个贴心助理：帮你处理日常编码的各种”小事”

这不就是理想的开发团队配置吗？

📝 我的黄金工作流（亲测有效）

经过几周的实践，我总结出了这套”黄金工作流”：

🌅 早上（Claude Code时间 - 大脑最清醒）：

� 需求梳理：让AI帮我分析需求，设计技术方案
🏗️ 架构搭建：一次性创建整个项目结构
� 代码分析：检查昨天的代码有没有架构问题
📝 文档更新：自动生成API文档、README等

🌞 白天（Cursor时间 - 专注编码）：

⌨️ 愉快地写代码：享受丝滑的Tab补全和智能提示
� 调试和测试：可视化界面让debugging更轻松
🔧 细节优化：代码格式化、重构小函数等
💬 团队协作：Git操作、Code Review等

🌙 晚上（Claude Code时间 - 总结反思）：

� 代码审查：让AI检查今天写的代码质量
📈 性能优化：分析性能瓶颈，提出改进方案
� 学习总结：整理今天遇到的技术问题和解决方案

这种工作流的好处是：每个工具都在最适合的场景下发挥最大价值！

📊 数据支撑最佳组合

Claude Code在复杂任务上的表现：

SWE-bench测试：72.5%成功率
800行代码项目：2小时完成（传统需1周）
代码质量评分：8.7/10

Cursor在日常编码上的优势：

Tab补全响应：毫秒级
IDE集成度：接近原生
上手难度：几乎为零

💰 钱包友好度对比：该花的钱不能省

💸 现实一点，咱们来算算账

作为一个理性的程序员，工具再好用，也得考虑性价比不是？

Claude Code的定价（相对良心）：

💚 Pro计划：$20/月，已经足够大部分开发者使用
🧡 Max 5x计划：$100/月，适合重度用户
❤️ Max 20x计划：$200/月，团队或企业用户
💰 镜像版：每个月大概￥300元

Cursor的定价（2025年更新后有点贵）：

💸 Pro版本：$20/月，但只能用Claude Sonnet，上下文128K
💸💸 Ultra版本：$200/月，才能获得20倍使用量
💰 想用Opus模型？抱歉，需要额外付费
💰 想要200K上下文？开启Max模式，又是一笔钱

算一笔账：

如果你只用Cursor Pro：$20/月，功能受限
如果你要Cursor的全部功能：$200+/月
如果你用Claude Code Pro + Cursor Pro：$40/月，双重体验

结论：组合使用的性价比居然更高！ 🤯

🔥 真实案例：看看这套组合有多强

📱 案例一：救急项目，5分钟搞定

背景：周五下午5点，老板突然说要在管理面板加个排序功能，周一要上线…

传统做法：加班到深夜，各种踩坑 我的做法：

Claude Code出手（2分钟）：
- 🔍 自动定位相关代码文件
- 🎨 设计UI按钮的最佳位置
- 🔧 生成完整的排序逻辑代码
Cursor接棒（3分钟）：
- ✨ 复制粘贴代码，Tab补全微调
- 🐛 可视化调试，确保功能正常
- 💄 界面美化和样式调整

结果：

⏰ 总耗时：5分钟功能开发 + 15分钟测试
💰 工具成本：不到2美元
😎 个人状态：准时下班，心情愉悦

🐛 案例二：Bug修复变成了代码重构

背景：一个看似简单的Bug，牵扯到了整个模块的架构问题

Claude Code的表现：

🔍 问题诊断：不只是修复Bug，而是发现了设计缺陷
💡 解决方案：提出了更好的架构设计
🔧 批量重构：同时修改了15个相关文件
✅ 质量保证：重构后的代码更易维护

如果用传统方式：可能需要几天时间调研架构，写重构方案 用Claude Code：1小时搞定，顺便学到了更好的设计模式

💊 针对性修复：提供精准解决方案
✅ 效果验证：自动测试修复结果
⏰ 调试时间：大幅减少

👶 新手友好：学习神器

对新手开发者的帮助：

💬 自然语言交互：不懂技术术语也能沟通
📚 实时编程指导：边写边学
🏗️ 架构理解：快速掌握复杂项目结构

🔮 未来展望：更强的AI编程时代

🛠️ 技术迭代方向

Claude Code的未来升级计划：

🔧 工具执行更稳定：每次操作都更可靠
⏳ 长任务支持增强：处理更复杂的开发任务
🎨 界面体验优化：终端渲染更美观
🧠 自我认知提升：AI更了解自己的能力边界

💡 黄金组合实用指南

🔄 推荐工作流程

Claude Code + Cursor 协同开发建议：

利用Claude Code进行项目初始化、架构梳理、批量重构、文档生成等自动化和全局性任务。
在Cursor中专注于细节编码、调试、界面优化和代码审查，充分发挥IDE的可视化和补全优势。
两者结合，既能高效推进复杂任务，又能保证日常开发流畅舒适。

📝 Claude Code 常用命令速查表

命令	用途
/bug	报告错误（将对话发送给Anthropic）
/clear	清除对话历史
/compact [指令]	压缩对话，可选焦点指令
/config	查看/修改配置
/cost	显示令牌使用统计
/doctor	检查Claude Code安装健康状态
/help	获取使用帮助
/init	使用CLAUDE.md指南初始化项目
/login	切换Anthropic账户
/logout	从Anthropic账户登出
/mcp	管理MCP服务器连接和OAuth身份验证
/memory	编辑CLAUDE.md内存文件
/model	选择或更改AI模型
/permissions	查看或更新权限
/pr_comments	查看拉取请求评论
/review	请求代码审查
/status	查看账户和系统状态
/terminal-setup	安装Shift+Enter换行键绑定（iTerm2/VSCode）
/vim	进入vim模式

🎯 场景化使用策略

🏗️ 新项目启动（Claude Code主导）：

架构设计和技术选型
项目结构搭建
核心模块实现
文档和规范生成

⚡ 功能迭代（Cursor主导）：

具体功能编码实现
UI/UX细节调整
单元测试编写
代码风格统一

🧩 问题解决（灵活切换）：

复杂Bug分析 → Claude Code
简单修复和调试 → Cursor
性能优化方案 → Claude Code
代码格式化 → Cursor

🔧 任务分解：
- 复杂任务拆分成小任务
- 每个任务专注单一目标

🧹 上下文管理：

/clear  # 重置上下文，保持清爽

👥 团队使用建议

推广策略：

🎯 从小团队试点开始
📊 建立使用规范和模式
💡 总结最佳实践
🚀 逐步推广到全团队

🧩 进阶用法与实用技巧

在Cursor中使用Claude Code的终端功能
你可以直接在Cursor的终端面板中运行Claude Code的命令行工具或脚本，实现代码生成、分析、调试等自动化任务，充分利用TUI的强大能力。
利用Cursor的可视化界面
Cursor提供了强大的代码编辑、项目管理和调试等可视化功能，可以帮助你更高效地组织和管理项目结构，辅助你在Cursor中配合Claude Code进行开发。
结合两者的优势
Cursor的可视化界面让代码管理和导航更加直观，而Claude Code的深度推理和多文件处理能力则为你带来更智能的代码生成与分析体验。两者结合，能极大提升开发效率。
Claude Code已支持Cursor插件
你可以在Cursor中安装Claude Code插件，直接在IDE内查看Claude Code生成的代码diff，对比和审查变更更加直观高效。

🎉 写在最后：AI编程的黄金时代已经到来

🚀 不要再纠结选择了

测试了两个月的各种AI编程工具后，我最大的感悟是：

停止”选择恐惧症”，开始”组合创新”！

Claude Code + Cursor这个组合让我重新定义了什么叫”高效编程”：

⏰ 开发速度：从”天”级别优化到”小时”级别
🧠 认知负担：从”记住所有细节”到”专注核心逻辑”
😊 工作体验：从”重复劳动”到”创造性工作”
📈 代码质量：从”能跑就行”到”优雅且健壮”

💡 给还在观望的同学三个建议

🎯 不要追求完美的工具，追求最优的组合
- 没有任何一个工具能解决所有问题
- 但恰当的工具组合能让你事半功倍
⚡ 从具体场景开始，而不是从技术特性开始
- 先明确你想解决什么问题
- 再选择最适合的工具来解决
🔄 保持开放心态，持续学习新工具
- AI编程领域变化很快
- 今天的最佳实践，明天可能就过时了

🌟 AI编程的未来图景

我相信，未来几年我们会看到：

🤖 AI助手越来越智能：从代码补全到自主开发
🔗 工具生态越来越丰富：更多专业化的AI编程工具
🤝 人机协作越来越自然：从”人指挥机器”到”人机对等协作”

而现在，就是最好的起点。

不管你是刚入门的新手，还是经验丰富的老手，Claude Code + Cursor这个组合都值得你亲自体验一下。

说不定，这就是改变你编程生涯的那个转折点呢？ 😉

如果这篇文章对你有帮助，欢迎分享给更多的开发者朋友！
让我们一起拥抱AI编程的黄金时代！ 🚀✨

04 | LangChain 快速入门

2025-02-05T00:00:00+08:00

1. 引言

在之前的分享中，我们讨论了如何利用 OpenAI Python SDK 开发定制的 GPT 模型、优化 Prompt 工程、实现基于嵌入的推荐系统。这些内容为我们搭建了一个强大的基础，但在实际应用中，复杂的业务需求往往需要多个任务的协同处理，如何高效地整合这些功能成为了一大挑战。

LangChain 正是为了解决这一问题而生。它作为一个专为大语言模型服务的开发框架，提供了灵活的模块化架构，能够将不同任务和工具有机地串联起来，使我们能够轻松构建复杂的任务链、扩展模型的能力，并与外部系统无缝集成。通过 LangChain，我们不仅可以进一步优化现有的 GPT 应用，还可以实现更复杂的多步骤自动化操作，提升智能化应用的开发效率。

接下来，我们将快速介绍 LangChain 的核心概念和架构。

2. LangChain 的核心概念

基于最新的 LangChain 架构图，LangChain 通过模块化的设计，涵盖了从任务链管理到部署的全方位功能。其核心概念不仅包括任务链的构建与管理，还涉及多种工具集成和上下文处理。以下是几个关键部分的概述：

2.1 LangChain 与 LangGraph（架构层）

LangChain 和 LangGraph 位于架构层，构成了整个系统的基础。LangChain 是整个框架的核心，它提供了构建和管理任务链的工具，并支持与大语言模型的交互。LangGraph 则负责处理更复杂的数据结构和依赖管理，适合需要跟踪和管理复杂任务流的应用场景。

LangChain：用于构建链式任务，允许开发者将多步骤任务分解为多个独立的组件。这种链式架构可以处理输入的多次流转，生成更为复杂的输出。
LangGraph：则是 LangChain 的扩展，用于处理复杂的任务图（DAG）。当任务存在分支或者并行任务时，LangGraph 可以通过图结构追踪依赖关系，确保任务流按照预期顺序执行。

2.2 Integrations（组件层）

在组件层，LangChain 提供了Integrations模块，用于将外部系统、API 和工具与任务链集成。这一层次允许开发者将外部工具（例如数据库、API 或计算工具）无缝集成到任务链中，进一步增强大语言模型的功能。

工具集成：通过 Agents 实现与外部工具的交互，支持诸如 Python 执行、Web 搜索等操作。
API 集成：允许模型在生成内容的同时调用外部 API 完成特定的操作，如数据查询、计算任务等。

2.3 LangGraph Cloud（部署层）

LangGraph Cloud 位于架构的顶层，负责商业部署。这是 LangChain 的云端服务，提供了企业级的任务链部署和管理平台。通过云部署，用户可以将模型与任务链快速应用于实际业务场景，享受更高的可靠性与可扩展性。

2.4 LangSmith（辅助工具）

LangSmith 作为开发者辅助工具，包含了一系列用于调试、优化和监控的工具。它为 Prompt 管理、注释、测试和监控提供了一站式的解决方案，帮助开发者更高效地设计和调优任务链。

Debugging：调试任务链，检查错误或逻辑问题。
Playground：提供实验环境，允许开发者在真实环境前模拟不同的任务链。
Prompt Management：用于管理和优化不同任务中的 Prompt 模板。
Testing & Monitoring：确保部署后任务链的可靠性和性能。

这一架构使得 LangChain 不仅适用于简单的任务链处理，还能够通过 LangGraph 处理复杂的并行任务和依赖管理，并且提供了企业级的云端解决方案以及开发者友好的工具支持。

3. LangChain 的主要组件

我们打开网页：https://python.langchain.com/docs/integrations/platforms/，可以看到左侧的目录：

我们可以看到，LangChain 提供了多个关键组件，帮助开发者构建灵活的语言模型应用。以下是一些主要组件的概述：

3.1 提供商（Providers）

LangChain 支持多个主流提供商，包括：

Anthropic
AWS
Google
Hugging Face
Microsoft
OpenAI（因为 G2M 的大模型服务模拟了 OpenAI 的服务，所以也是可以使用 LangChain 的）
……

3.2 组件（Components）

聊天模型（Chat Models）：支持多种聊天交互的模型。
大语言模型（LLMs）：连接到各种语言模型的接口。
嵌入模型（Embedding Models）：用于处理文本数据的嵌入表示。
文档加载器（Document Loaders）：用于从不同格式加载文档的工具。
向量存储（Vector Stores）：用于存储和检索文本嵌入的数据库。
检索器（Retrievers）：从文档或数据库中提取相关信息的工具（RAG）。
工具/工具包（Tools/Toolkits）：提供额外功能的模块。

3.3 其他组件（Other）

文档转换器（Document Transformers）：用于处理和转换文档的工具。
模型缓存（Model Caches）：用于提高模型响应速度的缓存机制。
图（Graphs）：用于表示和处理复杂关系的数据结构。
消息历史（Message Histories）：存储会话历史以便后续使用。
回调（Callbacks）：用于实现事件驱动编程的回调机制。
聊天加载器（Chat Loaders）：用于从外部源加载聊天数据。
适配器（Adapters）：用于在不同组件之间进行适配的工具。

这些组件的组合使得咱们开发者能够灵活地构建和扩展应用，满足各种业务需求。接下来，我们将探讨如何利用这些组件在实际项目中实现业务逻辑。

4. LangChain 实践示例

首先我们还是要安装一下我们后面要使用到的依赖：

%pip install openai  # 安装 OpenAI 库，用于与 OpenAI API 交互
%pip install langchain  # 安装 LangChain 库，用于构建和管理语言模型链
%pip install langchain-openai  # 安装 LangChain-OpenAI 库，用于将 LangChain 与 OpenAI 集成

4.1 使用 LangChain 进行简单问答

在本示例中，我们将使用 LangChain 的 ChatOpenAI 类进行简单问答。通过定义用户消息并调用 OpenAI API，我们可以对比一下前面的第一节课，代码量要少很多。

from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model="gpt-4o")

messages = [
    {"role": "user", "content": "简单介绍一下人工智能"},
]

response = llm.invoke(messages)
print(response)
print("------------------")
print(response.content)

返回结果：

content='人工智能（AI）是通过计算机系统模拟人类智能的学科，涵盖机器学习、深度学习、自然语言处理、计算机视觉和机器人技术等领域。AI能够执行感知、学习、推理、决策等任务，广泛应用于医疗、金融、交通、教育等行业。尽管AI带来了效率提升和创新，但也引发了隐私、安全、就业等伦理和社会问题。总体而言，AI正在深刻改变我们的生活和工作方式。' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 267, 'prompt_tokens': 16, 'total_tokens': 283}, 'model_name': 'gpt-4o', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None} id='run-cbc5112d-aed6-449b-82ed-4cdfb47d97e4-0' usage_metadata={'input_tokens': 16, 'output_tokens': 267, 'total_tokens': 283, 'input_token_details': {}, 'output_token_details': {}}
------------------
人工智能（AI）是通过计算机系统模拟人类智能的学科，涵盖机器学习、深度学习、自然语言处理、计算机视觉和机器人技术等领域。AI能够执行感知、学习、推理、决策等任务，广泛应用于医疗、金融、交通、教育等行业。尽管AI带来了效率提升和创新，但也引发了隐私、安全、就业等伦理和社会问题。总体而言，AI正在深刻改变我们的生活和工作方式。

在 LangChain 中，invoke 方法用于执行一个链（如 LLMChain 或其他链）的处理。它接收输入参数并将其传递给链中的各个组件（如提示模板和语言模型），最后返回处理结果。

具体而言，invoke 方法通常执行以下步骤：

接收输入：它接收一个字典或其他结构化数据作为输入，例如用户输入的文本。
调用链中的模型：将输入数据格式化为模型可以理解的格式，并传递给指定的语言模型（如 OpenAI 的 LLM）。
返回结果：获取模型的输出，并可能进行解析（如将输出文本提取为字符串）。

除了 invoke 方法，还有其他一些常用的方法和操作来处理数据和与模型交互，包括：

call：与 invoke 类似，通常用于调用链中的模型，并处理输入和输出。
run：用于运行链，通常接受更复杂的输入，并返回结果。
stream：可以用来处理实时输出，适用于长文本生成任务。
predict：专门用于生成预测结果，通常用于分类或回归任务。
ainvoke：这是一个异步版本的 invoke 方法，适用于需要非阻塞调用的场景。它允许你在等待结果的同时执行其他操作。
astream：用于处理实时或流式输出的场景。它可以逐步获取模型生成的输出，适合需要实时反馈的应用程序，如聊天机器人或在线生成内容。
arun：这是异步版本的 run 方法，适合需要非阻塞执行的场景。它允许你在处理大规模输入或等待模型响应时继续进行其他操作。
acall：这是异步版本的 call 方法，通常用于在异步上下文中调用链。它使得处理请求时能够更灵活地管理异步任务。

4.2 使用 LLMChain 进行优化

在 LangChain 中，Chain 是一个核心概念，表示一系列相互连接的组件或操作。这些组件可以包括模型、提示模板、输出解析器等，形成一个处理流程。Chain 允许将多个步骤串联在一起，以实现复杂的任务，如自然语言生成、数据处理或逻辑推理。用户可以自定义和组合这些链，以满足特定需求，从而构建更为灵活和强大的应用程序。

LLMChain 是 LangChain 中的一个基础组件，专门用于将大语言模型（LLM）与提示模板结合起来。它的主要功能是创建一个处理链，允许用户定义输入、处理逻辑和输出格式。LLMChain 将用户的输入通过提示模板传递给 LLM，生成的响应可以进一步解析或处理。这种结构化的链式设计使得构建复杂的自然语言处理应用变得更加简单和高效。

还有一些其他的 Chain，例如：

SequentialChain：顺序执行多个链，将前一个链的输出传递给下一个链。
ConversationalChain：管理对话状态和上下文，适合构建对话系统。
MapChain：并行处理多个输入，通过映射生成输出。
ReduceChain：将多个输出合并为单个结果。
RouterChain：根据输入条件选择不同的子链，灵活处理多条路径。

下面是一个使用 LLMChain 的例子：

from langchain_openai import ChatOpenAI  # 导入 ChatOpenAI 类，用于与 OpenAI API 交互
from langchain_core.prompts import ChatPromptTemplate  # 导入 ChatPromptTemplate 类，用于创建聊天提示模板
from langchain.chains.llm import LLMChain  # 导入 LLMChain 类，用于创建语言模型链
from langchain_core.output_parsers import StrOutputParser  # 导入 StrOutputParser 类，用于解析输出

llm = ChatOpenAI(model="gpt-4o")

# 创建聊天提示模板，定义消息格式
template = ChatPromptTemplate.from_messages(
    [
        ("human", "{text}")  # 定义人类消息的格式
    ]
)

# 创建 LLMChain 实例，将提示模板和语言模型连接起来
chain = LLMChain(llm=llm, prompt=template)

# 调用链，传入文本进行处理
chain.invoke({"text": "简单介绍一下人工智能"})

输出：

{'text': '人工智能（AI）是通过计算机系统模拟人类智能的学科，涵盖机器学习、深度学习、自然语言处理、计算机视觉和机器人技术等领域。AI能够执行感知、学习、推理、决策等任务，广泛应用于医疗、金融、交通、教育等行业。尽管AI带来了效率提升和创新，但也引发了隐私、安全、就业等伦理和社会问题。总体而言，AI正在深刻改变我们的生活和工作方式。'}

4.3 LCEL 表达式

LCEL（LangChain Expression Language）是一种表达方式，用于在 LangChain 中构建和组合链。通过使用 LCEL，用户可以以简洁的方式定义多个组件的连接，包括模型、提示、解析器等。LCEL 允许用户以管道形式组织这些组件，使得处理流程更加直观和灵活。这种方法有助于简化链的构建，并提高代码的可读性和维护性。

这里我们使用 LCEL 对 Chain 的定义进行优化：

from langchain_openai import ChatOpenAI  # 导入 ChatOpenAI 类，用于与 OpenAI API 交互
from langchain_core.prompts import ChatPromptTemplate  # 导入 ChatPromptTemplate 类，用于创建聊天提示模板
from langchain_core.output_parsers import StrOutputParser  # 导入 StrOutputParser 类，用于解析输出

llm = ChatOpenAI(model="gpt-4o")

# 创建聊天提示模板，定义消息格式
template = ChatPromptTemplate.from_messages(
    [
        ("human", "{text}")  # 定义人类消息的格式
    ]
)

# 创建链，将提示模板、模型和输出解析器连接起来
chain = template | llm | StrOutputParser()

# 调用链，传入文本进行处理
chain.invoke({"text": "简单介绍一下人工智能"})

输出：

'人工智能（AI）是通过计算机系统模拟人类智能的学科，涵盖机器学习、深度学习、自然语言处理、计算机视觉和机器人技术等领域。AI能够执行感知、学习、推理、决策等任务，广泛应用于医疗、金融、交通、教育等行业。尽管AI带来了效率提升和创新，但也引发了隐私、安全、就业等伦理和社会问题。总体而言，AI正在深刻改变我们的生活和工作方式。'

在 LangChain 中，OutputParser 是用于解析模型输出的组件。它负责将生成的结果转换为适合后续处理或使用的格式。不同的 OutputParser 可以根据需要进行定制，适用于特定类型的输出解析，如字符串解析、JSON 解析等。通过使用 OutputParser，用户可以更灵活地处理和利用模型的输出，提高整体应用的可用性和准确性。

主要的 OutputParser 及其功能包括：

StrOutputParser：将模型输出解析为字符串，适用于简单文本输出。
JsonOutputParser：将输出解析为 JSON 格式，适合需要结构化数据的场景。
CompletionsOutputParser：专门用于解析语言模型的完成结果，提供更丰富的输出处理功能。
RegexOutputParser：使用正则表达式解析输出，适合从文本中提取特定信息。
PydanticOutputParser：将输出解析为 Pydantic 模型，适合需要数据验证和结构化的应用。
……

更多的大家可以查看：https://python.langchain.com/docs/concepts/#output-parsers

总结

在我们的文章中，虽然涵盖了 LangChain 的基础知识和核心组件，但仍有一些重要主题未涉及，包括：

Agent：如何使用智能代理与外部环境互动。
Memory：链的状态管理和记忆机制。
Tools：集成和使用外部工具的能力。
扩展性：如何自定义链和组件以适应特定需求。
性能优化：提高链性能和响应速度的方法。
等等

这些我们将在后面的章节结合实例进行说明。我们讨论了 Chain 的概念，列举了如 LLMChain、SequentialChain 和 RouterChain 等多种链的类型。此外，介绍了 OutputParser 的主要类型及其功能，最后强调了 LCEL 的重要性。这些内容为使用 LangChain 进行大语言模型应用开发提供了全面的基础，旨在帮助读者更好地理解和应用该框架。

03 | 基于 Embedding 的智能汽车推荐系统

2024-12-26T00:00:00+08:00

今天我们将使用大语言模型与 Embedding（向量嵌入）技术，构建智能购车推荐系统。首先，让我们了解一下 Embedding 的基本概念。

1. Embedding 基础

1.1 Embedding 概述

Embedding 是一种将复杂的数据（如文字、图像、声音等）转化为计算机可处理的向量表示的技术。它在自然语言处理、图像识别、语音分析等任务中有广泛应用。

文字处理：Embedding 将单词映射到向量空间中，向量的距离反映了单词之间的语义相似性。例如，“苹果”和“橘子”的向量可能非常接近，表示它们在语义上是相似的。
图像处理：Embedding 会提取图像中的关键特征（如颜色、形状、风格等），并将这些特征映射为向量。基于这些向量，计算机可以进行图像分类、相似性匹配等操作。
语音处理：Embedding 分析声音的音调、节奏、音色等特征，将其转化为向量，使计算机能有效地进行语音识别和分析。

Embedding 的优势在于：

简化复杂信息：Embedding 将高维信息转化为低维向量，便于计算机高效处理。
增强语义理解：通过向量的距离，计算机可以更好地理解语义相似的内容。
分块处理长文本：Embedding 可以帮助处理长文本，并生成连贯的输出。

这些向量是通过大规模数据训练得到的，捕捉了传统方法难以理解的深层语义关系。

1.2 Embedding 与传统分词的区别

1.2.1 表示方式

传统分词：根据词汇和语法规则将文本拆分为独立的词，词语以离散符号形式表示，彼此之间没有数值关系。
Embedding：将词语映射到向量空间，每个词语对应一个多维向量，向量维度根据任务需求设定，常见的有 100 维或 300 维。

1.2.2 语义信息的体现

传统分词：分词只是简单的文本拆分，无法体现词语之间的语义关系。例如，“苹果”和“橘子”虽然都是水果，但分词后没有语义上的联系。
Embedding：通过向量的距离体现词语的语义相似性。语义相近的词汇向量距离更近，例如“高兴”和“快乐”的向量比“汽车”的向量距离更近。

1.2.3 对下游任务的影响

传统分词：适用于简单的文本匹配和规则分析，但难以捕捉复杂语义关系，在深度学习任务中的效果有限。
Embedding：向量蕴含丰富的语义信息，适用于文本分类、情感分析、机器翻译等任务，有助于提升模型的理解力和任务性能。

2. 基于大语言模型的推荐系统

在汽车推荐领域，大语言模型（如 GPT）和向量嵌入（Embedding）技术正变得越来越重要，尤其是在车辆的推荐系统中，它们提供了全新的技术思路。

2.1 大语言模型的角色

大语言模型（如 GPT）具备强大的自然语言理解和生成能力。通过在海量文本数据上进行预训练，GPT 在处理车辆相关的文本信息时展现出独特的优势。例如，在解析产品描述时，它能深刻理解文本的语义，准确提取出诸如“城市 SUV”、“硬派越野车”或“新能源车型”等关键信息。基于这些信息，系统可以识别车型特点并分类，为推荐系统奠定数据基础。

2.2 向量嵌入技术的作用

向量嵌入技术（如 Word2Vec、Sentence-BERT）可以将车辆的文本描述转化为向量。在这个向量空间中，语义相似的描述将彼此靠近。利用这一特性，通过计算向量之间的相似度（如使用余弦相似度），我们可以快速找到特征相似的车型。

例如，当用户需要一款空间大且舒适的 SUV 时，系统能够基于描述嵌入，从某系列中推荐符合这些条件的车型。这样，推荐变得更加个性化和精准。

2.3 大语言模型与向量嵌入结合的推荐系统

将大语言模型和向量嵌入技术结合起来，便可以构建一个能够“理解”车辆信息并基于语义相似性进行推荐的智能系统。接下来，让我们逐步拆解这个推荐系统的各个模块。

2.3.1 数据预处理

首先，我们需要加载车辆的原始数据，包括车辆的型号、品牌、配置等关键信息。预处理步骤确保数据清洗和结构化，为后续处理提供支持。

2.3.2 关键词生成

通过大语言模型为每辆车生成描述其特点的关键词，这些关键词涵盖车型特征、适用场景和目标用户。系统根据这些关键词生成文本描述，帮助进一步处理。

2.3.3 嵌入生成

将车辆的型号、品牌、关键词等信息拼接，利用先进的文本嵌入模型（如 bge-m3）生成其对应的向量表示。这些向量代表车辆在向量空间中的位置，语义相近的车辆会相互靠近。

2.3.4 相似度搜索

用户输入购车需求后，系统将其输入转换为向量表示。通过计算用户查询向量与数据库中车辆向量的相似度（如余弦相似度），系统可以找到与用户需求最匹配的车型。

2.3.5 汽车推荐

基于相似度搜索的结果，系统会将最符合条件的车型按相似度排序，推荐给用户。这样，用户不仅可以得到符合需求的车辆推荐，还能根据个人偏好选择最佳方案。

余弦相似度，又称为余弦相似性，是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值，绘制到向量空间中，如最常见的二维空间。——百度百科

2.1数据预处理

为了构建一个智能的车辆推荐系统，首先需要一个基础数据集。以下是我们准备的一个简单车辆信息数据集，包含车辆型号、品牌、售价和车辆描述等字段。这些字段将被用于后续的特征提取和向量化操作。

车辆型号	车辆品牌	车辆售价（万元）	车辆描述
理想L9	理想	45.98	全尺寸SUV，采用增程式电动技术，提供宽敞的车内空间，搭载智能座舱，拥有舒适的驾乘体验，配备强大的自动驾驶辅助系统，适合家庭出行。
理想L8	理想	35.98	中大型SUV，增程式电动驱动，具备大尺寸显示屏，舒适的座椅和智能交互系统，为用户带来舒适的驾乘体验，兼顾城市与户外出行。
理想ONE	理想	34.98	中大型六座SUV，采用增程式电动，具有舒适的车内空间和丰富的科技配置，是家庭用户的理想之选，提供多种驾驶模式。

这些字段提供了丰富的特征信息，特别是车辆描述这一自然语言数据，为我们使用大语言模型和嵌入技术提供了必要的语义信息基础。我们将利用这些描述生成向量嵌入，后续步骤中，系统将通过计算车辆之间的语义相似度，实现精准推荐。

另外，通过大语言模型，我们可以简化数据集生成过程。使用如下 Prompt：

“请帮我生成一份理想汽车各个产品型号的数据集，要求包含车辆型号，车辆品牌，车辆售价，车辆描述等信息。”

系统即可生成类似的数据集，帮助快速启动推荐系统的开发。

首先，确保安装以下依赖。

%pip install pandas
%pip install numpy
%pip install openai
%pip install scikit-learn

接下来，导入我们需要的库。pandas 用于数据处理，numpy 用于数值计算，cosine_similarity 用于计算向量之间的相似度，dotenv 用于加载环境变量。

import pandas as pd
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np
from openai import OpenAI
from dotenv import load_dotenv  # 导入 dotenv 库，用于加载环境变量
import os  # 导入 os 库，用于访问操作系统功能

load_dotenv()

这里，我们初始化 OpenAI 客户端并加载车辆推荐系统的数据集。我们选取车辆的型号、品牌、售价和描述等字段，创建一个新的 DataFrame 以便后续处理。

# 初始化OpenAI客户端
client = OpenAI(
    base_url=base_url,
)

# 加载车辆数据集
dataset_path = "data/03_gptv_multl_mod/cars/cars.csv"
df = pd.read_csv(dataset_path)

# 选择需要的列
selected_columns = ['车辆型号', '车辆品牌', '车辆售价（万元）','车辆描述']
df = df[selected_columns].copy()

2.2 生成关键词并保存新数据集

在这一步，我们设计了一个详细的系统提示词，指导大模型为每辆车生成关键词。让我们仔细看看这个提示词的内容。

你是一个专门为汽车标记相关关键词的代理。这些关键词可用于在汽车展厅或汽车销售平台搜索这些汽车。
你将获得一辆汽车的车辆描述，你的目标是为这辆汽车提取关键词。
关键词应简洁明了，全部小写。
关键词可以描述以下内容:
汽车类型，如 "轿车"、"suv"、"mpv" 等
汽车主题，如 "越野性能"、"新能源"、"豪华内饰" 等
目标用户，如 "家庭用户"、"年轻群体"、"商务人士" 等
价格等级，如 "经济型"、"中档"、"高档" 等
只有在车辆信息中明确提及时，才提取相关关键词。
以字符串数组的格式返回关键词，例如:
['suv', '新能源', '家庭用户', '中档']

这个提示词清晰地定义了模型的角色（为汽车标记关键词的代理）和目标（根据车辆描述提取关键词）。它还详细说明了关键词应该包含的信息类型，如汽车类型、主题、目标用户、价格等级，并给出了具体的例子。此外，提示词强调只有在车辆信息中明确提及时才提取相关关键词，以确保关键词的准确性。最后，它指定了关键词的格式，即以字符串数组的形式返回。

这样详尽、具体的提示词设计有助于指导模型生成高质量、信息丰富的关键词，为后续的汽车推荐奠定良好的基础。

接下来，生成关键词并保存数据集。

# 定义生成关键词的系统提示
keywords_system_prompt = '''
你是一个专门为汽车标记相关关键词的代理。这些关键词可用于在汽车展厅或汽车销售平台搜索这些汽车。
你将获得一辆汽车的车辆描述，你的目标是为这辆汽车提取关键词。
关键词应简洁明了，全部小写。
关键词可以描述以下内容:
- 汽车类型，如 "轿车"、"suv"、"皮卡" 等
- 汽车主题，如 "越野性能"、"新能源"、"豪华内饰" 等
- 目标用户，如 "家庭用户"、"年轻群体"、"商务人士" 等
- 价格等级，如 "经济型"、"中档"、"高档" 等
只有在车辆信息中明确提及时，才提取相关关键词。
以字符串数组的格式返回关键词，例如:
['suv', '新能源', '家庭用户', '中档']
'''

# 定义生成关键词的函数
def generate_keywords(description):
    response = client.chat.completions.create(
    model="gpt-4o",
    temperature=0.2,
    messages=[
        {
            "role": "system",
            "content": keywords_system_prompt
        },
        {
            "role": "user",
            "content": f"车辆描述: {description}"
        }
    ],
    max_tokens=100,
    )
    return response.choices[0].message.content

# 为每辆车生成关键词
df['关键词'] = df['车辆描述'].apply(generate_keywords)

# 保存带有关键词的数据集
data_path = "data/03/cars/TextEmbedding/cars_tagged_and_captioned.csv"
df.to_csv(data_path, index=False)

生成的 csv 内容如下：

车辆型号,车辆品牌,车辆售价（万元）,车辆描述,关键词
理想L9,理想,45.98,全尺寸SUV，采用增程式电动技术，提供宽敞的车内空间，搭载智能座舱，拥有舒适的驾乘体验，配备强大的自动驾驶辅助系统，适合家庭出行。,"['suv', '增程式电动', '宽敞空间', '智能座舱', '家庭用户', '自动驾驶辅助']"
理想L8,理想,35.98,中大型SUV，增程式电动驱动，具备大尺寸显示屏，舒适的座椅和智能交互系统，为用户带来舒适的驾乘体验，兼顾城市与户外出行。,"['suv', '增程式电动', '大尺寸显示屏', '舒适座椅', '智能交互系统', '家庭用户']"
理想ONE,理想,34.98,中大型六座SUV，采用增程式电动，具有舒适的车内空间和丰富的科技配置，是家庭用户的理想之选，提供多种驾驶模式。,"['suv', '增程式电动', '大六座', '舒适空间', '科技配置', '家庭用户']"

2.3 生成嵌入向量并保存

接下来，我们定义获取嵌入向量的函数 get_embedding，它使用 bge-m3 模型为给定的文本生成嵌入向量。我们将每辆车的车辆型号、车辆品牌和关键词拼接成一个字符串，然后调用此函数生成其嵌入向量。

# 定义获取嵌入向量的函数
def get_embedding(value, model="default/bge-m3"):
    embeddings = client.embeddings.create(
      model=model,
      input=value,
      encoding_format="float"
    )  
    return embeddings.data[0].embedding

# 嵌入车辆型号、车辆品牌和关键词
df['embedding'] = df.apply(lambda x: get_embedding(f"{x['车辆型号']} {x['车辆品牌']} {x['关键词']}"), axis=1)

# 将嵌入向量转换为字符串以便保存到 CSV 文件
df['embedding_str'] = df['embedding'].apply(lambda x: ','.join(map(str, x)))

# 保存带有关键词和嵌入向量的数据集
data_path = "data/03/cars/TextEmbedding//cars_with_keywords_and_embeddings.csv"
df.to_csv(data_path, index=False)

这里，我们对 DataFrame 的每一行应用 get_embedding 函数，为每辆车生成嵌入向量，将嵌入向量转换为字符串以便保存，并将带有关键词和嵌入向量的数据集保存到 CSV 文件中。

车辆型号,车辆品牌,车辆售价（万元）,车辆描述,关键词,embedding,embedding_str
理想L9,理想,45.98,全尺寸SUV，采用增程式电动技术，提供宽敞的车内空间，搭载智能座舱，拥有舒适的驾乘体验，配备强大的自动驾驶辅助系统，适合家庭出行。,"['suv', '增程式电动', '宽敞空间', '智能座舱', '家庭用户', '自动驾驶辅助']","[-0.04605172201991081, -0.04282350838184357, -0.05152125284075737, -0.015073901042342186, -0.031202122569084167, 0.009863092564046383, 0.03835892304778099, -0.0065855346620082855, 0.002312426222488284, -0.023381615057587624, 0.011963952332735062, 0.013710983097553253, 0.010265165008604527, -0.027636829763650894, -0.0025148766580969095, -0.03026479296386242, 0.011163360439240932, -0.023443661630153656, 0.021101271733641624, -0.04796310514211655, -0.005220355000346899, 0.028663000091910362, 0.048656098544597626, -0.00686237495392561, -0.03423630818724632, -0.0194962527602911, 0.017649829387664795, 0.003501537488773465, 0.02035154402256012, 0.018558217212557793, 0.007230079732835293, -0.04511991888284683, 0.01267722062766552, -0.008269169367849827, -0.016543567180633545, -0.025857189670205116, -0.04044906795024872, -0.017910990864038467, -0.04063061252236366, 0.011746585369110107, -0.018979638814926147, 0.0004104207328055054, 0.00860813818871975, 0.015235782600939274, 0.020279744639992714, -0.027650849893689156, -0.0022506460081785917, -0.019605277106165886, -0.0041670650243759...

2.4 加载数据并进行汽车搜索

加载这个数据之后，就可以进行搜索并推荐相关汽车了。下面，我们从 CSV 文件中加载带有关键词和嵌入向量的数据集，并将嵌入向量从字符串转换回列表形式。

# 从 CSV 文件加载带有关键词和嵌入向量的数据集
df_search = pd.read_csv(data_path)
df_search['embedding'] = df_search['embedding_str'].apply(lambda x: list(map(float, x.split(','))))

# 定义根据输入文本搜索的函数
def search_from_input_text(query, n=2):
    embedded_value = get_embedding(query)
    df_search['similarity'] = df_search['embedding'].apply(lambda x: cosine_similarity(np.array(x).reshape(1,-1), np.array(embedded_value).reshape(1, -1)))
    most_similar = df_search.sort_values('similarity', ascending=False).iloc[:n]
    return most_similar

代码中定义了根据输入文本搜索相似汽车的函数 search_from_input_text。给定用户输入的查询文本，该函数首先使用 get_embedding 函数为查询文本生成嵌入向量。然后计算查询向量与数据集中每辆车嵌入向量之间的余弦相似度，将结果存储在 similarity 列中，按相似度降序排列，取前 n 辆车作为搜索结果返回。

为了测试推荐系统，我们输入一个查询文本“给我推荐一辆适合年轻群体的经济型 SUV”，然后调用 search_from_input_text 函数搜索最相似的汽车。

# 测试输入文本搜索
user_input = "给我推荐一辆适合年轻群体的经济型 SUV"
res = search_from_input_text(user_input)
print(f"搜索词: {user_input}\n")
for index, row in res.iterrows():
    print(f"{row['车辆型号']} ({row['车辆品牌']}) - 关键词: {row['关键词']}")

输出结果：

搜索词: 给我推荐一辆适合年轻群体的经济型 SUV

理想L9 (理想) - 关键词: ['suv', '增程式电动', '宽敞空间', '智能座舱', '家庭用户', '自动驾驶辅助']
理想L8 (理想) - 关键词: ['suv', '增程式电动', '大尺寸显示屏', '舒适座椅', '智能交互系统', '家庭用户']

5. 技术总结与应用展望

在本篇文章中，我们构建了一个基于大语言模型和向量嵌入的推荐系统，为汽车推荐提供了一个有效的解决方案。通过数据预处理、关键词生成、嵌入向量计算以及相似度搜索，我们创建了一个能够根据用户需求提供精准推荐的系统。以下是对技术实现的总结及其应用展望：

5.1 技术总结

数据预处理与关键词生成： 通过定义详细的系统提示词，我们指导大模型生成相关的汽车关键词。这些关键词准确描述了汽车的类型、主题、目标用户和价格等级，为后续的推荐提供了坚实的基础。

嵌入向量计算： 使用 OpenAI 的 Embedding 模型为汽车生成了高质量的嵌入向量。这些嵌入向量捕捉了汽车描述的语义特征，使得推荐系统能够基于文本内容进行高效的相似度计算。

相似度计算与搜索： 利用余弦相似度度量，我们实现了基于用户查询的相似度搜索。该方法能够有效地找到与用户需求最匹配的汽车，并进行个性化推荐。

5.2 技术应用领域

汽车销售与展示平台： 本推荐系统可以直接集成到汽车销售和展示平台中，帮助用户快速找到符合其需求的汽车，提高平台的用户体验和销售转化率。

智能助手与顾客支持： 在智能汽车助手或客户支持系统中应用此技术，能够根据用户的具体需求提供个性化的汽车推荐，提升用户满意度和服务质量。

市场分析与产品优化： 企业可以利用推荐系统分析用户偏好和市场需求，从而优化汽车产品设计和营销策略，增强市场竞争力。

数据驱动的决策支持： 通过集成推荐系统，企业可以基于用户数据做出更有针对性的决策，提高资源配置的效率和效果。

通过不断改进和应用这些技术，我们能够在汽车行业及相关领域中实现更高效、更智能的推荐服务，推动行业的智能化发展，并为用户提供更为精准和个性化的服务体验。

02 | 解锁高效周报生成：Prompt工程实战与大模型优化指南

2024-11-27T00:00:00+08:00

在当今数字化浪潮中，大模型技术正以前所未有的速度渗透进工作生活的诸多领域，重塑着我们处理事务的方式。于职场而言，撰写周报是一项周期性且至关重要的工作，它既是对过往一周工作的复盘梳理，也是为后续工作铺就规划路径的关键环节。然而，手工撰写周报往往耗费大量时间精力，还可能因表述疏漏、重点失焦等问题，影响信息传递效果。此时，借助大模型的强大能力，并运用精巧设计的Prompt工程，恰似为我们打开了一扇通往高效、精准周报生成的便捷之门。本文将以构建一个周报小助手为切入点，深入探究如何施展Prompt工程“魔法”，让大模型输出更契合我们心意、更具价值的周报内容，同时分享一系列优化大模型回答表现的实用策略与技巧。

周报小助手诞生记：基础搭建篇

（一）素材筹备：精心准备日报数据

要打造周报小助手，第一步便是为其准备充足且有序的“弹药”——日报数据。在我们专属的开发目录下，需精心构筑一个存放日报文件的“专区”，且统一规范为txt格式，其目录架构仿若一座层次分明的信息“楼阁”：

|-- 02_prompt_engineering_weekly_report_helper.ipynb
|-- daily
   |-- 1.txt
   |-- 2.txt
   |-- 3.txt
   |-- 4.txt
   `-- 5.txt

这些日报文件绝非空洞无物，而是承载着一周工作点滴的“时光宝盒”。每份日报里，详实记录了当日工作的成果收获、遭遇难题以及对明日工作的清晰规划，就像一部部微型工作“纪录片”。你既可以依据自身日常工作的实际轨迹，原汁原味地录入内容，将项目推进细节、会议研讨要点、技术攻克历程等逐一呈现；也可凭借自身工作积累与经验，快速填充起这些日报文件，为后续周报生成筑牢根基。

（二）数据整合：读取日报并“编织”内容纽带

有了日报素材，紧接着便是编写“魔法代码”，将分散的日报信息汇聚成连贯一体的“信息流”。在此，我们精心打造一个名为get_daily_content的专属方法，它宛如一位勤勉的“信息工匠”，专注于遍历日报目录下的每份文件，逐字逐句读取其中内容，并巧妙拼接整合，最终编织成一条完整的、以换行符相隔的文本“纽带”。以下便是这段充满“匠心”的代码片段：

import os  # 引入系统交互“神器”，赋予代码与操作系统对话之力，自如穿梭文件目录间

def get_daily_content() -> str:
    daily_dir = "./daily/"  # 精准锚定日报文件的“栖息之所”，为后续读取指明方向
    daily = []  # 初始化一个“收纳盒”，静候日报内容“入住”
    
    # 调遣os模块的listdir“侦察兵”，全面搜罗日报目录下的所有“文件居民”
    files = os.listdir(daily_dir)
    
    # 开启循环“传送带”，逐一输送文件进行读取操作
    for file in files:
        with open(daily_dir + file, "r") as f:  # 轻启文件“大门”，以只读模式恭迎内容“现身”
            daily.append(f.read())  # 将读取到的“宝藏内容”小心翼翼存入收纳盒
    
    return "\n".join(daily)  # 启用拼接“魔法”，让日报内容紧密相连，华丽变身字符串并凯旋而归

print(get_daily_content())  # 迫不及待“校验成果”，打印输出整合后的日报内容，确保万无一失

运行这段代码，屏幕上便会如“竹简展卷”般，依次呈现出一周内每日工作的详尽记录，恰似一幅徐徐展开的工作“长卷”，清晰勾勒出工作脉络，为周报生成备足“底料”。

（三）初次召唤：驱动大模型生成周报初稿

万事俱备，只欠东风。此刻，便是邀请大模型“出山”，施展周报生成“绝技”的高光时刻。借助OpenAI强大的API接口，我们在代码世界里搭建起一座与大模型“对话”的“桥梁”。先是引入必备的“沟通工具”——OpenAI库与环境变量加载库，再巧妙配置API访问路径等关键参数，继而精心雕琢一段特殊的“对话指令”（Prompt），将生成周报的殷切诉求与整合好的日报内容紧密融合，郑重传递给大模型。以下便是这段激动人心的代码“桥段”：

from openai import OpenAI  # 携OpenAI库“入场”，解锁与大模型深度交互的“密码”
from dotenv import load_dotenv  # 引入环境变量“管家”，确保API配置顺畅就位
import os  # 再次借力系统交互“得力助手”，稳稳把控环境变量获取与运用

load_dotenv()  # 唤醒“管家”，加载.env文件中隐匿的关键环境变量，铺就API连接“红毯”

base_url = os.getenv("OPENAI_API_BASE_URL")  # 精准抓取API的“专属地址”，定位“对话入口”

# 凭借获取到的关键信息，激活OpenAI客户端，唤醒沉睡的大模型“智慧力量”
client = OpenAI(
    base_url=base_url,
)

prompt = "请帮我生成周报\n" + get_daily_content()  # 匠心独运“拼凑”对话指令，周报诉求与日报详情“珠联璧合”
print(prompt)  # 审慎校验指令完整性，打印输出拼接后的内容，确保准确无误传达心意
print("生成中，请稍等...")  # 贴心送上“温馨提示”，告知大模型正忙碌于“头脑风暴”，即将呈上答卷

# 正式发起“对话请求”，激活大模型的周报生成“引擎”，这里选用OpenAI广为人知且性能卓越的gpt-3.5-turbo模型
chat_completion = client.chat.completions.create(
    model="gpt-3.5-turbo",  # 钦点备受赞誉的gpt-3.5-turbo模型“助手”，开启智慧协作之旅
    # temperature=0.5,  # 可按需调控的“创意旋钮”，微调生成文本的随机程度，此处暂作“休眠”
    # max_tokens=60,  # 限定输出“篇幅标尺”，约束生成文本长度，当前暂未启用
    # top_p=1,  # 掌控文本多样性的“调节阀”，暂处于“默认全开”状态
    messages=[{"role": "user", "content": prompt}]  # 庄重递上“对话函件”，内含精心炮制的指令与日报“干货”
)

print(chat_completion.choices[0].message.content)  # 满怀期待“接收馈赠”，打印输出大模型精心打磨的周报内容

眨眼间，大模型便依据指令与日报信息“挥毫泼墨”，一份周报初稿跃然眼前。它条理清晰地梳理本周工作事项，从项目攻坚、技术研讨到团队协作，再到对下周工作的初步擘画，虽初具雏形，但已然可见大模型强大的信息归纳与规划能力。

优化升级之路：让大模型回答更“出彩”

（一）遵循原则“定航向”：清晰指示与充足思考

审视这份初稿，若想雕琢得更加完美，恰似航海需遵循“罗盘指引”一般，要依从两大关键原则。其一，指令下达需如“工笔画作”般精细明晰，将我们对周报内容重点、风格、详略程度等期望，毫无保留、精准无误地传达给大模型，避免模糊歧义导致“答非所问”；其二，要像给予挚友充分时间构思佳作一样，赋予大模型足够的“时光沉淀”，让它在字里行间深入剖析日报内涵，挖掘价值“宝藏”，而非仓促“交卷”，确保输出饱含深度、逻辑缜密。

（二）CRISPE框架“筑基石”：多维度优化Prompt

在优化Prompt的“工具箱”里，CRISPE框架堪称一块“万能基石”。从能力与角色维度（CR）出发，为大模型披上“周报小助手”的“职业外衣”，明确自身辅助周报撰写的使命，同时界定使用者（如软件架构师等）身份，让它找准“服务对象”；洞察维度（I）下，将日报内容这一丰富背景“画卷”完整铺陈，为大模型理解工作情境、把握任务背景注入“底气”；陈述维度（S）中，直白干脆地抛出“按金字塔原理总结周报且凸显价值点”的核心诉求，令其目标清晰；个性维度（P）可按需定制，或严谨专业、或简洁明快，让周报风格“因人而异”；实验维度（E）则鼓励大模型“头脑风暴”，多备几份答案“预案”，供我们择优而用。依循此框架改造Prompt，代码如下：

prompt = f"""你的身份是一名专业周报小助手，专为软件架构师排忧解难。此刻，摆在面前的是我本周的日报详情：\n
{daily_contents}\n
请施展浑身解数，依循金字塔原理精雕细琢一份周报，务必将每项工作的价值亮点雕琢得熠熠生辉。
"""

经此优化，再看生成的周报，价值要点仿若被聚光灯照亮，跃然纸上，项目推进步骤更清晰，各环节意义一目了然，较初稿实现质的飞跃。

（三）Few - Shot“添羽翼”：示例引领促提升

为让大模型输出更契合心意，Few - Shot策略恰似为其添上一对“模仿羽翼”。精心甄选几份优质日报示例，附上理想中的周报总结“标准答案”，一同呈递给大模型，宛如师傅示范“标准招式”。代码架构如下展示，大模型“依葫芦画瓢”，参考示例风格、格式与逻辑，对我们的周报进行“临摹创作”，最终输出在形式、条理上与示例“神似”的周报，且重点突出、逻辑井然。

from openai import OpenAI  # 再次引入OpenAI库，重启与大模型的“智慧连线”
from dotenv import load_dotenv  # 唤醒环境变量“加载助手”，保障API配置顺畅无阻
import os  # 借助系统交互“伙伴”，稳固获取环境变量操作

load_dotenv()  # 激活“加载助手”，引入.env文件里的关键配置，铺就API畅通“轨道”

base_url = os.getenv("OPENAI_API_BASE_URL")  # 锁定API“对接坐标”，找准对话“端口”

# 唤醒OpenAI客户端，唤醒大模型“沉睡智慧”，筹备新一轮“创作征程”
client = OpenAI(
    base_url=base_url,
)

# 示例1：呈上日报“谜面”与周报“谜底”，为大模型“解谜”示范
example_1_input = """你的身份是一名周报小助手，我的身份是一名软件架构师，下面是我本周的日报：
- 完成了模块A的初步设计，并与团队进行了方案讨论。
- 配合开发人员解决了模块B的性能瓶颈问题。
- 组织了两次架构评审会议，确保了项目进度的顺利推进。
- 协助项目经理制定了下个月的开发计划。
请按照金字塔原理进行总结成一份周报，注意体现价值点。
"""
example_1_output = """本周主要完成了以下工作：
1. 完成模块A的初步设计，推动团队讨论以确定最终方案。
2. 解决模块B的性能瓶颈，优化系统性能。
3. 组织架构评审会议，确保项目进度顺利进行。
4. 协助项目经理制定开发计划，确保下个月目标明确。
整体来看，本周的工作有效提升了系统性能，并确保了项目的顺利推进。"""

# 示例2：再度展示日报“样本”与周报“标杆”，强化示范效果
example_2_input = """你的身份是一名周报小助手，我的身份是一名软件架构师，下面是我本周的日报：
- 完成了数据库的优化设计，提高了日前效率。
- 编写了新功能模块的技术文档，为后续开发提供参考。
- 协助测试团队进行压力测试，定位并修复了多个性能问题。
- 参加了公司技术分享会，分享了微服务架构的实践经验。
请按照金字塔原理进行总结成一份周报，注意体现价值点。
"""
example_2_output = """本周主要工作包括：
1. 完成数据库优化设计，大幅提升查询效率。
2. 编写新功能模块的技术文档，为后续开发奠定基础。
3. 协助测试团队进行压力测试，修复性能问题。
4. 在公司技术分享会，分享微服务架构的经验。
这些工作提升了系统性能，同时也为团队技术能力的提升做出了贡献。"""

# 融入当前真实日报内容，搭建完整Prompt“舞台”
daily_contents = get_daily_content()

prompt = f"""你作为周报小助手界的‘精英’，以下是范例‘秘籍’与对应总结‘宝典’，请潜心研习并据此生成全新周报总结：

范例1：
日报详情:
{example_1_input}

总结精华:
{example_1_output}

范例2：
日报详情:
{example_2_input}

总结精华:
{example_2_output}

此刻呈上我的本周日报：
{daily_contents}
请依循金字塔原理，萃取精华，铸就一份价值满溢的周报。
"""

print("生成中，请稍等...")  # 贴心送上“进度提示”，告知大模型“创作”开启

# 触发大模型“创作引擎”，静候优化后的周报“出炉”
chat_completion = client.chat.completions.create(
    model="gpt-3.5-turbo",  # 选定“智慧搭档”，携手开启创作之旅
    messages=[{"role": "user", "content": prompt}]  # 递上精心筹备的Prompt“脚本”，期待精彩“演出”
)

print(chat_completion.choices[0].message.content)  # 欣然揭晓“创作成果”，展示优化后的周报内容

如此这般，借助Few - Shot策略与CRISPE框架双重“加持”，大模型生成的周报愈发精良，成为我们工作复盘、规划的得力“参谋”。此外，像链式思考（COT）、结合自我一致性的COT+SC、基于思考树的TOT以及回顾修正的Step - Back等更多Prompt“奇招妙法”，大家可循着文末学习资料深入探索，持续挖掘大模型潜能，让其在周报乃至更多工作场景中大放异彩。

学习资料补给站

01 | 基于 OpenAI SDK 开发一个自己的 GPT

2024-11-26T00:00:00+08:00

在当今人工智能快速发展的时代，构建属于自己的聊天机器人已经变得越来越容易。本文将详细指导你如何使用 OpenAI SDK 和 Gradio 库，从零开始开发一个功能强大且交互友好的类 ChatGPT 应用。

前置条件

开始之前，请确保你已准备好：

OpenAI API KEY（可在 OpenAI 官网申请）
Python 开发环境（推荐使用 Python 3.8 或更高版本）
基本的 Python 编程知识

开发步骤

Step 1: 安装依赖库

首先，我们需要安装必要的依赖库。在命令行或终端中运行以下命令：

pip install openai
pip install gradio
pip install python-dotenv

Step 2: 使用 OpenAI SDK 进行文本生成

下面是一个简单的示例代码，展示了如何与 OpenAI API 交互：

from openai import OpenAI
from dotenv import load_dotenv
import os

load_dotenv()

# 初始化 OpenAI 客户端
client = OpenAI(
    api_key=os.getenv("OPENAI_API_KEY")
)

# 调用 OpenAI API 创建聊天完成
chat_completion = client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=[{"role": "user", "content": "Hello world"}]
)

print(chat_completion)

Step 3: 创建交互界面

接下来，我们将使用 Gradio 库创建一个简单的 Web 界面：

import gradio as gr
from openai import OpenAI
from dotenv import load_dotenv
import os

load_dotenv()

# 初始化 OpenAI 客户端
client = OpenAI(
    api_key=os.getenv("OPENAI_API_KEY")
)

def chatbot(input_text, history):
    # 调用 OpenAI API 创建聊天完成
    chat_completion = client.chat.completions.create(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": input_text}]
    )
    return chat_completion.choices[0].message.content

# 创建 Gradio 聊天界面
iface = gr.ChatInterface(chatbot)
iface.launch(server_name="0.0.0.0", server_port=7860)

Step 4: 添加记忆和流式输出

为了提升用户体验，我们可以为聊天机器人添加记忆功能和流式输出：

import gradio as gr
from openai import OpenAI
from dotenv import load_dotenv
import os

load_dotenv()

client = OpenAI(
    api_key=os.getenv("OPENAI_API_KEY")
)

def format_messages(history, input_text):
    # 格式化消息列表，保留最近的 10 条对话
    messages = []
    if len(history) > 10:
        history = history[-10:]
    for item in history:
        messages.append({"role": "user", "content": item[0]})
        messages.append({"role": "assistant", "content": item[1]})
    messages.append({"role": "user", "content": input_text})
    return messages

def get_response(input_text, history):
    messages = format_messages(history, input_text)
    chat_completion = client.chat.completions.create(
        model="gpt-3.5-turbo",
        messages=messages,
        stream=True  # 启用流式输出
    )
    return chat_completion

def chatbot(input_text, history):
    results = get_response(input_text, history)
    contents = ""
    for chunk in results:
        if chunk.choices[0].delta.content is not None:
            contents += chunk.choices[0].delta.content
            yield contents

iface = gr.ChatInterface(chatbot)
iface.launch(server_name="0.0.0.0", server_port=7860)

关键特性解析

1. OpenAI SDK 集成

通过 OpenAI 的 Python SDK，我们可以轻松地与大语言模型进行交互。关键步骤包括：

初始化 OpenAI 客户端
配置模型参数
发送聊天消息

2. Gradio 界面

Gradio 库提供了快速构建 Web 界面的能力：

简单的界面配置
实时交互
跨平台兼容性

3. 对话记忆

通过维护最近的对话历史，我们实现了上下文连续性：

保留最近 10 条对话
动态构建消息列表
提供连贯的对话体验

4. 流式输出

流式输出模拟了类似 ChatGPT 的打字机效果：

实时展示响应
提升用户交互体验
减少等待时间

结语

通过本教程，你已经学会了如何使用 OpenAI SDK 和 Gradio 构建一个功能丰富的聊天机器人。这个项目为你进一步探索人工智能应用开发提供了坚实的基础。

进一步探索

尝试不同的模型参数，如 temperature、max_tokens
添加更多高级功能，如角色定制
探索更复杂的对话场景和应用场景

除了以上提到的进阶方向，你还可以考虑集成语音识别和语音合成功能，使聊天机器人支持语音交互，或者添加多语言支持以扩展应用的使用场景。无论选择哪个方向，重要的是持续学习和实践，在开发过程中不断优化和改进你的应用。

探秘软件架构世界：多种架构类型剖析与选型指南

2024-11-25T00:00:00+08:00

探秘软件架构世界：多种架构类型剖析与选型指南

在软件开发的广袤天地里，软件架构宛如一座大厦的基石与框架，其设计的优劣直接关乎项目的成败、维护成本以及未来的可扩展性。今天，就让我们一同深入探究常见的软件架构类型，明晰它们各自的“性格特点”、适用场景，为我们在项目实践中的架构选型点亮明灯。

一、单体架构：简约起步的“小而美”之选

单体架构，恰似一个“全能选手”，将所有功能模块统统打包进一个独立的应用程序“包裹”里，部署、运行时不分你我，协同作战。对于初出茅庐的初创公司，或是功能诉求相对单纯、业务流程简洁的小型应用而言，它可谓是不二之佳选。开发环节，团队成员无需在复杂的模块间频繁切换“频道”，聚焦一处即可；测试时，也能顺藤摸瓜、一气呵成；部署更是“一键操作”，轻松便捷。然而，“成也萧何，败也萧何”，随着业务蒸蒸日上、功能持续迭代扩充，这个曾经的“小巧玲珑”逐渐变得臃肿不堪。牵一发而动全身的代码结构，让维护仿若深陷泥沼，每次修改都需小心翼翼；漫长的部署周期，更是在快速迭代的时代浪潮中显得格格不入，成为制约发展的“枷锁”。

二、分层架构：层次分明的“模块化堡垒”

分层架构宛如一座精心修筑的“高楼大厦”，依据职责分工，将应用程序巧妙划分为表示层、业务逻辑层、数据访问层等错落有致的层级。表示层宛如大厦的“外立面”，负责与用户交互，展示信息；业务逻辑层则是大厦的“中枢神经”，把控核心业务运转；数据访问层如同“地基下的宝库”，专注数据的存储与获取。这般模块化设计，恰似为维护与测试开辟了“绿色通道”，各层各司其职、相对独立，修改某一层代码时，对其他层的“波及面”可控。可层与层之间犹如用“铁链”相连，过度紧密的耦合，在高并发、复杂业务场景下，易滋生性能瓶颈，阻碍数据与指令的高效流通，使得应对复杂业务时力不从心。

三、微服务架构：灵动独立的“服务兵团”

微服务架构仿若将一支庞大军队拆分成多个精锐“小分队”，每个服务作为独立“作战单元”，聚焦特定业务功能，凭借API“传令兵”互通有无。在互联网瞬息万变、业务需求“七十二变”的当下，它凭借高度灵活的“身手”脱颖而出。扩展时，只需对相应服务“添兵加将”、强化装备；部署更是能做到逐个击破、快速迭代。但“自由”的背后是“责任”，众多微服务纵横交错，复杂性呈指数级攀升，若无得心应手的管理工具“驾驭”，缺乏高瞻远瞩的架构设计“蓝图”，极易陷入混乱无序的“泥淖”，服务间通信“迷路”、故障排查“两眼一抹黑”等问题将接踵而至。

四、事件驱动架构：异步高效的“消息引擎”

想象一座繁华都市，事件驱动架构便是那基于“消息烽火台”运转的系统，一旦有“事件烽火”燃起，相关组件便依令而动、异步响应。在实时数据流汹涌澎湃的场景，如金融股票交易实时监控、物流轨迹实时追踪等领域，它大显身手，凭借高扩展性“海纳百川”。只不过，异步通信、事件流转如隐匿于暗处的“丝线”，错综复杂，调试时仿若在迷宫寻踪，监控难度亦不容小觑，倘若消息传递机制这一“传声筒”稍有差池，整个系统便可能陷入“聋哑”困境。

五、服务网格架构：微服务“通信护卫队”

服务网格架构作为微服务背后的“隐形护盾”，专职守护微服务间通信链路。它悄然嵌入基础设施层，为服务发现、负载均衡、故障恢复等关键环节“站岗放哨”，加固微服务通信的“城墙”，提升可靠性与安全性。可额外添加的这一基础设施层，仿若给系统披上一层“重甲”，复杂性水涨船高，运维管理成本也随之攀升，需时刻警惕“负重过多”导致的效率折损。

六、无服务器架构：省心省力的“云端轻骑”

在无服务器架构的“奇幻世界”里，应用程序宛如寄居云端的“飞鸟”，依托第三方平台“云霄客栈”，按需振翅、执行代码，无需为底层基础设施“柴米油盐”费心。运营成本大幅削减，按使用量付费恰似“量入为出”，自动扩展更是能从容应对流量潮汐。只是，“飞得高，靠得多”，对特定云平台的深度依赖，仿若风筝与线，一旦平台“打喷嚏”，应用便可能“飘摇不定”，且冷启动延迟这一“小插曲”，也可能在关键时刻影响用户体验。

七、面向服务架构：服务复用的“乐高积木”

面向服务架构恰似一套巨型“乐高积木”，每个服务都是一块独具特色、可独立雕琢的“积木块”，基于标准协议“榫卯拼接”、通信协作。服务复用性堪称其“金字招牌”，开发新功能时，可从“积木库”中挑拣适配组件，快速搭建；系统解耦程度高，维护起来条理清晰。然而，理想很丰满，现实很骨感，标准协议虽好，可落地实现时，仿若精细“刺绣”，需兼顾多方，颇为复杂，通信开销也如“小尾巴”，时不时拖慢性能表现。

八、插件式架构：功能拓展的“魔法口袋”

插件式架构为应用程序披上一件“魔法披风”，核心系统作为坚实“后背”提供基础支撑，插件则是那可按需装入“口袋”的神奇法宝，赋予应用额外功能。用户能像魔法师挑选魔杖一样，依据需求灵活扩充功能，高扩展性展露无遗。但插件间兼容性问题恰似“魔法反噬”，若适配不佳，系统稳定性便会大打折扣，“魔法口袋”也可能成为“潘多拉魔盒”。

九、CQRS架构：读写分离的“性能先锋”

CQRS架构宛如为读写操作打造的“双车道高速公路”，将写操作（命令）与读操作（查询）分道扬镳，各司其职。在高并发“车水马龙”、复杂域模型“路况复杂”的场景下，有效疏解交通压力，提升系统扩展性与性能表现。只是，这条“双车道”建设成本不菲，复杂性贯穿设计、数据同步全程，需精心规划、严密监控，方能保障顺畅运行。

十、分布式架构：高可用的“钢铁联盟”

分布式架构如同组建一个跨地域的“超级英雄联盟”，系统各组件化身“超级英雄”，分散于多个节点，凭借网络通信“心灵感应”协同作战。高可用性、高扩展性使其成为大规模应用“逐鹿战场”的利器，无惧海量数据、高并发冲击。可“联盟”越大，管理难度越高，数据一致性如“统一战线”需时刻坚守，网络延迟则像“小怪兽”，不时跳出来捣乱，挑战系统稳定性。

总之，软件架构选型恰似一场“棋局博弈”，需综合考量项目规模“棋盘大小”、复杂度“棋局形势”、性能要求“胜负目标”以及团队能力“棋手实力”等诸多因素。唯有精心布局、量体裁衣，方能以最合适的架构“落子”，赢得项目成功的“棋局”。愿各位开发者在架构选型之路上，胸有成竹、步步为营！

模块化未来：组装式应用与PBC的演进与实践

2024-08-20T00:00:00+08:00

引言

随着数字化转型的加速，企业对灵活、可扩展的技术架构需求越来越高。传统的单体应用已无法满足快速变化的市场需求，而微服务架构虽然在一定程度上缓解了这个问题，但其复杂性也给企业带来了新的挑战。为了解决这些问题，组装式应用（Composable Applications）和 Packaged Business Capabilities（PBC，打包的业务能力）逐渐成为企业架构中的关键概念。

什么是组装式应用？

组装式应用是一种基于模块化设计思想的应用架构，它将业务功能拆分为独立的模块，这些模块可以根据业务需求进行自由组合。通过这种方式，企业可以更快速地响应市场变化，同时减少开发和维护的成本。

组装式应用的核心理念是将应用程序看作一组可以组合的乐高积木，每个积木代表一个特定的业务功能。这些功能模块可以来自不同的供应商，也可以是企业自己开发的，通过标准化的接口，它们可以无缝地集成到现有的系统中。

PBC（Packaged Business Capabilities）概念

PBC 是组装式应用中的一个关键组件。它是一种将特定业务功能打包成独立、可复用模块的技术。每个 PBC 都包含了与某一业务功能相关的全部组件，包括数据模型、API、用户界面等。PBC 的出现使得业务功能的部署和集成变得更加简单和高效。

PBC 的主要特点包括：

独立性：每个 PBC 都是一个独立的模块，可以单独开发、部署和升级，而不影响其他模块的正常运行。
标准化接口：PBC 通过标准化的 API 与其他模块和系统进行交互，确保了不同模块之间的兼容性和互操作性。
可复用性：由于 PBC 是独立的业务功能模块，它们可以在不同的应用场景中复用，大大提高了开发效率。

组装式应用与 PBC 的优势

敏捷性与灵活性：通过将业务功能分解为可独立部署的 PBC，企业可以根据业务需求快速调整和扩展应用功能，而无需对整个系统进行大规模改动。
降低成本：由于 PBC 是可复用的模块，企业可以通过复用现有的 PBC 来降低开发成本。此外，PBC 的独立性还可以减少系统维护和升级的复杂性，从而进一步降低运营成本。
提高创新速度：组装式应用允许企业在不影响核心系统的情况下，引入新的业务功能和技术。这种灵活性使得企业能够更快地响应市场变化，并在竞争中保持优势。

实现组装式应用与 PBC 的挑战

尽管组装式应用和 PBC 带来了诸多优势，但其实施也面临一些挑战：

模块化设计的复杂性：将业务功能模块化要求企业具备成熟的架构设计能力，尤其是在业务功能的分解和模块化设计方面。
数据管理和集成：由于 PBC 是独立的模块，如何在多个 PBC 之间共享和管理数据是一个复杂的问题。企业需要建立健全的数据治理机制，以确保数据的一致性和安全性。
标准化接口的制定：为了实现 PBC 之间的无缝集成，企业需要制定和遵循统一的接口标准。这要求在实施前进行充分的规划和设计。

案例分析

一些领先的企业已经成功实施了组装式应用和 PBC。例如，某全球零售巨头通过引入组装式应用架构，大幅缩短了新功能的上线时间，并通过复用 PBC 降低了 IT 成本。另一个案例是一家金融服务公司，通过 PBC 实现了多渠道客户服务的无缝集成，提升了客户体验和运营效率。

结论

组装式应用和 PBC 代表了企业应用架构发展的一个重要方向。它们为企业提供了更高的灵活性、敏捷性和扩展性，使企业能够更快速地响应市场变化，降低成本，并提高创新能力。然而，企业在实施过程中需要克服模块化设计、数据管理和标准化接口等挑战，才能充分发挥组装式应用和 PBC 的优势。

未来，随着技术的发展和标准的完善，组装式应用和 PBC 的应用将会更加广泛，推动企业实现更高效、更智能的数字化转型。

Python 中的 dotenv——配置管理的魔法棒

2024-08-14T00:00:00+08:00

Python 中的 dotenv——配置管理的魔法棒

在 Python 开发的奇妙世界里，dotenv 是一个能让我们的配置管理变得轻松又高效的神奇工具。今天，就让我们一起深入探索 dotenv 的魅力！

一、dotenv 是什么？

dotenv 是一个用于在 Python 项目中加载环境变量的库。它允许我们将项目所需的各种配置信息，如数据库连接参数、API 密钥、应用程序设置等，存储在一个单独的 .env 文件中。

二、为什么要用 dotenv？

配置分离将配置信息从代码中分离出来，使得代码更加简洁、可维护。不必在代码中直接硬编码敏感信息，降低了代码的复杂性和潜在的安全风险。

例如，想象一下您的代码中直接包含了数据库密码，一旦代码被意外公开，后果不堪设想。

环境切换便捷在不同的环境（开发、测试、生产）中，只需切换不同的 .env 文件，就能轻松更改配置，无需修改代码。

假设开发环境使用本地数据库，而生产环境使用云端数据库，通过 dotenv ，您可以轻松切换。

团队协作友好方便团队成员共享和管理配置信息，避免因配置不一致导致的问题。

三、如何使用 dotenv？

首先，需要安装 python-dotenv 库：

pip install python-dotenv

接下来，在项目的入口处，通常是主程序文件中，添加以下代码来加载 .env 文件：

from dotenv import load_dotenv
load_dotenv()

然后，就可以通过 os.environ 来获取配置信息了。

四、实际应用示例

假设我们正在开发一个数据抓取程序，需要使用 API 密钥来获取数据。

在 .env 文件中：

API_KEY=your_api_key

在代码中：

import os

api_key = os.environ['API_KEY']

五、注意事项

确保 .env 文件不会被意外提交到版本控制系统中，尤其是包含敏感信息时。
对于复杂的配置，可能需要结合其他配置管理工具，如 ConfigParser 。

总之，dotenv 为 Python 开发者提供了一种简单而有效的配置管理方式，让我们的项目更加灵活、可维护和安全。

在 OpenAI SDK 和 LangChain OpenAI 中使用代理

2024-07-19T00:00:00+08:00

在 OpenAI SDK 和 LangChain OpenAI 中使用代理

在开发过程中，使用代理服务器可以帮助你控制网络请求的流向、提高安全性或遵循公司的网络政策。本文将介绍如何在 OpenAI SDK 和 LangChain OpenAI 中使用代理。

在 OpenAI SDK 中使用代理

安装必要的库

确保你已经安装了 OpenAI SDK 和 httpx 库。如果尚未安装，可以使用以下命令进行安装：

pip install openai httpx

使用代理配置 OpenAI SDK

以下是一个使用代理配置 OpenAI SDK 的代码示例：

import httpx
from openai import OpenAI

# 配置 OpenAI 客户端，使用代理
client = OpenAI(
    api_key="sk-xxx",
    http_client=httpx.Client(
        proxies="http://127.0.0.1:8118",  # 代理服务器的URL
        transport=httpx.HTTPTransport(local_address="0.0.0.0"),  # 本地地址配置
        verify=False  # 禁用SSL证书验证（不推荐在生产环境中使用）
    )
)

# 创建一个聊天完成请求
completion = client.chat.completions.create(
    model="gpt-4-turbo",
    messages=[
        {"role": "user", "content": "你可以做什么."}
    ]
)

# 打印返回的消息
print(completion.choices[0].message)

解释

导入库：
- httpx 是一个用于发出 HTTP 请求的库。
- OpenAI 是 OpenAI SDK 中的主要类，用于与 OpenAI API 进行交互。
配置 OpenAI 客户端：
- api_key：你的 OpenAI API 密钥。
- http_client：一个自定义的 httpx.Client 实例，用于配置代理。
  - proxies：代理服务器的 URL，例如 http://127.0.0.1:8118。
  - transport：配置本地地址为 0.0.0.0。
  - verify：设置为 False 以跳过 SSL 证书验证（不推荐在生产环境中使用）。
创建聊天完成请求：
- 使用 client.chat.completions.create 方法创建一个聊天完成请求。
- model：使用的模型名称，例如 gpt-4-turbo。
- messages：消息列表，其中包含用户输入的内容。
打印返回的消息：
- 打印返回的消息内容。

备注

安全性：在生产环境中，不建议禁用 SSL 证书验证（verify=False），这样可能会导致安全问题。
API 密钥管理：确保妥善管理和保护你的 API 密钥，不要在公共代码库中泄露。

在 LangChain OpenAI 中使用代理

LangChain 是一个构建基于语言模型的应用程序的库，可以与 OpenAI 的 Chat API 进行交互。下面介绍如何在 LangChain 中配置代理。

安装必要的库

确保你已经安装了 LangChain 和 OpenAI SDK：

pip install langchain openai

使用代理配置 LangChain 的 `ChatOpenAI`

以下是一个示例，展示了如何在使用代理的情况下配置和使用 LangChain 的 ChatOpenAI：

import os
import requests
from langchain.chat_models import ChatOpenAI
from langchain.schema import AIMessage, HumanMessage, SystemMessage

# 设置 API 密钥
os.environ["OPENAI_API_KEY"] = "YOUR_API_KEY"

# 配置代理
proxy = "http://127.0.0.1:8118"

# 创建一个带有代理的请求会话
session = requests.Session()
session.proxies = {
    "http": proxy,
    "https": proxy
}

# 定义一个自定义的 ChatOpenAI 类来使用带代理的请求会话
class ProxyChatOpenAI(ChatOpenAI):
    def _call_openai(self, messages, stop=None):
        openai_requestor = self._get_requestor()
        openai_requestor.session = session
        return super()._call_openai(messages, stop=stop)

# 实例化带代理的 ChatOpenAI 类
chat = ProxyChatOpenAI(
    model="gpt-4-turbo", 
    openai_api_key=os.getenv("OPENAI_API_KEY")
)

# 示例对话
messages = [
    SystemMessage(content="You are a helpful assistant."),
    HumanMessage(content="Hello, how are you?")
]

response = chat(messages)
print(response.content)

解释

设置 API 密钥和代理：
- 使用环境变量 OPENAI_API_KEY 设置 OpenAI 的 API 密钥。
- 定义代理 URL，例如 http://127.0.0.1:8118。
创建带代理的请求会话：
- 使用 requests.Session() 创建一个会话，并设置代理。
自定义 ChatOpenAI 类：
- 继承 ChatOpenAI 类，并重写 _call_openai 方法，使用带代理的请求会话。
- 在 _call_openai 方法中，设置 openai_requestor 的会话为带代理的会话。
实例化自定义的 ChatOpenAI 类：
- 使用自定义的 ProxyChatOpenAI 类，传入所需参数，例如模型名称和 API 密钥。
示例对话：
- 创建一个消息列表，并调用自定义的 ChatOpenAI 实例进行对话。

总结

本文介绍了如何在 OpenAI SDK 和 LangChain OpenAI 中使用代理。通过设置环境变量或在代码中直接配置代理，可以确保在进行 API 调用时，所有请求都会通过指定的代理服务器。这种方法可以帮助开发者在受限的网络环境中正常使用 OpenAI 的服务，并且提高网络请求的安全性和灵活性。