作者 | 高强文 |
豆瓣评分 | 0.0 |
面向初中级读者的Agent学习指南,覆盖职场应用与创业项目的实际场景,帮助Agent使用者和开发者实现定制化开发,切实满足多样化的行业需求。
本书从基础知识、操作和应用开发3个维度循序渐进地讲解Agent实战技巧,分为三篇: 1、基础篇(1~2章) 介绍Agent定义、发展历程、常用开源技术、主要组件等基础知识和开发环境的搭建过程。 2、应用篇(3~6章) 从通用型、任务驱动型、辅助开发型和检索增强型 4大类,通过AutoGPT、MemGPT、BabyAGI、Camel、Devika、CodeFuse-ChatBot、DB-GPT、QAnything这8种具体类型,详细描述Agent的安装、配置和使用等操作步骤。 3、开发篇(7~16章) 展开分析10个不同场景的Agent应用开发实例。一方面,以AgentScope、LangChain、LangGraph、AutoGen、LlamaIndex、CrewAI、Qwen-Agent这7种被广泛应用的开源Agent开发框架为基础,针对每个框架各讲解一个开发案例。另一方面,通过案例介绍Agent开发过程中关键的Function-calling特性及大语言模型开发技术。此外,对基于CogVLM2的多模态模型应用开发,也提供详细的案例演示。
适读人群 :有AI职场应用需求的人,AI项目创业的人
(1)实力派作者,洞察读者实际需求:作者既是资深AI技术专家,也是经验丰富的项目导师,深谙行业动态和读者需求。本书融合了作者的实践经验、培训反馈与官方资源,提供了一套快速上手、实用高效的指导方案。 (2)翔实内容,降低开发门槛:本书采用开源框架,降低选型成本。书中深入剖析AI Agent的核心原理及15种主流框架,并通过10个不同领域的实例详细讲解实战技巧,操作步骤细致、源代码完整,助力读者迅速掌握关键技术。 (3)贴近实际,满足职场与创业需求:这是一本面向初中级读者的Agent学习指南,覆盖职场应用与创业项目的实际场景,帮助Agent使用者和开发者实现定制化开发,切实满足多样化的行业需求。
作者简介
高强文 资深AI技术专家与项目导师。作为数字技术正高级工程师,专注于人工智能大语言模型应用开发、开源社区开发与运营。 AI领域创业先锋,宁夏回族自治区劳动模范。现任互链高科(北京)技术发展有限公司总经理,银川方达电子系统工程有限公司董事长。20多年来,一直从事信息化、人工智能等产品研发与管理工作。 近年来积极投身于开源事业,开发运营aliendao.cn、gitclone.com和opendao.cn等开源社区,在GitHub上贡献了20多个开源代码库。著有《大模型项目实战:多领域智能应用开发》,旨在为开发者提供AI技术实践指导。
目录
目 录
前言
基础篇
第1章 Agent基础知识 2
1.1 Agent的概念 2
1.2 Agent的发展历程 3
1.2.1 Agent起源 3
1.2.2 将Agent引入AI领域 4
1.2.3 Agent技术进化与理论完善 5
1.2.4 Agent的深度学习应用 5
1.2.5 基于LLM的Agent 6
1.3 常用的Agent开源技术及分类 6
1.4 Agent主要组件 10
1.4.1 大语言模型 11
1.4.2 规划组件 12
1.4.3 记忆组件 15
1.4.4 工具组件 15
1.4.5 行动组件 16
第2章 Agent应用与开发环境搭建 17
2.1 Agent应用部署结构 17
2.1.1 服务同机部署模式 18
2.1.2 服务分布式部署模式 19
2.2 Agent应用环境安装与验证 19
2.2.1 推理卡驱动安装 20
2.2.2 CUDA安装 23
2.2.3 Anaconda安装 25
2.2.4 Git安装 26
2.2.5 应用环境验证 26
2.2.6 关于开发工具的建议 27
2.3 大语言模型的装载及API服务搭建 27
2.3.1 Ollama 27
2.3.2 vLLM 30
2.3.3 GLM-4专用服务 32
应用篇
第3章 通用型Agent应用 37
3.1 AutoGPT:个人助理 37
3.1.1 AutoGPT介绍 37
3.1.2 AutoGPT原理 38
3.1.3 AutoGPT应用 42
3.2 MemGPT:长记忆会话应用 47
3.2.1 MemGPT介绍 47
3.2.2 MemGPT原理 47
3.2.3 MemGPT应用 52
第4章 任务驱动型Agent应用 56
4.1 BabyAGI:任务自驱动应用 56
4.1.1 BabyAGI介绍 56
4.1.2 BabyAGI原理 57
4.1.3 BabyAGI应用 62
4.2 Camel:角色扮演应用 65
4.2.1 Camel介绍 65
4.2.2 Camel原理 65
4.2.3 Camel应用 67
第5章 辅助开发型Agent应用 70
5.1 Devika:AI“软件工程师”应用 70
5.1.1 Devika介绍 70
5.1.2 Devika原理 71
5.1.3 Devika应用 75
5.2 CodeFuse-ChatBot:辅助编程应用 79
5.2.1 CodeFuse-ChatBot介绍 79
5.2.2 CodeFuse-ChatBot原理 80
5.2.3 CodeFuse-ChatBot应用 82
第6章 检索增强型Agent应用 85
6.1 DB-GPT:数据库应用 85
6.1.1 DB-GPT介绍 85
6.1.2 DB-GPT原理 86
6.1.3 DB-GPT应用 88
6.2 QAnything:知识库应用 90
6.2.1 QAnything介绍 90
6.2.2 QAnything原理 91
6.2.3 QAnything应用 93
开发篇
第7章 大语言模型开发与微调 97
7.1 开发要点 97
7.2 GLM-4 98
7.2.1 GLM-4介绍 98
7.2.2 GLM-4安装 98
7.2.3 Chat应用开发 99
7.2.4 GLM-4兼容API服务开发 102
7.2.5 GLM-4微调 104
7.3 Llama3 108
7.3.1 Llama3介绍 108
7.3.2 Llama3安装 109
7.3.3 Chat应用开发 110
7.3.4 Llama3兼容API服务
开发 113
7.3.5 Llama3微调 118
第8章 基于GLM-4的Function-calling应用开发 124
8.1 开发要点 124
8.2 案例场景 125
8.3 关键原理 126
8.4 实现过程 128
8.4.1 环境安装 128
8.4.2 源代码 128
8.4.3 运行 133
第9章 基于AgentScope的ReAct Agent应用开发 134
9.1 开发要点 134
9.2 案例场景 134
9.3 关键原理 135
9.4 实现过程 138
9.4.1 环境安装 138
9.4.2 源代码 139
9.4.3 运行 142
第10章 基于LangChain的任务驱动Agent应用开发 143
10.1 开发要点 143
10.2 案例场景 144
10.3 关键原理 144
10.3.1 应用架构 145
10.3.2 应用运行流程 145
10.3.3 应用运行示例 146
10.4 实现过程 149
10.4.1 环境安装 149
10.4.2 源代码 150
10.4.3 运行 153
第11章 基于LangGraph的工作流Agent应用开发 155
11.1 开发要点 155
11.2 案例场景 155
11.3 关键原理 156
11.3.1 基本概念 156
11.3.2 工作流定义 157
11.4 实现过程 158
11.4.1 环境安装 158
11.4.2 源代码 159
11.4.3 运行 163
第12章 基于AutoGen的辅助编程Agent应用开发 164
12.1 开发要点 164
12.2 案例场景 165
12.3 关键原理 165
12.4 实现过程 167
12.4.1 环境安装 167
12.4.2 源代码 168
12.4.3 运行 171
第13章 基于LlamaIndex的RAG Agent综合应用开发 173
13.1 开发要点 173
13.2 案例场景 174
13.3 关键原理 174
13.3.1 索引建立 175
13.3.2 智体查询 176
13.4 实现过程 176
13.4.1 环境安装 176
13.4.2 源代码 178
13.4.3 运行 181
第14章 基于CrewAI的多角色Agent应用开发 182
14.1 开发要点 182
14.2 案例场景 183
14.3 关键原理 183
14.3.1 应用架构 183
14.3.2 主要组件 184
14.3.3 流式会话实现原理 185
14.4 实现过程 186
14.4.1 环境安装 186
14.4.2 源代码 187
14.4.3 运行 191
第15章 基于Qwen-Agent的多智体图像应用开发 193
15.1 开发要点 193
15.2 案例场景 194
15.3 关键原理 195
15.3.1 应用架构 195
15.3.2 关键技术 196
15.4 实现过程 198
15.4.1 环境安装 198
15.4.2 源代码 200
15.4.3 运行 202
15.4.4 增强方案 202
第16章 基于CogVLM2的多模态Agent应用开发 204
16.1 开发要点 204
16.2 案例场景 205
16.3 关键原理 205
16.3.1 图片理解 206
16.3.2 向量化 207
16.3.3 图片检索 207
16.4 实现过程 207
16.4.1 环境安装 208
16.4.2 源代码 209
16.4.3 运行 215