鸿鹄笔记

1. Agent(智能体)

可以把 agent 理解为一个 能感知、能思考、能行动 的 AI 小助手，它不像一个“工具”，而更像一个“自主执行任务的个体”。

1.1 关键特性

感知（Perception）
- 能读取输入，如用户指令、环境数据、系统状态等
决策（Decision-making）
- 能基于规则、模型、算法来分析情况、制定计划
行动（Action）
- 能调用 API、操作工具、生成文本、运行任务等

1.2 举例

自动化代码助理: 接受“写一个登录系统”命令 → 拆解任务 → 调用代码工具、测试平台等

1.3 与传统AI的区别

| 传统AI | Agent | | ----------------- | --------------------- | | 通常是被动工具，如翻译、图像识别等 | 更像“自主个体”，可以完成整个工作流程 | | 一次输入一次输出 | 可持续工作，拥有记忆和目标导向行为 | | 不会调用外部工具 | 可以接入插件、API、数据库、搜索引擎 |

1.4 相关术语

LLM Agent: 基于大语言模型（如GPT）构建的智能体，能阅读指令、规划并执行任务

Tool-using Agent: 可调用外部工具，如搜索引擎、数据库、计算器

Multi-Agent System: 多个Agent协作解决复杂问题（如团队、角色分工）

1.5 现代AI Agent的应用

对话Agent：如ChatGPT、Claude等聊天机器人
任务执行Agent：能够完成复杂任务的AI助手
游戏Agent：在游戏中自主决策的AI角色
推荐Agent：个性化推荐系统
交易Agent：自动化交易系统

1.6 开发框架与工具

主流框架

LangChain

from langchain.agents import initialize_agent
from langchain.tools import Tool

agent = initialize_agent(
    tools=[tool1, tool2],
    llm=llm,
    agent_type="zero-shot-react-description"
)

AutoGen

from autogen import AssistantAgent, UserProxyAgent

assistant = AssistantAgent("assistant")
user_proxy = UserProxyAgent("user_proxy")

user_proxy.initiate_chat(assistant, message="请帮我分析数据")

CrewAI

from crewai import Agent, Task, Crew

agent = Agent(
    role="数据分析师",
    goal="分析销售数据",
    backstory="专业的数据分析专家"
)

开发工具

OpenAI API：GPT系列模型接口
Anthropic API：Claude模型接口
Hugging Face Transformers：开源模型库
LangSmith：Agent开发和调试平台