LangChain 入门学习

niandihuo · 发表于 2026-1-20 09:01:04

作者：CSDN博客
文章目录

从零开始学习LangChain：新手入门全指南

一、什么是LangChain？

1. 核心定义

LangChain是一个开源框架，专为开发"由大语言模型（LLMs）驱动的应用"设计。简单说，它就像一个"桥梁"，能让GPT-4、Claude等模型：

2. 用类比理解LangChain

官方文档里有个很形象的比喻：LangChain相当于数据库领域的JDBC。

3. 核心组件（3大模块）

LangChain的功能通过以下三个核心组件实现：

Components（组件）

Chains（链）

Agents（代理）

二、为什么要用LangChain？

对于新手来说，LangChain的核心价值在于：

数据连接能力

行动执行能力

简化开发流程

三、安装与环境配置

1. 基础安装

首先通过pip安装核心库：

# 安装LangChain核心框架
pip install langchain
# 安装OpenAI集成（如果用GPT模型）
pip install langchain-openai

复制代码

2. LangSmith配置（必学工具）

LangSmith是LangChain官方的开发平台，用于调试、测试大模型应用，强烈建议新手使用。
步骤如下：

获取API Key：
环境变量配置：
1. import os
2. os.environ["LANGCHAIN_API_KEY"]="你的API Key"
3. os.environ["LANGCHAIN_TRACING_V2"]="true"# 开启追踪功能
复制代码

LangSmith的免费版包含：

四、核心功能与基础用法

1. 模型调用（Models）

用统一接口调用不同大模型，以OpenAI的GPT-4为例：

# 导入OpenAI模型包装器from langchain_openai import ChatOpenAI
# 初始化模型（需要OpenAI API Key）
os.environ["OPENAI_API_KEY"]="你的OpenAI密钥"
model = ChatOpenAI(
model="gpt-4",# 模型名称
temperature=0.7# 创造性参数（0-1，值越高回答越灵活）)# 调用模型生成文本
response = model.invoke("用一句话介绍LangChain")print(response.content)

复制代码

参数说明：

2. 提示词模板（Prompt Templates）

避免重复编写提示词，动态插入变量：

from langchain.prompts import PromptTemplate
# 定义模板（用{变量名}作为占位符）
template ="请将以下内容翻译成{language}：{text}"
prompt = PromptTemplate(
input_variables=["language","text"],# 声明变量
template=template
)# 生成具体提示词
formatted_prompt = prompt.format(
language="英语",
text="我要去上课了，不能和你聊天了。")# 调用模型
response = model.invoke(formatted_prompt)print(response.content)# 输出："I have to go to class and can't chat with you."

复制代码

3. 链（Chains）：组合组件

用LLMChain将提示词模板和模型组合：

from langchain.chains import LLMChain
# 创建链（连接提示词模板和模型）
chain = LLMChain(prompt=prompt, llm=model)# 直接运行链（自动处理格式和调用）
response = chain.run({"language":"法语","text":"我要去上课了，不能和你聊天了。"})print(response)# 输出法语翻译结果

复制代码

4. 代理（Agents）：让模型自主决策

Agent能让模型根据需求调用工具（如搜索引擎、计算器）。以简单数学计算为例：

# 安装必要库
pip install langchain-tools
from langchain.agents import initialize_agent, AgentType
from langchain.tools import CalculatorTool
# 初始化工具（这里用计算器工具）
tools =[CalculatorTool()]# 创建代理
agent = initialize_agent(
tools,
model,
agent=AgentType.CHAT_ZERO_SHOT_REACT_DESCRIPTION,# 常用代理类型
verbose=True# 显示思考过程)# 让代理解决问题
response = agent.run("3的平方加上5的立方等于多少？")print(response)# 输出：134（3²+5³=9+125=134）

复制代码

AgentType.CHAT_ZERO_SHOT_REACT_DESCRIPTION的特点：

5. 向量存储与检索（VectorStores）

用于处理文档数据，实现"检索增强生成（RAG）"，步骤如下：

安装库：
1. pip install langchain-chroma # 轻量级向量数据库
2. pip install pypdf # 处理PDF文件
复制代码
加载并分割文档：
1. from langchain.document_loaders import PyPDFLoader
2. from langchain.text_splitter import RecursiveCharacterTextSplitter
4. # 加载PDF
5. loader = PyPDFLoader("你的文档.pdf")
6. documents = loader.load()# 分割文档（大文档拆成小块）
7. text_splitter = RecursiveCharacterTextSplitter(
8. chunk_size=1000,# 每块1000字符
9. chunk_overlap=200# 块之间重叠200字符（保持上下文）)
10. splits = text_splitter.split_documents(documents)
复制代码
存储到向量数据库：
1. from langchain.embeddings import OpenAIEmbeddings
2. from langchain.vectorstores import Chroma
4. # 创建向量存储
5. vectorstore = Chroma.from_documents(
6. documents=splits,
7. embedding=OpenAIEmbeddings()# 用OpenAI的嵌入模型)# 创建检索器（用于查询相关文档）
8. retriever = vectorstore.as_retriever()
复制代码
检索并生成答案：
1. # 检索与问题相关的文档
2. docs = retriever.get_relevant_documents("文档中关于LangChain的部分讲了什么？")# 结合文档生成答案（用链组合）from langchain.chains import RetrievalQA
4. qa_chain = RetrievalQA.from_chain_type(
5. llm=model,
6. chain_type="stuff",# 将文档内容"填充"到提示词中
7. retriever=retriever
8. )
10. response = qa_chain.run("文档中关于LangChain的部分讲了什么？")print(response)
复制代码

五、实战案例：构建RAG对话机器人

RAG（检索增强生成）是LangChain最常用的场景，能让机器人基于特定文档回答问题。完整流程如下：

加载数据

分割文本

嵌入存储

检索相关内容

生成答案

代码示例（整合版）：

# 1. 加载文档
loader = PyPDFLoader("课程笔记.pdf")
documents = loader.load()# 2. 分割文本
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(documents)# 3. 存储向量
vectorstore = Chroma.from_documents(splits, OpenAIEmbeddings())
retriever = vectorstore.as_retriever()# 4. 创建问答链
qa_chain = RetrievalQA.from_chain_type(
llm=model,
chain_type="stuff",
retriever=retriever,
return_source_documents=True# 返回引用的文档)# 5. 提问并获取答案
result = qa_chain({"query":"课程中提到的LangChain核心组件有哪些？"})print("答案：", result["result"])print("引用文档：",[doc.metadata for doc in result["source_documents"]])

复制代码

六、总结与学习建议

1. 核心知识点回顾

2. 新手学习路径

3. 推荐资源

希望这篇指南能帮你快速入门LangChain！如果有任何问题，欢迎在评论区交流～

原文地址：https://blog.csdn.net/TTKunn/article/details/150288247

25位大厂高管转战生成式AI创业！吸金猛，不

LangChain 入门学习

OpenClaw简洁教程

关于我们

产品与服务

解决方案

产品与服务