25位大厂高管转战生成式AI创业！吸金猛，不

[hr] 智东西作者李水青编辑心缘智东西7月2日报道，今年3月智东西曾报道，超14位互联网大厂离职高管详细

[大模型AI] 25位大厂高管转战生成式AI创业！吸金猛，不 07-03

[大模型AI] 大模型本地知识库 04-13

[课程库] 国产GPU龙头AI算力产品登场 22天暴涨121%！ 03-14

[大模型AI] 百度王海峰谈通用人工智能：技术通用、能力 07-03

[大模型AI] 让企业为大模型买单，目前有四大难 07-03

[大模型AI] 打造OpenAI GPT超算：微软云上生成式AI创新 03-13

国产GPU龙头AI算力产品登场 22天暴涨121%！

历史与AI的距离：聊天机器人在历史学科科研

打造OpenAI GPT超算：微软云上生成式AI创新

LangGraph 人工介入机制实战：interrupt 功

手摸手教你用Dify+Java自建MCP服务，实现AI

LangChain入门：3

一文读懂向量数据库

Milvus 向量数据库使用示例

本地Langchain搭建RAG

[复制链接]

就是侑范儿 发表于 2025-9-7 23:37:01 | 显示全部楼层 |阅读模式

RAG：

LangChian 可以将 LLM 模型、向量数据库、交互层 Prompt、外部知识、外部工具整合到一起，进而可以自由构建 LLM 应用。Langchain是一个基于大型语言模型的开发应用程序框架。
搭建本地demo代码

from langchain.document_loaders import TextLoader
loader = TextLoader('./rag.txt') docs = loader.load()

复制代码

将文档拆分成块

from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(chunk_size=20, chunk_overlap=20)
splits = text_splitter.split_documents(docs)
复制代码

from langchain_community.vectorstores import Chroma
vectorstore = Chroma.from_documents( documents=splits, embedding=HuggingFaceEmbeddings(model_name="moka-ai/m3e-base") )
retriever = vectorstore.as_retriever()
复制代码

from modelscope import snapshot_download
from transformers import pipeline
model_dir = snapshot_download('LLM-Research/Llama-3.2-3B-Instruct') llm = pipeline( "text-generation", model=model_dir, torch_dtype=torch.bfloat16, device_map="auto", max_new_tokens =100,)
return_model = HuggingFacePipeline(pipeline=llm)

利用modelscope中的开源模型，需要HuggingFacePipeline 修改下模型格式满足模型的输入格式。

from langchain.chains import RetrievalQA
qa_chain = RetrievalQA.from_chain_type(
llm=return_model, retriever=vectorstore.as_retriever())
question = 'RAG是什么' result = qa_chain({"query": question})
print(f'大语言模型的回答为：{result["result"]}')

最后输出：