从零开始做一个高校课程资料 AI Agent 问答系统(七)手把手配置真实大模型

发布时间:2026/6/22 7:26:35
从零开始做一个高校课程资料 AI Agent 问答系统(七)手把手配置真实大模型 从零开始做一个高校课程资料 AI Agent 问答系统大模型解答专业课知识点幻觉频发、脱离教材计算机毕设选题内卷不想做老旧管理系统零基础想学RAG开发看不懂架构、跑不通项目本专栏纯零基础、校园专属、全流程闭环、可答辩可商用手把手搭建高校课程资料RAG Agent问答系统一套项目搞定自学备考、高分毕设、求职加分、校园副业四大核心需求。专栏核心差异化优势✅校园垂直适配兼容课件PPT、专业课PDF、历年真题、课堂笔记等全格式校内资料贴合教学答疑逻辑✅彻底克制幻觉问答溯源校内原始资料自带文档页码来源答案严谨合规杜绝AI编造考点错题✅低门槛上手弱化冗余理论逐行代码实操Python基础即可学完从环境搭建到部署上线一站式教学✅项目复用价值高1. 自用备考私人AI专业课助教考点答疑、真题解析、章节梳理一键完成。2. 高分毕设2026优选AI选题创新点充足论文易撰写、答辩通过率高。3. 求职赋能掌握混合检索、Agent调度、幻觉抑制工业方案补齐大模型岗位项目经验。4. 副业变现可复刻院系/班级知识库承接校内AI答疑系统定制接单Full-Process Technical Chain链路学术文档降噪处理→专属语义切片→向量库部署→混合检索优化→RAG幻觉优化→Agent智能问答→前端可视化搭建→项目部署→毕设赋能→系统迭代扩容适配人群专栏配套福利计算机本硕学生搞定毕设、课程大作业、面试项目AI零基础开发者快速落地RAGAgent成品项目校内师生搭建班级/院系专属课程AI知识库AI求职者、副业从业者积累垂直项目、拓展校园定制接单业务附赠全套可运行源码、课程资料包、毕设模板、报错排错手册全程伴学答疑省去全网找代码、调试踩坑时间。手把手配置真实大模型如果想完全用本地的模型可以按照下面的方法1. 配置本机 Ollama 模型(qwen2.5:14b-instruct-q4_K_M)1.1 复制配置文件进入后端目录cd 你的路径\agent\backend如果还没有 .env 文件执行copy.env.example.env1.2 修改 .env打开E:\CodeX\agent\backend\.env默认内容类似APP_ENVlocal DATABASE_URLsqlite:///./rag_assistant.db UPLOAD_DIRuploads LLM_PROVIDERstub LLM_API_KEY LLM_BASE_URLhttps://api.openai.com/v1/chat/completions LLM_MODELgpt-4o-mini LLM_TIMEOUT_SECONDS30如果要启用本机 Ollama 模型真实模型以千问qwen2.5:14b-instruct-q4_K_M为例将配置改成LLM_PROVIDERopenai_compatible LLM_API_KEYollama LLM_BASE_URLhttp://localhost:11434/v1/chat/completions LLM_MODELqwen2.5:14b-instruct-q4_K_M LLM_TIMEOUT_SECONDS120注意不要把 .env 提交到 Git。.env 里有 API Key属于本地敏感配置。1.3 启动后端1.3.1 终端打开uvicorn app.main:app--reload打开http://127.0.0.1:8000/docs1.3.2 pycharm打开配置 PyCharm Run Configuration点右上角运行配置下拉框点Edit Configurations...点选择Python配置Name: Java Web RAG Backend Working directory: 你的路径\agent\backendScript path不填 uvicorn 文件推荐用Module name如果你的 PyCharm 有Module name选项填uvicornParameters填app.main:app --reloadPython interpreter选择你的路径\agent\backend\.venv\Scripts\python.exe保存后点运行按钮。如果你找不到Module name也可以在Script path里填你的路径\agent\backend\.venv\Scripts\uvicorn.exe然后Parameters仍然填app.main:app --reload1.4 上传课程资料在 Swagger 里调用POST /api/documents上传 Java Web 实验指导书、PPT、PDF、Markdown 或代码文件。确认返回status indexed1.5 调用问答接口在 Swagger 里调用POST /api/chat/ask请求体示例{question:ajax是什么意思,question_type:code_explanation,session_id:null}模型正在调用中如果配置正确answer 会更像真实大模型生成的自然语言回答。如果 API Key 没配、网络失败或模型服务异常系统会自动回退到 stub仍然返回基于检索片段的回答。2. 调用deepseek大模型如果没有可用本地的模型可以按照下面的方法引入平台的链接比如deepseek如果要调用deepseek大模型的真实模型以deepseek-v4-flash为例将配置改成LLM_PROVIDERopenai_compatible LLM_API_KEY换成你的实际DeepSeek API Key LLM_BASE_URLhttps://api.deepseek.com/chat/completions LLM_MODELdeepseek-v4-flash LLM_TIMEOUT_SECONDS120其他步骤和上面配置本机 Ollama 模型(qwen2.5:14b-instruct-q4_K_M)的一致。2.1 调用deepseek进行问答在 Swagger 里调用POST /api/chat/ask请求体示例{question:ajax在ie和非ie浏览器中的区别,question_type:code_explanation,session_id:null}模型正在调用中如果配置正确answer 会返回deepseek大模型生成的自然语言回答。并且我们也可以看到deepseek确实产生了调用3. 升级后的系统流程升级前学生问题 - 检索 chunks - build_prompt - generate_grounded_stub_answer - 保存问答 - 返回答案和引用升级后学生问题 - 检索 chunks - build_prompt - get_llm_provider - 如果是 openai_compatible 且配置了 API Key调用真实模型 - 如果没有配置或调用失败回退 stub - 保存问答 - 返回答案和引用这个升级让系统从“后端 RAG MVP”前进到“可接真实大模型的 RAG 应用”。4. 这一步和完整 Agent 的关系接入真实 LLM 后系统还不是完整 Agent但已经更接近 Agent。完整 Agent 还需要工具注册。工具调用协议。多步骤任务规划。Agent loop。执行状态保存。人工确认节点。日志追踪。成本统计。权限控制。评测体系。当前第二阶段解决的是让系统具备真实大模型生成能力。下一阶段需要继续做把“检索课程资料”“生成章节重点”“生成复习题”“生成实验 FAQ”封装成工具 再用一个简单 Agent Harness 管理这些工具调用。