从零搭建 RAG 核心链路：文本切片 + Ollama 向量化 + Milvus 存储（附源码）

发布时间：2026/7/3 2:05:53

本片文章仅作为我自己学习记录顺便也分享给大家。一、为什么做这个构建一个 Agent 开发的基础设施的其中之一巩固基础完成文档到向量数据库的全链路熟悉开发与设计流程二、技术栈层技术Web 框架Flask向量模型Ollama qwen3-embedding:4b2560 维向量数据库Milvus部署在腾讯云文件解析python-docx只处理word文档管理工具Attumilvus可视化工具三、核心实现1.模块拆分docToMilvus.py → Flask 路由接收入口处理文本.py → 滑窗切片向量化存 Milvus核心引擎处理文件.py → 文件解析复用处理文本逻辑2.滑窗切片策略- window_size500, slide400 - 相邻切片 100 字重叠保证语义不断层3.向量化- 调 Ollama /api/embed 接口 - qwen3-embedding:4b 输出 2560 维向量4.Milvus存储- 使用新版 MilvusClient API - 指定 db_name 连接正确的 Database5.统一返回值{success: true/false, msg: ..., chunk_count: n}四、遇到的问题及解决方法问题原因解决cant find collectionDatabase 名不是默认 default加 db_namemy_milvusuri is illegalURI 缺少协议前缀加上 http://500 返回 None文件分支忘了 return补上返回逻辑SchemaNotReadyException表没在 Milvus 上建好Attu 里建表或代码自动创建五、架构总结数据源文件/文本 → 解析器 → 处理文本.py ├─ 滑窗切片 ├─ Ollama 向量化 └─ Milvus 写入六、下一步计划- 搜索查询向量数据接口 - 接入大模型做 RAG 对话 - 搭配前端 Vue 2 页面作为小demo七、源码docToMilvus.pyfrom flask import Flask, request import 处理文本 import 处理文件 app Flask(__name__) app.route(/) def hello(): return {msg: ok} app.route(/document, methods[POST]) def document(): # 两种模式第一种是上传文件第二个是上传大长文本只能用其中一个 file request.files.get(file) text request.form.get(text) if file and file.filename: result 处理文件.process_file(file) if not result[success]: return {msg: result[msg], code: 400} return {msg: ok, code: 200, chunk_count: result[chunk_count]} elif text: result 处理文本.process_text(text) if not result[success]: return {msg: result[msg], code: 400} return {msg: ok, code: 200, chunk_count: result[chunk_count]} else: return {msg: file and text all None, code: 400} if __name__ __main__: app.run(host0.0.0.0, port8000)处理文本.pyimport requests from pymilvus import MilvusClient MILVUS_URI http://124.223.163.254:19530 MILVUS_DB my_milvus COLLECTION_NAME doc_chunks OLLAMA_URL http://localhost:11434/api/embed OLLAMA_MODEL qwen3-embedding:4b WINDOW_SIZE 500 SLIDE 400 def process_text(text): chunks [] start 0 while start len(text): chunk text[start:start WINDOW_SIZE] if chunk.strip(): chunks.append(chunk.strip()) start SLIDE if not chunks: return {success: False, msg: empty text, chunk_count: 0} response requests.post(OLLAMA_URL, json{ model: OLLAMA_MODEL, input: chunks }) if response.status_code ! 200: return {success: False, msg: follama error {response.status_code}, chunk_count: 0} vector_list response.json()[embeddings] client MilvusClient(uriMILVUS_URI, db_nameMILVUS_DB) data [{text: chunks[i], vector: vector_list[i]} for i in range(len(chunks))] client.insert(collection_nameCOLLECTION_NAME, datadata) return {success: True, msg: ok, chunk_count: len(chunks)}处理文件.pyimport os from docx import Document import 处理文本 # 暂时不考虑有表格的情况 def process_file(file): ext os.path.splitext(file.filename)[1].lower() if ext not in (.docx, .doc): return {success: False, msg: only support .docx file, chunk_count: 0} doc Document(file) text \n.join(p.text for p in doc.paragraphs) if not text.strip(): return {success: False, msg: empty file, chunk_count: 0} return 处理文本.process_text(text)

从零搭建 RAG 核心链路：文本切片 + Ollama 向量化 + Milvus 存储（附源码）

相关新闻

AI 日志摘要：别把关键上下文压没了

数据库与中间件使用及安全基础 20 道选填练习题

LLM 评测集构建：样本少，也要覆盖真实任务

最新新闻

ML模型服务化：从Notebook到生产环境的11个关键实践

Hive 内置函数详解

使用wecomapi开发的企业微信自动回复应该如何设计？规则引擎与消息处理架构解析

药流后要做小月子吗？休养原则与科学营养修护科普

苹果 App Store 卡审核一天怎么办？别急着撤回，先看看是不是这几种情况

QMK Toolbox：机械键盘固件的万能工具箱秘籍

日新闻

iOS自动化测试：基于facebook-wda与weditor的稳定元素定位实战

MTKClient实战指南：深度解析联发科芯片调试与设备修复方案

基于Bootstrap 5的开源后台模板，带深色主题、完整功能页与本地构建支持

周新闻

管理者的六个层次

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

月新闻

Dify 本地部署与 AI 应用开发实战：从零构建智能工作流

社区贡献指南：如何向Kiran图标主题项目提交图标与改进

抖音下载器：一键保存无水印视频，轻松构建个人数字内容库