AI 全栈 · BtoBtoC · RAG

云上米轨

Yun Shang Mi Gui · Yunnan–Vietnam Railway Knowledge Platform

把百年滇越铁路的文化遗产做成数字化知识服务平台——6 大模块 + 南渡 AI 知识问答，从产品定义、AI 设计、全栈开发到部署运维一人走通，已上线公网。

中国国际大学生创新大赛研究生组 · 获奖项目

Customer Problem

客户问题

滇越铁路是中国第一条国际米轨铁路，通车已超过百年。实体遗存在老化，史料散落在各地馆藏与民间——这条线性工业文化遗产的传承，卡在五个真实痛点上：

平台为此服务两端：B 端是博物馆、档案馆、文旅局、中小学、国企党建等机构（史料数字化、研学课程定制、文化 IP 合作），C 端是文史爱好者、高校师生与研学群体——全国近代史爱好者超 2000 万人，铁路文化爱好者约 800 万人。

Before

在这个平台之前，"查一段滇越铁路的历史"意味着翻书、逛论坛、碰运气。知识没有结构化，无法检索、无法问答；传统文博网站是静态展示，综合平台内容泛化——西南米轨这个垂直领域，没有一个系统性的数字化入口。

What I Did

我是项目的产品负责人和唯一的平台开发者：整个数字平台从产品定义到部署运维由我一人以 vibe coding 方式（Claude Code 为主力）完成；合作方昆明理工大学建筑学院段文教授团队负责史料收集、田野调研与口述史采集等内容侧工作。具体分四层：

产品层：定义 6 大模块（史料藏馆 / 云游导览 / 光影展览 / 研学社区 / 南渡 AI / 文创商城）的架构与用户旅程；确立"C 端体验先行、B 端底座同步"的推进策略；12 条关键架构决策全部以 Decision Notes 落档
AI 层：南渡 AI 的 RAG 全链路——DashScope text-embedding-v3（1024 维）+ pgvector 向量检索（top-4 召回 + 0.40 相似度阈值）+ DeepSeek V3 生成；System Prompt 强制引用规则与拒答策略；30 题评估集设计并脚本化执行
工程层：Next.js 16 + React 19 + Supabase 全栈——6 角色 RLS 权限在数据库层强制、7 个用户端模块 + 5 类 Admin 后台、完整 Auth 体系（注册 / 登录 / 邮件找回密码）、Leaflet GIS 地图（OSM 实测线路 + WGS84/GCJ-02 坐标系转换）、桌面 / 移动三端响应式
运维层：阿里云东京节点独立部署（nginx + pm2 + Next.js production），实战处理 ICP 备案约束、Google Fonts 被墙导致构建失败等真实问题

Key Decisions

开发资源只有一个人，B 端要专业严谨可管理，C 端要轻量沉浸低门槛——所有决策都是在真实约束下做的取舍：

C 端体验先行、B 端底座同步——冷启动期 B 端只信"成型的平台 + C 端影响力"，资源优先投给可感知体验；但史料元数据结构与 5 部门 Admin 分权从第一天就按机构级标准建
引用回链，一个机制满足两端——AI 回答带 [n] 角标 → 渲染为档案卡片 → 点击直跳原始史料：C 端要"答案可信"，B 端与学术用户要"可溯源"，没有做两套系统
RAG 而非微调——可解释（引用回链的前提）、可维护（新增史料 = 1 次 embedding）、冷启动友好、成本低一个量级；相似度阈值 0.40 在测试集上反复标定：宁可拒答，不可编造
成本结构——DeepSeek V3（中文质量接近 GPT-4o、成本约 1/10）+ DashScope embedding，以 OpenAI 兼容协议接入，换模型是一行配置的事；实测单次对话成本约 $0.001
数据真实性 > 视觉对齐——34 个站点坐标与 OSM 实测线路偏差 5–77 公里，我推翻了已经跑通的"样条硬掰对齐"实现，保留真实偏差并留档说明：考据型产品宁可暴露数据瑕疵，不可制造虚假精确

After

截至 2026 年 5 月底，平台已上线公网（阿里云东京节点），团队多人、多设备、多运营商网络实测可正常注册、登录、浏览与 AI 问答。

平台规模：7 个用户端模块 + 5 类 Admin 后台 + 完整 Auth 体系，三端响应式
数据规模：18 条结构化史料全部向量化、34 个站点、522 点 OSM 实测线路覆盖全线 855 公里
AI 实测（30 题 smoke test，可脚本回归）：域内答案事实准确率 100%（20 题零幻觉）、越界拒答率 95%、首字节延迟 720ms、完整回答平均 3.7 秒
工程细节：京華老宋体本地子集化，首屏字体 4.5MB → 87KB
项目荣誉：入选 2026 年中国国际大学生创新大赛（研究生组）并获奖

如实说明：项目当前处于团队演示与汇报阶段，尚未对公众开放运营。以上是工程质量与 AI 质量数据，不是业务数据——B 端签约与商业化验证是下一阶段的事。

Business Value

市场侧：B 端机构（博物馆 / 档案馆 / 文旅局 / 中小学 / 国企党建）全国超 10 万家，云南本地政企研学与数字化项目年需求测算超 10 亿元；C 端核心客群约 210–230 万人，核心市场年规模测算 2–7 亿元。项目填补的是西南米轨垂直领域数字化平台的空白。

模式侧：变现路径"展示但不深做"——VIP 会员与文创商城完成了入口与体系设计（6 级角色、商品架构），支付闭环留到验证期。对外，这证明商业模式想清楚了；对内，省下的资源全部投给核心体验。砍掉的不是能力，是优先级。

对我个人：它是"1 Person + AI = A Team"的最强证据——产品、AI、工程、运维一个人走通全链路。这是我和大多数转型 PM 的关键差异。

Future State

下一阶段：对公众开放运营，积累真实用户与留存数据；启动 B 端机构合作与商业化验证；持续扩充史料库与评估集（"青藏铁路"相邻领域拒答 case 已列入下一版优化）。

以及三条会带去下一个项目的方法论沉淀：