
整理了一些开题的前置学习内容
面向"预测式拓扑世界模型增强导航系统"的学习路线 本文档整理了完成该课题所需的全部前置知识,按优先级分层,每项附带推荐资料和学习建议。 学习优先级总览 第一优先级:立刻学 1.1 Python 编程 为什么需要: 整个项目的唯一开发语言,所有模块都用 Python 实现。 需要掌握的程度: 熟练使用函数、类、模块化组织代码 熟悉文件读写、JSON/YAML 处理 熟悉虚拟环境管理(conda / venv) 了解类型注解和基本的项目打包…
FIELD_GUIDE
FIELD GUIDE
Use the guide rail to jump between sections.
面向"预测式拓扑世界模型增强导航系统"的学习路线
本文档整理了完成该课题所需的全部前置知识,按优先级分层,每项附带推荐资料和学习建议。
学习优先级总览
第一优先级(立刻学)
├── Python 编程
├── 数据处理(Pandas / NumPy)
├── 图论与 NetworkX
├── 路径规划(A* / Dijkstra)
└── 树模型(LightGBM / XGBoost)
第二优先级(搭仿真时同步学)
├── 句向量与语义检索
├── PyRoboSim
└── 实验设计与评估方法
第三优先级(世界模型训好后学)
├── 概率校准
├── 特征重要性分析
└── 序列模型(GRU / LSTM)
第四优先级(迁移到具身仿真时学)
├── ROS2
├── Nav2
└── Gazebo / Isaac Sim
第五优先级(可选拔高)
├── 图神经网络(GNN)
├── LLM Prompt Engineering
└── 对比学习与句向量微调
第一优先级:立刻学
1.1 Python 编程
为什么需要: 整个项目的唯一开发语言,所有模块都用 Python 实现。
需要掌握的程度:
- 熟练使用函数、类、模块化组织代码
- 熟悉文件读写、JSON/YAML 处理
- 熟悉虚拟环境管理(conda / venv)
- 了解类型注解和基本的项目打包
推荐资料:
| 资料 | 说明 |
|---|---|
| Python 官方教程 | 官方中文教程,适合快速过一遍基础 |
| 《流畅的 Python》(Luciano Ramalho) | 进阶必读,重点看数据模型、迭代器、生成器章节 |
| Real Python | 英文网站,按主题查阅,实用性强 |
学习建议: 如果已有编程基础,重点补 Python 的面向对象和模块化组织,不需要从零学起。
1.2 数据处理:Pandas / NumPy
为什么需要: 日志清洗、特征工程、训练数据构建、结果分析全部依赖这两个库。
需要掌握的程度:
- NumPy:数组操作、广播、随机数生成
- Pandas:DataFrame 增删改查、groupby、merge、时间处理、缺失值处理
- 数据读写:CSV、Parquet、JSON
推荐资料:
| 资料 | 说明 |
|---|---|
| Pandas 官方文档 - 10 Minutes to Pandas | 快速上手,建议先读这个 |
| NumPy 官方教程 | 基础够用 |
| 《利用 Python 进行数据分析》(Wes McKinney) | Pandas 作者写的,系统学习首选 |
| Kaggle Learn - Pandas | 交互式练习,适合边做边学 |
学习建议: 重点掌握 groupby 聚合和 merge 操作,这在构建边事件训练集时会大量使用。
1.3 图论基础与 NetworkX
为什么需要: 语义拓扑图是整个系统的核心中间表示,所有模块都围绕图操作。
需要掌握的程度:
- 图论:节点、边、有向图/无向图、邻接表、图遍历(BFS/DFS)
- NetworkX:建图、查询邻居、添加属性、子图提取、图的序列化
推荐资料:
| 资料 | 说明 |
|---|---|
| NetworkX 官方教程 | 直接从这里开始,边读边写代码 |
| 《算法导论》第 22-25 章 | 图算法经典参考,重点看最短路章节 |
| Visualgo - Graph | 可视化理解 BFS、DFS、Dijkstra、A* |
学习建议: 不需要学很深的图论,重点是会用 NetworkX 建图、查询和添加语义属性。
1.4 路径规划:A* / Dijkstra
为什么需要: 规划器的核心算法,负责在拓扑图上找到代价最低的路径。
需要掌握的程度:
- 理解 Dijkstra 算法原理和实现
- 理解 A* 算法和启发式函数设计
- 理解自定义代价函数的含义(这是研究创新点所在)
推荐资料:
| 资料 | 说明 |
|---|---|
| Red Blob Games - A* 教程 | 最好的可视化 A* 教程,强烈推荐 |
| Red Blob Games - Dijkstra | 同上,Dijkstra 部分 |
NetworkX 内置 shortest_path | 实际开发中可以直接调用 |
学习建议: 先用 Red Blob Games 理解原理,再看 NetworkX 怎么调用。研究创新不在算法本身,而在代价函数的设计。
1.5 树模型:LightGBM / XGBoost
为什么需要: 世界模型 v1 的核心,用来预测边的未来通行时间、阻塞概率和失败风险。
需要掌握的程度:
- 理解决策树和梯度提升的基本原理
- 会用 LightGBM 做回归和分类
- 会做超参搜索(num_leaves、learning_rate、n_estimators)
- 会看特征重要性
- 理解过拟合判断和早停
推荐资料:
| 资料 | 说明 |
|---|---|
| LightGBM 官方文档 | API 参考和参数说明 |
| LightGBM 中文快速入门 | 先跑通一个示例 |
| StatQuest - Gradient Boost 系列 | YouTube 视频,讲解非常直观 |
| Kaggle Learn - Intro to Machine Learning | 交互式练习,覆盖树模型基础 |
| 《机器学习》(周志华)第 4 章 决策树 | 中文教材,理论扎实 |
学习建议: 不需要从数学推导学起,先会调 API 跑通,再回头理解原理。重点关注分类任务的类别不平衡处理。
第二优先级:搭仿真时同步学
2.1 句向量与语义检索
为什么需要: Language Grounding 模块用句向量把用户指令映射到目标节点。
需要掌握的程度:
- 理解 Embedding 的概念
- 会用 Sentence Transformers 加载预训练句向量模型
- 会算余弦相似度做 Top-K 召回
- 了解 bge-m3、gte-multilingual 等中文句向量模型
推荐资料:
| 资料 | 说明 |
|---|---|
| Sentence Transformers 官方文档 | 核心库,直接从这里开始 |
| HuggingFace - bge-m3 模型页 | 推荐使用的中文句向量模型 |
| 什么是 Embedding(OpenAI 博客) | 概念入门 |
| 向量检索入门(Pinecone 教程) | 理解相似度检索的全流程 |
学习建议: 先把 Sentence Transformers 跑通一个最简示例(编码 + 余弦相似度),再套到节点检索场景。
2.2 PyRoboSim
为什么需要: 前期仿真底座,提供房间、导航和任务执行的抽象框架。
需要掌握的程度:
- 会安装和运行 PyRoboSim
- 理解 world、room、robot、navigation 的基本概念
- 会用 YAML 配置定义场景
- 会写 Python 脚本控制 episode 执行
推荐资料:
| 资料 | 说明 |
|---|---|
| PyRoboSim GitHub | 官方仓库,从 README 和示例入手 |
| PyRoboSim 文档 | 官方文档 |
仓库中的 examples/ 目录 | 直接跑示例最快 |
学习建议: 先把官方示例跑通,再在此基础上改成教学楼场景。不需要深入理解其内部实现。
2.3 实验设计与评估方法
为什么需要: 论文的核心说服力来自规范的实验设计和评估。
需要掌握的程度:
- 分类评估:AUROC、AUPRC、F1、混淆矩阵
- 回归评估:MAE、RMSE
- 数据划分:随机切分、按场景切分、按时间切分
- 消融实验设计
- 结果可视化:matplotlib / seaborn 画柱状图、折线图
推荐资料:
| 资料 | 说明 |
|---|---|
| scikit-learn 评估指标文档 | 最全面的指标参考 |
| matplotlib 官方教程 | 画图基础 |
| seaborn 官方教程 | 统计图表更方便 |
| 目标会议/期刊的近期论文 | 看别人怎么组织实验和图表,直接模仿 |
学习建议: 先学会看 AUROC 和 F1,再学画 Reliability Diagram。边做实验边学是最快的。
第三优先级:世界模型训好后学
3.1 概率校准
为什么需要: 世界模型输出的阻塞/失败概率必须校准后,规划器才能合理使用。
需要掌握的程度:
- 理解什么是概率校准(Calibration)
- 会用 Platt Scaling 和 Isotonic Regression
- 会画 Reliability Diagram
- 会计算 ECE(Expected Calibration Error)和 Brier Score
推荐资料:
| 资料 | 说明 |
|---|---|
| scikit-learn - Calibration | 官方文档,含代码示例 |
| Calibration 论文(Guo et al., 2017) | 经典论文,理解现代校准方法 |
| Towards Data Science - Calibration 入门 | 通俗讲解 |
3.2 特征重要性分析
为什么需要: 论文需要解释"世界模型学到了什么",特征重要性是核心证据。
推荐资料:
| 资料 | 说明 |
|---|---|
| LightGBM feature importance | 内置方法 |
| SHAP 官方文档 | 更可解释的特征归因方法 |
| Christoph Molnar - Interpretable ML | 免费在线书,系统讲解可解释性 |
3.3 序列模型:GRU / LSTM(可选)
为什么需要: 世界模型 v2,用历史事件序列做时序预测。
推荐资料:
| 资料 | 说明 |
|---|---|
| PyTorch 官方 RNN 教程 | 入门示例 |
| Colah - Understanding LSTM | 最经典的 LSTM 图解 |
| d2l.ai 第 9 章 | 中文动手学深度学习,RNN 章节 |
学习建议: 只有在树模型已经证明有效、且需要进一步提升时才学。优先级不高。
第四优先级:迁移到具身仿真时学
4.1 ROS2
为什么需要: 具身仿真阶段的机器人通信和系统集成框架。
推荐资料:
| 资料 | 说明 |
|---|---|
| ROS2 官方教程(Humble) | 从 Beginner 教程开始 |
| 鱼香 ROS2 中文教程 | 中文社区,适合入门 |
| The Construct - ROS2 课程 | 在线仿真环境练习 |
4.2 Nav2
为什么需要: ROS2 的导航框架,负责局部路径规划和避障执行。
推荐资料:
| 资料 | 说明 |
|---|---|
| Nav2 官方文档 | 从 Getting Started 开始 |
| Nav2 官方教程 | 跟着做一遍 |
4.3 Gazebo / Isaac Sim
为什么需要: 3D 仿真环境,提供物理引擎和传感器模拟。
推荐资料:
| 资料 | 说明 |
|---|---|
| Gazebo 官方教程 | 开源免费,社区成熟 |
| Isaac Sim 官方文档 | NVIDIA 平台,视觉效果更真实 |
学习建议: 二选一。优先 Gazebo(更轻量、资料更多),除非需要高保真渲染。
第五优先级:可选拔高
5.1 图神经网络(GNN)
用途: 世界模型 v3,建模风险在图上的传播。
| 资料 | 说明 |
|---|---|
| PyG(PyTorch Geometric)官方教程 | 入门首选 |
| 斯坦福 CS224W | 图机器学习课程,有视频和作业 |
| d2l.ai GNN 章节 | 中文参考 |
5.2 LLM Prompt Engineering
用途: 阶段 10,用冻结 LLM 做指令解析和消歧。
| 资料 | 说明 |
|---|---|
| OpenAI Prompt Engineering Guide | 官方指南 |
| 吴恩达 Prompt Engineering 课程 | 免费短课 |
5.3 对比学习与句向量微调
用途: Grounding 第二版,微调句向量提升检索准确率。
| 资料 | 说明 |
|---|---|
| Sentence Transformers - Training | 官方微调教程 |
| Multiple Negatives Ranking Loss 论文 | 推荐的损失函数 |