BACK_TO_BASE
整理了一些开题的前置学习内容
Engineering Notebook // Build Log
/
22:10:10
/
NOTEBOOK_ENTRY

整理了一些开题的前置学习内容

面向"预测式拓扑世界模型增强导航系统"的学习路线 本文档整理了完成该课题所需的全部前置知识,按优先级分层,每项附带推荐资料和学习建议。 学习优先级总览 第一优先级:立刻学 1.1 Python 编程 为什么需要: 整个项目的唯一开发语言,所有模块都用 Python 实现。 需要掌握的程度: 熟练使用函数、类、模块化组织代码 熟悉文件读写、JSON/YAML 处理 熟悉虚拟环境管理(conda / venv) 了解类型注解和基本的项目打包…

Notebook Time
4 min
Image Frames
1
View Tracks
65
AI
FIELD_GUIDE

FIELD GUIDE

Use the guide rail to jump between sections.

面向"预测式拓扑世界模型增强导航系统"的学习路线

本文档整理了完成该课题所需的全部前置知识,按优先级分层,每项附带推荐资料和学习建议。


学习优先级总览

第一优先级(立刻学)
  ├── Python 编程
  ├── 数据处理(Pandas / NumPy)
  ├── 图论与 NetworkX
  ├── 路径规划(A* / Dijkstra)
  └── 树模型(LightGBM / XGBoost)

第二优先级(搭仿真时同步学)
  ├── 句向量与语义检索
  ├── PyRoboSim
  └── 实验设计与评估方法

第三优先级(世界模型训好后学)
  ├── 概率校准
  ├── 特征重要性分析
  └── 序列模型(GRU / LSTM)

第四优先级(迁移到具身仿真时学)
  ├── ROS2
  ├── Nav2
  └── Gazebo / Isaac Sim

第五优先级(可选拔高)
  ├── 图神经网络(GNN)
  ├── LLM Prompt Engineering
  └── 对比学习与句向量微调

第一优先级:立刻学

1.1 Python 编程

为什么需要: 整个项目的唯一开发语言,所有模块都用 Python 实现。

需要掌握的程度:

  • 熟练使用函数、类、模块化组织代码
  • 熟悉文件读写、JSON/YAML 处理
  • 熟悉虚拟环境管理(conda / venv)
  • 了解类型注解和基本的项目打包

推荐资料:

资料说明
Python 官方教程官方中文教程,适合快速过一遍基础
《流畅的 Python》(Luciano Ramalho)进阶必读,重点看数据模型、迭代器、生成器章节
Real Python英文网站,按主题查阅,实用性强

学习建议: 如果已有编程基础,重点补 Python 的面向对象和模块化组织,不需要从零学起。


1.2 数据处理:Pandas / NumPy

为什么需要: 日志清洗、特征工程、训练数据构建、结果分析全部依赖这两个库。

需要掌握的程度:

  • NumPy:数组操作、广播、随机数生成
  • Pandas:DataFrame 增删改查、groupby、merge、时间处理、缺失值处理
  • 数据读写:CSV、Parquet、JSON

推荐资料:

资料说明
Pandas 官方文档 - 10 Minutes to Pandas快速上手,建议先读这个
NumPy 官方教程基础够用
《利用 Python 进行数据分析》(Wes McKinney)Pandas 作者写的,系统学习首选
Kaggle Learn - Pandas交互式练习,适合边做边学

学习建议: 重点掌握 groupby 聚合和 merge 操作,这在构建边事件训练集时会大量使用。


1.3 图论基础与 NetworkX

为什么需要: 语义拓扑图是整个系统的核心中间表示,所有模块都围绕图操作。

需要掌握的程度:

  • 图论:节点、边、有向图/无向图、邻接表、图遍历(BFS/DFS)
  • NetworkX:建图、查询邻居、添加属性、子图提取、图的序列化

推荐资料:

资料说明
NetworkX 官方教程直接从这里开始,边读边写代码
《算法导论》第 22-25 章图算法经典参考,重点看最短路章节
Visualgo - Graph可视化理解 BFS、DFS、Dijkstra、A*

学习建议: 不需要学很深的图论,重点是会用 NetworkX 建图、查询和添加语义属性。


1.4 路径规划:A* / Dijkstra

为什么需要: 规划器的核心算法,负责在拓扑图上找到代价最低的路径。

需要掌握的程度:

  • 理解 Dijkstra 算法原理和实现
  • 理解 A* 算法和启发式函数设计
  • 理解自定义代价函数的含义(这是研究创新点所在)

推荐资料:

资料说明
Red Blob Games - A* 教程最好的可视化 A* 教程,强烈推荐
Red Blob Games - Dijkstra同上,Dijkstra 部分
NetworkX 内置 shortest_path实际开发中可以直接调用

学习建议: 先用 Red Blob Games 理解原理,再看 NetworkX 怎么调用。研究创新不在算法本身,而在代价函数的设计。


1.5 树模型:LightGBM / XGBoost

为什么需要: 世界模型 v1 的核心,用来预测边的未来通行时间、阻塞概率和失败风险。

需要掌握的程度:

  • 理解决策树和梯度提升的基本原理
  • 会用 LightGBM 做回归和分类
  • 会做超参搜索(num_leaves、learning_rate、n_estimators)
  • 会看特征重要性
  • 理解过拟合判断和早停

推荐资料:

资料说明
LightGBM 官方文档API 参考和参数说明
LightGBM 中文快速入门先跑通一个示例
StatQuest - Gradient Boost 系列YouTube 视频,讲解非常直观
Kaggle Learn - Intro to Machine Learning交互式练习,覆盖树模型基础
《机器学习》(周志华)第 4 章 决策树中文教材,理论扎实

学习建议: 不需要从数学推导学起,先会调 API 跑通,再回头理解原理。重点关注分类任务的类别不平衡处理。


第二优先级:搭仿真时同步学

2.1 句向量与语义检索

为什么需要: Language Grounding 模块用句向量把用户指令映射到目标节点。

需要掌握的程度:

  • 理解 Embedding 的概念
  • 会用 Sentence Transformers 加载预训练句向量模型
  • 会算余弦相似度做 Top-K 召回
  • 了解 bge-m3、gte-multilingual 等中文句向量模型

推荐资料:

资料说明
Sentence Transformers 官方文档核心库,直接从这里开始
HuggingFace - bge-m3 模型页推荐使用的中文句向量模型
什么是 Embedding(OpenAI 博客)概念入门
向量检索入门(Pinecone 教程)理解相似度检索的全流程

学习建议: 先把 Sentence Transformers 跑通一个最简示例(编码 + 余弦相似度),再套到节点检索场景。


2.2 PyRoboSim

为什么需要: 前期仿真底座,提供房间、导航和任务执行的抽象框架。

需要掌握的程度:

  • 会安装和运行 PyRoboSim
  • 理解 world、room、robot、navigation 的基本概念
  • 会用 YAML 配置定义场景
  • 会写 Python 脚本控制 episode 执行

推荐资料:

资料说明
PyRoboSim GitHub官方仓库,从 README 和示例入手
PyRoboSim 文档官方文档
仓库中的 examples/ 目录直接跑示例最快

学习建议: 先把官方示例跑通,再在此基础上改成教学楼场景。不需要深入理解其内部实现。


2.3 实验设计与评估方法

为什么需要: 论文的核心说服力来自规范的实验设计和评估。

需要掌握的程度:

  • 分类评估:AUROC、AUPRC、F1、混淆矩阵
  • 回归评估:MAE、RMSE
  • 数据划分:随机切分、按场景切分、按时间切分
  • 消融实验设计
  • 结果可视化:matplotlib / seaborn 画柱状图、折线图

推荐资料:

资料说明
scikit-learn 评估指标文档最全面的指标参考
matplotlib 官方教程画图基础
seaborn 官方教程统计图表更方便
目标会议/期刊的近期论文看别人怎么组织实验和图表,直接模仿

学习建议: 先学会看 AUROC 和 F1,再学画 Reliability Diagram。边做实验边学是最快的。


第三优先级:世界模型训好后学

3.1 概率校准

为什么需要: 世界模型输出的阻塞/失败概率必须校准后,规划器才能合理使用。

需要掌握的程度:

  • 理解什么是概率校准(Calibration)
  • 会用 Platt Scaling 和 Isotonic Regression
  • 会画 Reliability Diagram
  • 会计算 ECE(Expected Calibration Error)和 Brier Score

推荐资料:

资料说明
scikit-learn - Calibration官方文档,含代码示例
Calibration 论文(Guo et al., 2017)经典论文,理解现代校准方法
Towards Data Science - Calibration 入门通俗讲解

3.2 特征重要性分析

为什么需要: 论文需要解释"世界模型学到了什么",特征重要性是核心证据。

推荐资料:

资料说明
LightGBM feature importance内置方法
SHAP 官方文档更可解释的特征归因方法
Christoph Molnar - Interpretable ML免费在线书,系统讲解可解释性

3.3 序列模型:GRU / LSTM(可选)

为什么需要: 世界模型 v2,用历史事件序列做时序预测。

推荐资料:

资料说明
PyTorch 官方 RNN 教程入门示例
Colah - Understanding LSTM最经典的 LSTM 图解
d2l.ai 第 9 章中文动手学深度学习,RNN 章节

学习建议: 只有在树模型已经证明有效、且需要进一步提升时才学。优先级不高。


第四优先级:迁移到具身仿真时学

4.1 ROS2

为什么需要: 具身仿真阶段的机器人通信和系统集成框架。

推荐资料:

资料说明
ROS2 官方教程(Humble)从 Beginner 教程开始
鱼香 ROS2 中文教程中文社区,适合入门
The Construct - ROS2 课程在线仿真环境练习

4.2 Nav2

为什么需要: ROS2 的导航框架,负责局部路径规划和避障执行。

推荐资料:

资料说明
Nav2 官方文档从 Getting Started 开始
Nav2 官方教程跟着做一遍

4.3 Gazebo / Isaac Sim

为什么需要: 3D 仿真环境,提供物理引擎和传感器模拟。

推荐资料:

资料说明
Gazebo 官方教程开源免费,社区成熟
Isaac Sim 官方文档NVIDIA 平台,视觉效果更真实

学习建议: 二选一。优先 Gazebo(更轻量、资料更多),除非需要高保真渲染。


第五优先级:可选拔高

5.1 图神经网络(GNN)

用途: 世界模型 v3,建模风险在图上的传播。

资料说明
PyG(PyTorch Geometric)官方教程入门首选
斯坦福 CS224W图机器学习课程,有视频和作业
d2l.ai GNN 章节中文参考

5.2 LLM Prompt Engineering

用途: 阶段 10,用冻结 LLM 做指令解析和消歧。

资料说明
OpenAI Prompt Engineering Guide官方指南
吴恩达 Prompt Engineering 课程免费短课

5.3 对比学习与句向量微调

用途: Grounding 第二版,微调句向量提升检索准确率。

资料说明
Sentence Transformers - Training官方微调教程
Multiple Negatives Ranking Loss 论文推荐的损失函数