AI学习路线(详细)

详细进阶版 AI 学习路线表，包含每一个阶段需要掌握的学习重点、推荐工具与学习资源和技能实战

🟩 第一阶段：提示词工程与多模态（攻克“AI 沟通语言”）

1. 📚 学习重点

语义隔离技术：熟练掌握 """、---、#、[] 等 Markdown 符号，学会将「指令区域」与「待处理的数据区域」彻底隔离，防止 AI 逻辑混淆。
少样本提示（Few-Shot）：理解大模型的动态续写本质，学会向 AI 喂养 1-3 个黄金正面范例（正确结构）与反面范例（错误底线），让 AI 的输出质量提升 70% 以上。
负面清单防御：学会通过约束性提示词强行卡死 AI 的输出边界，彻底拔除 AI 自动生成的“机器味”和烂大街的自媒体俗套词汇。
多模态镜头控制：掌握 Midjourney V6 的画面权重语法（::）与精准构图控制；学会使用可灵 (Kling) 或 Sora 等视频工具的提示词，通过文字精准操控画面的“推、拉、摇、移”等镜头语言。

2. 🛠️ 推荐工具与学习资源

大模型工具：ChatGPT (GPT-4o)、Claude 3.5 Sonnet（高级逻辑与写作首选）、DeepSeek-V3（国内极速且高性价比首选）。
多模态绘图/视频：Midjourney V6（商业视觉设计）、Stable Diffusion XL / WebUI（本地深度定制）、即梦 / 可灵 (Kling)（AI 视频首选）。
精选学习资源：Learning Prompt 提示词教程（免费开源的保姆级入门神书）、ChatGPT Prompt Engineering for Developers（吴恩达官方提示词精选课）。

3. 🎯 技能实战：【跨平台自媒体爆款内容矩阵生产线】

实战背景：你手上有一篇 5000 字的硬核行业分析报告（如：新能源汽车行业趋势），你需要一个人在一小时内，将它转化为适合小红书、今日头条的矩阵文案，并配齐短视频分镜脚本与插图。
保姆级操作步骤：
1. 第一步（结构化提取）：使用 BROKE 框架 写一段结构化提示词发给 Claude。给它输入 5000 字报告，限制条件为：“丢弃所有空话套话，仅提取 5 个最具颠覆性的行业数据或观点，并用 Markdown 表格输出。”
2. 第二步（多文风转化）：使用负面清单提示词，命令 AI 基于这 5 个观点一键生成两套文案。要求小红书版前 3 句必须包含痛点、夹杂大量高亮 Emoji，且绝对不能出现“不可否认、众所周知、总而言之”等词汇；头条版则采用多段式标题，正文多用短句，引发评论区情绪共鸣。
3. 第三步（分镜脚本生成）：命令 AI 将头条文案转化为 60 秒短视频分镜脚本，每一行输出格式严格限制为：[镜头序号] - [画面视觉描述 Prompt] - [旁白配音]。
4. 第四步（多模态出片）：复制脚本中的 [画面视觉描述 Prompt]，直接粘贴进可灵 (Kling) 或即梦的文生视频框中，一键批量生成 1080P 高清视频素材。

🟨 第二阶段：智能体与工作流编排（攻克“自动化生产线”）

1. 📚 学习重点

复杂任务解构：学会把一个庞大的商业目标拆成细小的原子节点（如：抓取数据 ➡️ 翻译 ➡️ 提取关键词 ➡️ 排版格式化），防止单次提示词过长导致 AI 遗漏步骤。
意图识别与路由分支（LLM Router）：理解如何利用大模型充当“客服交警”，根据用户输入的关键词自动分流。例如用户说“我想买药”则切流到“医疗知识库”，说“退货”则切流到“售后工作流”。
数据结构化与轻量代码清洗：学会让工作流输出标准的 JSON 格式数据；学会在工作流中穿插使用简易的 Python/JavaScript 节点，用代码执行纯提示词无法 100% 稳定完成的动作（如：删除文本多余空格、自动转换时间格式）。
网络钩子（Webhook）与 API 对接：理解如何利用 Webhook 将 AI 编排好的结果数据无缝推送到第三方日常办公软件（如：飞书、钉钉、Notion）。

2. 🛠️ 推荐工具与学习资源

零代码智能体平台：Coze (扣子)（字节旗下，白嫖各种顶级模型和官方插件，生态极好，小白首选）、Dify（全球开源大热门，国内外企业落地、商业交付首选，必须死磕）。
无代码三方桥梁：Make.com 或 Zapier（用于在各个没有自带插件的独立软件之间传递 AI 数据）。
精选学习资源：Dify 官方配置指南文档（市面上最系统的 Agent 编排实战手册）、Coze 官方社区精选工作流案例库。

3. 🎯 技能实战：【全自动全网竞品情报监控与微信日报推送机器人】

实战背景：老板要求你每天早上 9 点前，监控市场上 10 个主要竞争对手的官网更新，提炼核心变化并做成简报发到公司高管微信群。以前人工做需要 2 小时，现在让 Agent 全自动跑。
保姆级操作步骤：
1. 第一步（创建工作流）：在 Dify 平台新建一个空白的“工作流 (Workflow)”，并配置一个定时触发器（设置为每天早上 8:00 自动运行）。
2. 第二步（配置网络爬虫）：在起点后添加一个“HTTP 请求”或“Web Scraper（网页抓取）”节点，填入竞品官网的 URL，让节点自动捞取该网页最新的 HTML 文本内容。
3. 第三步（大模型清洗与比对）：后面连接一个“LLM (大模型)”节点。在系统提示词中写道：“你是一个严谨的商业分析师。请对比以下 HTML 文本与昨天的文本，找出‘新增产品’、‘价格变动’或‘技术参数调整’，并用标准的 JSON 格式输出。”
4. 第四步（条件分支判断）：添加一个 “IF-ELSE (条件分支)”节点。设置规则：如果大模型判断有更新，走分支 A；如果完全没更新，走分支 B（直接结束任务，不打扰任何人）。
5. 第五步（群聊自动触达）：在分支 A 后面连接一个 “Webhook” 节点，将大模型整理好的精简摘要，自动推送到你的公司企业微信群或钉钉机器人的群聊秘钥链接里。

🟧 第三阶段：RAG 知识库与数据治理（攻克“企业私有资产审查”）

1. 📚 学习重点

知识库规整与清洗：学会识别并清理损坏的 PDF 页面、无意义的扫描件背景文字或乱码，理解“垃圾数据进，垃圾答案出（Garbage in, Garbage out）”的底层数据逻辑。
高级文档切片策略（Chunking）：掌握手动切片技巧。根据文档属性手动选择分段标识符、最大 Token 长度以及设置 10%~20% 的段落重叠度（Overlap），防止一个核心论点在切片时被拦腰斩断导致 AI 断章取义。
混合检索机制（Hybrid Search）：理解并配置“关键词检索（精确匹配专有名词、工号、型号）”与“语义向量检索（理解用户模糊的提问意图）”的 1:1 混合双渠道检索。
重排模型（Reranker）优化：掌握重排原理。当系统检索出前 20 条可能相关的文档碎块后，调用专门的 Rerank 模型进行二次精细化打分，只筛选出最精准的前 3 条喂给 AI 的大前方。
系统防御与提示词硬隔离：利用极其强硬的 System Prompt 卡死 AI 行为，防止用户通过聊天话术诱导 AI 跨越知识库去瞎编。

2. 🛠️ 推荐工具与学习资源

一体化 RAG 平台：Dify 的知识库组件（极其强大，内置各种分段与检索算法）、MaxKB（开源、极适合国内服务器私有化部署）、AnythingLLM（完全在本地电脑运行，数据不出域，隐私安全首选）。
重排模型组件：BGE-Reranker（北京智源开源，中文表现极佳）、Cohere Rerank（海外商业大热门）。
精选学习资源：Hugging Face RAG 深度实战指南、各类向量数据库（如 Milvus / Chroma）的官方技术应用白皮书。

3. 🎯 技能实战：【100% 准确率的企业内部合规与法务审查助理】

实战背景：公司有几百份合同模版、员工手册和财务报销合规文档（全部是 PDF/Word）。员工天天问行政财务各种重复问题，如果 AI 瞎编一个报销流程，就会造成真实的公款财务损失。
保姆级操作步骤：
1. 第一步（数据手工清洗）：收集所有公司文档，删掉文档里的公司无意义水印和空白页，确保文字连续。
2. 第二步（高级切片导入）：将文档上传至 Dify 知识库。选择「高级切片模式」，将分段标识符设为“换行符 \n”，最大 Token 长度设为 500，设置 15% 的段落重叠度（Overlap）。
3. 第三步（配置检索与重排）：在检索设置里，勾选 混合检索 (Hybrid Search)。同时，配置并配置启用 BGE-Reranker 模型，设置 Top-N 为 3（即不管搜出多少段，最后只喂给大模型分值最高、最精准的 3 段）。
4. 第四步（提示词严防死守）：在 System Prompt 提示词中写死绝对防御指令：“你只能根据 {{knowledge_base}} 内的条文回答问题。如果知识库中无法找到匹配内容，你必须礼貌回答：‘抱歉，公司合规库中暂无此项具体规定，请联系人工财务 XX 分机办理’。绝对不允许根据你自身的知识库进行任何逻辑发散和经验猜测！”

🟥 第四阶段：AI 全栈与智能化软件（攻克“商业落地的护城河”）

1. 📚 学习重点

大模型 API 经济学：看懂各大厂商的 API 官方开发文档，理解并调试 Context Window（上下文窗口）、Temperature（随机性/创造力系数）等核心参数，学会根据业务算账（每万 Token 消耗多少钱）。
AI 驱动编程（AI-Driven Coding）：不再去从零死记硬背复杂的编程语法。熟练掌握通过自然语言（大白话）控制 AI 帮你直接在本地电脑上编写、修改并运行整套代码文件的核心技巧。
智能函数调用（Function Calling）：学会调教大模型，让它通过分析用户的聊天文本，自动决定去执行你写好的底层本地计算机系统代码（如：用户说“帮我把电脑静音”，AI 自动生成并调用对应的系统静音代码指令）。

2. 🛠️ 推荐工具与学习资源

AI IDE (代码编辑器)：Cursor 或 Windsurf（当前绝对的编程天花板神器，用自然语言无脑写软件）。
轻量开发生态：Python（掌握基础语法即可）、FastAPI（极其轻量、适合快速搭建后端 API 接口的 Python 框架）。
大模型接口：DeepSeek API（国内性价比之王）、OpenAI / Anthropic API（国际顶尖生态接口）。
精选学习资源：OpenAI API 官方开发者文档（行业标准的 API 说明书）、Cursor 官方实战视频教程。

3. 🎯 技能实战：【基于自然语言控制的智能个人资产记账网页 Web】

实战背景：你不想用市面上那些充斥着开屏广告的记账 APP。你想开发一个自己的网页，只要对它打字或发语音“昨晚在盒马买车厘子花了120块”，系统就能自动解析、归类并帮你记入数据库。
保姆级操作步骤：
1. 第一步（Cursor 零基础建站）：打开 Cursor 编辑器，创建一个空白文件夹。在右侧的 AI 聊天面板中输入大白话命令：“我想用 Python FastAPI 做后端，HTML+Tailwind CSS 做前端，写一个现代感的个人记账网页。请帮我生成基础的项目结构和文件。”
2. 第二步（集成大模型接口）：让 Cursor 在后端代码里，无缝集成 DeepSeek 或 OpenAI 的 API 接口。
3. 第三步（编写 Function Calling 函数调用）：在写给大模型的系统提示词里注入结构化 JSON 约束。告诉 AI：“当用户输入记账话术时，你必须提取出以下变量：{"amount": 浮点数, "category": 字符串, "item": 字符串}。”
4. 第四步（前后端联调测试）：在前端网页设计一个极简的文本输入框。当用户在网页输入“今天打车去公司花了32元”，前端将这句话发送给后端，后端大模型将其精准解析为 {"amount": 32, "category": "交通出行", "item": "打车"}，并由 Python 自动无误地写入本地数据库。
5. 第五步（一键发布）：继续在 Cursor 中提问：“如何将这个网页免费部署到 Vercel 平台上，让我能在手机上随时打开访问？”按照 AI 给出的指令，点击两下即可完成全网发布。

菜单

分享

评论

本周GitHub热门项目推荐

解密 Prompt：10分钟彻底学会如何对 AI 下达“神级指令”

解密 Token：10分钟彻底搞懂大模型的“信息积木”

17个AI名词核心概念全解析

解密 Context Window：10分钟彻底搞懂大模型的“瞬时记忆力”

别再死记硬背公式了！3个法则教你真正驯服AI，写出爆款提示词。

工具导航（持续更新）

2026 个人高效 AI 学习路线图

解密 System Prompt：10分钟彻底搞懂大模型的“底层出厂设定”

走进AI时代：必须了解的10个核心技术名词解析