Administrator
发布于 2026-05-24 / 1 阅读
0
0

AI学习路线(详细)

详细进阶版 AI 学习路线表,包含每一个阶段需要掌握的学习重点、推荐工具与学习资源和技能实战

🟩 第一阶段:提示词工程与多模态(攻克“AI 沟通语言”)

1. 📚 学习重点

  • 语义隔离技术:熟练掌握 """---#[] 等 Markdown 符号,学会将「指令区域」与「待处理的数据区域」彻底隔离,防止 AI 逻辑混淆。

  • 少样本提示(Few-Shot):理解大模型的动态续写本质,学会向 AI 喂养 1-3 个黄金正面范例(正确结构)与反面范例(错误底线),让 AI 的输出质量提升 70% 以上。

  • 负面清单防御:学会通过约束性提示词强行卡死 AI 的输出边界,彻底拔除 AI 自动生成的“机器味”和烂大街的自媒体俗套词汇。

  • 多模态镜头控制:掌握 Midjourney V6 的画面权重语法(::)与精准构图控制;学会使用可灵 (Kling) 或 Sora 等视频工具的提示词,通过文字精准操控画面的“推、拉、摇、移”等镜头语言。

2. 🛠️ 推荐工具与学习资源

  • 大模型工具:ChatGPT (GPT-4o)、Claude 3.5 Sonnet(高级逻辑与写作首选)、DeepSeek-V3(国内极速且高性价比首选)。

  • 多模态绘图/视频:Midjourney V6(商业视觉设计)、Stable Diffusion XL / WebUI(本地深度定制)、即梦 / 可灵 (Kling)(AI 视频首选)。

  • 精选学习资源:Learning Prompt 提示词教程(免费开源的保姆级入门神书)、ChatGPT Prompt Engineering for Developers(吴恩达官方提示词精选课)。

3. 🎯 技能实战:【跨平台自媒体爆款内容矩阵生产线】

  • 实战背景:你手上有一篇 5000 字的硬核行业分析报告(如:新能源汽车行业趋势),你需要一个人在一小时内,将它转化为适合小红书、今日头条的矩阵文案,并配齐短视频分镜脚本与插图。

  • 保姆级操作步骤

    1. 第一步(结构化提取):使用 BROKE 框架 写一段结构化提示词发给 Claude。给它输入 5000 字报告,限制条件为:“丢弃所有空话套话,仅提取 5 个最具颠覆性的行业数据或观点,并用 Markdown 表格输出。”

    2. 第二步(多文风转化):使用负面清单提示词,命令 AI 基于这 5 个观点一键生成两套文案。要求小红书版前 3 句必须包含痛点、夹杂大量高亮 Emoji,且绝对不能出现“不可否认、众所周知、总而言之”等词汇;头条版则采用多段式标题,正文多用短句,引发评论区情绪共鸣。

    3. 第三步(分镜脚本生成):命令 AI 将头条文案转化为 60 秒短视频分镜脚本,每一行输出格式严格限制为:[镜头序号] - [画面视觉描述 Prompt] - [旁白配音]

    4. 第四步(多模态出片):复制脚本中的 [画面视觉描述 Prompt],直接粘贴进可灵 (Kling)即梦的文生视频框中,一键批量生成 1080P 高清视频素材。


🟨 第二阶段:智能体与工作流编排(攻克“自动化生产线”)

1. 📚 学习重点

  • 复杂任务解构:学会把一个庞大的商业目标拆成细小的原子节点(如:抓取数据 ➡️ 翻译 ➡️ 提取关键词 ➡️ 排版格式化),防止单次提示词过长导致 AI 遗漏步骤。

  • 意图识别与路由分支(LLM Router):理解如何利用大模型充当“客服交警”,根据用户输入的关键词自动分流。例如用户说“我想买药”则切流到“医疗知识库”,说“退货”则切流到“售后工作流”。

  • 数据结构化与轻量代码清洗:学会让工作流输出标准的 JSON 格式数据;学会在工作流中穿插使用简易的 Python/JavaScript 节点,用代码执行纯提示词无法 100% 稳定完成的动作(如:删除文本多余空格、自动转换时间格式)。

  • 网络钩子(Webhook)与 API 对接:理解如何利用 Webhook 将 AI 编排好的结果数据无缝推送到第三方日常办公软件(如:飞书、钉钉、Notion)。

2. 🛠️ 推荐工具与学习资源

  • 零代码智能体平台Coze (扣子)(字节旗下,白嫖各种顶级模型和官方插件,生态极好,小白首选)、Dify(全球开源大热门,国内外企业落地、商业交付首选,必须死磕)。

  • 无代码三方桥梁Make.comZapier(用于在各个没有自带插件的独立软件之间传递 AI 数据)。

  • 精选学习资源:Dify 官方配置指南文档(市面上最系统的 Agent 编排实战手册)、Coze 官方社区精选工作流案例库。

3. 🎯 技能实战:【全自动全网竞品情报监控与微信日报推送机器人】

  • 实战背景:老板要求你每天早上 9 点前,监控市场上 10 个主要竞争对手的官网更新,提炼核心变化并做成简报发到公司高管微信群。以前人工做需要 2 小时,现在让 Agent 全自动跑。

  • 保姆级操作步骤

    1. 第一步(创建工作流):在 Dify 平台新建一个空白的“工作流 (Workflow)”,并配置一个定时触发器(设置为每天早上 8:00 自动运行)。

    2. 第二步(配置网络爬虫):在起点后添加一个“HTTP 请求”或“Web Scraper(网页抓取)”节点,填入竞品官网的 URL,让节点自动捞取该网页最新的 HTML 文本内容。

    3. 第三步(大模型清洗与比对):后面连接一个“LLM (大模型)”节点。在系统提示词中写道:“你是一个严谨的商业分析师。请对比以下 HTML 文本与昨天的文本,找出‘新增产品’、‘价格变动’或‘技术参数调整’,并用标准的 JSON 格式输出。”

    4. 第四步(条件分支判断):添加一个 “IF-ELSE (条件分支)”节点。设置规则:如果大模型判断有更新,走分支 A;如果完全没更新,走分支 B(直接结束任务,不打扰任何人)。

    5. 第五步(群聊自动触达):在分支 A 后面连接一个 “Webhook” 节点,将大模型整理好的精简摘要,自动推送到你的公司企业微信群或钉钉机器人的群聊秘钥链接里。


🟧 第三阶段:RAG 知识库与数据治理(攻克“企业私有资产审查”)

1. 📚 学习重点

  • 知识库规整与清洗:学会识别并清理损坏的 PDF 页面、无意义的扫描件背景文字或乱码,理解“垃圾数据进,垃圾答案出(Garbage in, Garbage out)”的底层数据逻辑。

  • 高级文档切片策略(Chunking):掌握手动切片技巧。根据文档属性手动选择分段标识符、最大 Token 长度以及设置 10%~20% 的段落重叠度(Overlap),防止一个核心论点在切片时被拦腰斩断导致 AI 断章取义。

  • 混合检索机制(Hybrid Search):理解并配置“关键词检索(精确匹配专有名词、工号、型号)”与“语义向量检索(理解用户模糊的提问意图)”的 1:1 混合双渠道检索。

  • 重排模型(Reranker)优化:掌握重排原理。当系统检索出前 20 条可能相关的文档碎块后,调用专门的 Rerank 模型进行二次精细化打分,只筛选出最精准的前 3 条喂给 AI 的大前方。

  • 系统防御与提示词硬隔离:利用极其强硬的 System Prompt 卡死 AI 行为,防止用户通过聊天话术诱导 AI 跨越知识库去瞎编。

2. 🛠️ 推荐工具与学习资源

  • 一体化 RAG 平台:Dify 的知识库组件(极其强大,内置各种分段与检索算法)、MaxKB(开源、极适合国内服务器私有化部署)、AnythingLLM(完全在本地电脑运行,数据不出域,隐私安全首选)。

  • 重排模型组件BGE-Reranker(北京智源开源,中文表现极佳)、Cohere Rerank(海外商业大热门)。

  • 精选学习资源:Hugging Face RAG 深度实战指南、各类向量数据库(如 Milvus / Chroma)的官方技术应用白皮书。

3. 🎯 技能实战:【100% 准确率的企业内部合规与法务审查助理】

  • 实战背景:公司有几百份合同模版、员工手册和财务报销合规文档(全部是 PDF/Word)。员工天天问行政财务各种重复问题,如果 AI 瞎编一个报销流程,就会造成真实的公款财务损失。

  • 保姆级操作步骤

    1. 第一步(数据手工清洗):收集所有公司文档,删掉文档里的公司无意义水印和空白页,确保文字连续。

    2. 第二步(高级切片导入):将文档上传至 Dify 知识库。选择「高级切片模式」,将分段标识符设为“换行符 \n”,最大 Token 长度设为 500,设置 15% 的段落重叠度(Overlap)。

    3. 第三步(配置检索与重排):在检索设置里,勾选 混合检索 (Hybrid Search)。同时,配置并配置启用 BGE-Reranker 模型,设置 Top-N 为 3(即不管搜出多少段,最后只喂给大模型分值最高、最精准的 3 段)。

    4. 第四步(提示词严防死守):在 System Prompt 提示词中写死绝对防御指令:“你只能根据 {{knowledge_base}} 内的条文回答问题。如果知识库中无法找到匹配内容,你必须礼貌回答:‘抱歉,公司合规库中暂无此项具体规定,请联系人工财务 XX 分机办理’。绝对不允许根据你自身的知识库进行任何逻辑发散和经验猜测!”


🟥 第四阶段:AI 全栈与智能化软件(攻克“商业落地的护城河”)

1. 📚 学习重点

  • 大模型 API 经济学:看懂各大厂商的 API 官方开发文档,理解并调试 Context Window(上下文窗口)、Temperature(随机性/创造力系数)等核心参数,学会根据业务算账(每万 Token 消耗多少钱)。

  • AI 驱动编程(AI-Driven Coding):不再去从零死记硬背复杂的编程语法。熟练掌握通过自然语言(大白话)控制 AI 帮你直接在本地电脑上编写、修改并运行整套代码文件的核心技巧。

  • 智能函数调用(Function Calling):学会调教大模型,让它通过分析用户的聊天文本,自动决定去执行你写好的底层本地计算机系统代码(如:用户说“帮我把电脑静音”,AI 自动生成并调用对应的系统静音代码指令)。

2. 🛠️ 推荐工具与学习资源

  • AI IDE (代码编辑器)CursorWindsurf(当前绝对的编程天花板神器,用自然语言无脑写软件)。

  • 轻量开发生态:Python(掌握基础语法即可)、FastAPI(极其轻量、适合快速搭建后端 API 接口的 Python 框架)。

  • 大模型接口:DeepSeek API(国内性价比之王)、OpenAI / Anthropic API(国际顶尖生态接口)。

  • 精选学习资源:OpenAI API 官方开发者文档(行业标准的 API 说明书)、Cursor 官方实战视频教程。

3. 🎯 技能实战:【基于自然语言控制的智能个人资产记账网页 Web】

  • 实战背景:你不想用市面上那些充斥着开屏广告的记账 APP。你想开发一个自己的网页,只要对它打字或发语音“昨晚在盒马买车厘子花了120块”,系统就能自动解析、归类并帮你记入数据库。

  • 保姆级操作步骤

    1. 第一步(Cursor 零基础建站):打开 Cursor 编辑器,创建一个空白文件夹。在右侧的 AI 聊天面板中输入大白话命令:“我想用 Python FastAPI 做后端,HTML+Tailwind CSS 做前端,写一个现代感的个人记账网页。请帮我生成基础的项目结构和文件。”

    2. 第二步(集成大模型接口):让 Cursor 在后端代码里,无缝集成 DeepSeek 或 OpenAI 的 API 接口。

    3. 第三步(编写 Function Calling 函数调用):在写给大模型的系统提示词里注入结构化 JSON 约束。告诉 AI:“当用户输入记账话术时,你必须提取出以下变量:{"amount": 浮点数, "category": 字符串, "item": 字符串}。”

    4. 第四步(前后端联调测试):在前端网页设计一个极简的文本输入框。当用户在网页输入“今天打车去公司花了32元”,前端将这句话发送给后端,后端大模型将其精准解析为 {"amount": 32, "category": "交通出行", "item": "打车"},并由 Python 自动无误地写入本地数据库。

    5. 第五步(一键发布):继续在 Cursor 中提问:“如何将这个网页免费部署到 Vercel 平台上,让我能在手机上随时打开访问?”按照 AI 给出的指令,点击两下即可完成全网发布。




评论