收入突破 5 万，从大专生到大模型开发-第二篇（上）

大家好，我是明聪，98 年，湖北荆州人，毕业武汉某职校。

spring_guoke

940人浏览 · 2025-03-15 00:19:51

spring_guoke · 2025-03-15 00:19:51 发布

第二篇（上）：零基础转型大模型——我的5个月学习地图

大家好，我是明聪，98 年逆袭的大模型研发工程师，前 Java 转型幸存者，湖北荆州人，毕业武汉某职校。

二）大模型

2023-2024：抓住大模型红利，逆风翻盘

破局关键：2023 年底被公司劝退后，咬牙自学大模型项目，5 个月从零学起。
结果爆发：2024 年手握 3 个 Offer，入职 AI 直播公司，负责 AI 工具开发，脱离 Java 内卷圈！

2023 年年底接触到大模型，历经好几个月的学习和实践，终于于 2024 年下半年找工作，公司是做海外电商 AI 直播赋能的。但当时的老板是大厂产品出身，对自身和身边人要求很高，后续因个人原因不满足老板的要求，试用期被劝退，又重新找工作，直到现在这家公司做 AI 抖音短视频直播赋能，比如我最近在做的工作，智能投流和模型之间互相对话：模型分析直播间最新数据，自动优化预算，出价，ROI +投放策略，可以实时调节直播间预算，出价等数据，减少运营，人工成本。

1、大模型是什么？普通人如何快速上手？

大模型 = 数字时代的“超级大脑” 想象一下：一个能同时阅读全球所有图书馆书籍的 AI，不仅能帮你写文案、做设计，还能分析直播间数据、自动优化广告投放策略——这就是大模型的威力！

大模型发展简史

1950 年 -2010 年：神经网络萌芽，但算力不足，AI 像个“学渣”
2017 年：谷歌推出 Transformer（大模型的核心架构），AI 开始“开挂”
2022 年：OpenAI 发布 GPT-3.5，ChatGPT 一夜爆红
2023 年：OpenAI 发布 GPT-4.0，ChatGPT 再度引爆话题
2024 年：GPT-4o 横空出世，多模态 AI 全面爆发

2、零基础转型大模型：我的学习地图

入门必学：从 Python 到项目实战

Python 基础：每天 1 小时，15 天速成
- 零基础学 Python 的野路子：
工具实测： 放弃复杂的 PyCharm，直接用 VSCode+Jupyter Notebook，搭配 Codecademy 的交互式练习（每天 30 分钟），重点是先跑通代码再看理论；
实战脚本： 每天写 1 个能解决实际问题的脚本，比如：
- 用 os 库批量重命名 1000 个文件；
- 用 pandas 自动整理 Excel 表格；
踩坑实录：
- 缩进或代码报错：用 ChatGPT 截图提问（输入报错信息+代码截图），5 分钟解决；
- 环境配置：改用 Cursor（比 VS Code 智能 10 倍！），输入“写一个 Python 爬虫”直接生成可运行代码；”

阶段 1：撕掉恐惧（第 1-2 周）

目标： 用 ChatGPT 解决 3 个实际需求，证明‘AI 不是魔法’
必做动作：
- 让 AI 写周报：输入‘我是 Java 开发，本周修复 3 个 Bug，参加 2 次需求评审，生成领导爱看的周报’；
- 用 AI 改简历：上传旧简历，命令‘突出 Java 转 AI 优势，用 STAR 法则重写项目经历’；
- 向 AI 提问：‘大模型应用开发需要学什么？’保存回答。
避坑提示： 新手别碰算法！企业要的是‘会用 AI 的工人’，不是‘懂反向传播的科学家’。”
心态： 那周用 ChatGPT 生成了一份周报文档，被领导夸‘效率高’，突然意识到：AI 不是高深技术，而是趁手工具，把我想写的一些观点，表达的东西以及注意事项，让 AI 更多的去修改，修饰，比我自己写的强多了。

阶段 2：实战期（第 3-12 周）

目标： Chat 三范式：Prompt，Rag，Agent。
动作： 学习各种关于模型的知识，海内外模型的接口文档调用，prompt 调用以及结构化的尝试，基础的 Rag 由哪几种部分组成，拆解案例及 Demo 尝试，代码实现的 Agent 和用框架写的 Agent。
工具包： 本地调试用 Postman 测 API，代码管理用 GitHub Desktop。
成果： 对于 Chat 三范式，有了一个基础的认知，知道是什么，能做什么，由哪些小功能组成的，能实现一些小的功能。

阶段 3：项目期（第 12-20 周）

目标： 用项目反哺理论，针对性补缺，写一个 Rag 项目和 Agent 项目，学习各种框架和开源平台的使用，简化开发时间成本。
动作： 选择“智能客服”作为突破口，用 Dify 搭建最小可行性产品（MVP），用 AutoGPT 做营销智能体。
踩坑记录： 第一次本地部署 Rag ， Agent ，Milvus 数据库和 Mysql 数据库时，因内存不足崩溃，最后加了一根 8G 的内存条。
工具包： 本地调试用 Postman 测 API，代码管理用 GitHub Desktop（避免命令行劝退）。
成果： 体验到了完整的项目从 0 到 1 经历，让业务形成闭环，对于项目流程有了一定的心得。

阶段 4：求职期

目标： 找到一份满意的工作。
动作： 行动起来，修改简历，准备复习知识点，记录一些必要代码逻辑，疑难点。
初期：开始投递几份简历试试水，主要约一到二个面试，看看别人公司问什么，面试前可以准备手机录音，回家后，好好复盘总结下，包括回答好的问题，回答的不好的问题，面试官更看重什么，以备下次面试准备更充分。
中期：可以开始加大每天投递简历的力度，从十几份到五十份不等，保证一周不低于三五个面试机会，每天晚上花一个小时进行面试复盘，此时，对于大模型面试已经有了一定的经验和自己的面试心得，取长补短，再接再厉。
后期：疯狂海投，Boss 每天投满，至少有了一个 Offer，可以慢慢少投点，至少要有一个中意的 Offer 和一个普通的 Offer，不着急的话，可以再等等，然后可以逐步考虑是否入职了。
秘籍： 想象自己没有退路，只能勇往直前向前冲，冲就完事了，及时跟自己充电，吃点好的，多跟别人分享，释放压力。

核心内容（划重点！) :

Prompt 工程：让 AI 听懂“人话”的关键（例：5 句话生成爆款直播间脚本）。
RAG 与 Agent：企业级应用的核心技术
多模态与模型微调：面试必备加分项

核心技能 get√

Prompt 设置秘诀：原来和 AI 说话要像指挥实习生，得明确说"你现在是营养师，用表格形式..."
智能客服搭建：教我们把公司产品资料喂给 AI，现在能回答 80%常见问题，更深层次可以结合企业业务并调用 Function Calling 接口，让模型可以实现一些基础的业务逻辑
多 AI 智能体协作超酷：让 3 个 AI 角色分工合作，一个查资料、一个写方案、一个检查错误，应用范畴更加广泛，简单点来说，就是定义模型为不同的角色，可单智能体单一的工作逻辑，多智能体，协同合作分工，堪比一个小团队，每个智能体完成不同的工作