
收入突破 5 万,从大专生到大模型开发-第二篇(上)
大家好,我是明聪,98 年,湖北荆州人,毕业武汉某职校。
·
第二篇(上):零基础转型大模型——我的5个月学习地图
大家好,我是明聪,98 年逆袭的大模型研发工程师,前 Java 转型幸存者,湖北荆州人,毕业武汉某职校。
二)大模型
2023-2024:抓住大模型红利,逆风翻盘
- 破局关键:2023 年底被公司劝退后,咬牙自学大模型项目,5 个月从零学起。
- 结果爆发:2024 年手握 3 个 Offer,入职 AI 直播公司,负责 AI 工具开发,脱离 Java 内卷圈!
2023 年年底接触到大模型,历经好几个月的学习和实践,终于于 2024 年下半年找工作,公司是做海外电商 AI 直播赋能的。但当时的老板是大厂产品出身,对自身和身边人要求很高,后续因个人原因不满足老板的要求,试用期被劝退,又重新找工作,直到现在这家公司做 AI 抖音短视频直播赋能,比如我最近在做的工作,智能投流和模型之间互相对话:模型分析直播间最新数据,自动优化预算,出价,ROI +投放策略,可以实时调节直播间预算,出价等数据,减少运营,人工成本。
1、大模型是什么?普通人如何快速上手?
大模型 = 数字时代的“超级大脑” 想象一下:一个能同时阅读全球所有图书馆书籍的 AI,不仅能帮你写文案、做设计,还能分析直播间数据、自动优化广告投放策略——这就是大模型的威力!
大模型发展简史
- 1950 年 -2010 年:神经网络萌芽,但算力不足,AI 像个“学渣”
- 2017 年:谷歌推出 Transformer(大模型的核心架构),AI 开始“开挂”
- 2022 年:OpenAI 发布 GPT-3.5,ChatGPT 一夜爆红
- 2023 年:OpenAI 发布 GPT-4.0,ChatGPT 再度引爆话题
- 2024 年:GPT-4o 横空出世,多模态 AI 全面爆发
2、零基础转型大模型:我的学习地图
入门必学:从 Python 到项目实战
- Python 基础:每天 1 小时,15 天速成
- 零基础学 Python 的野路子:
- 工具实测: 放弃复杂的 PyCharm,直接用 VSCode+Jupyter Notebook,搭配 Codecademy 的交互式练习(每天 30 分钟),重点是先跑通代码再看理论;
- 实战脚本: 每天写 1 个能解决实际问题的脚本,比如:
- 用 os 库批量重命名 1000 个文件;
- 用 pandas 自动整理 Excel 表格;
- 踩坑实录:
- 缩进或代码报错:用 ChatGPT 截图提问(输入报错信息+代码截图),5 分钟解决;
- 环境配置:改用 Cursor(比 VS Code 智能 10 倍!),输入“写一个 Python 爬虫”直接生成可运行代码;”
阶段 1:撕掉恐惧(第 1-2 周)
- 目标: 用 ChatGPT 解决 3 个实际需求,证明‘AI 不是魔法’
- 必做动作:
- 让 AI 写周报:输入‘我是 Java 开发,本周修复 3 个 Bug,参加 2 次需求评审,生成领导爱看的周报’;
- 用 AI 改简历:上传旧简历,命令‘突出 Java 转 AI 优势,用 STAR 法则重写项目经历’;
- 向 AI 提问:‘大模型应用开发需要学什么?’保存回答。
- 避坑提示: 新手别碰算法!企业要的是‘会用 AI 的工人’,不是‘懂反向传播的科学家’。”
- 心态: 那周用 ChatGPT 生成了一份周报文档,被领导夸‘效率高’,突然意识到:AI 不是高深技术,而是趁手工具,把我想写的一些观点,表达的东西以及注意事项,让 AI 更多的去修改,修饰,比我自己写的强多了。
阶段 2:实战期(第 3-12 周)
- 目标: Chat 三范式:Prompt,Rag,Agent。
- 动作: 学习各种关于模型的知识,海内外模型的接口文档调用,prompt 调用以及结构化的尝试,基础的 Rag 由哪几种部分组成,拆解案例及 Demo 尝试,代码实现的 Agent 和用框架写的 Agent。
- 工具包: 本地调试用 Postman 测 API,代码管理用 GitHub Desktop。
- 成果: 对于 Chat 三范式,有了一个基础的认知,知道是什么,能做什么,由哪些小功能组成的,能实现一些小的功能。
阶段 3:项目期(第 12-20 周)
- 目标: 用项目反哺理论,针对性补缺,写一个 Rag 项目和 Agent 项目,学习各种框架和开源平台的使用,简化开发时间成本。
- 动作: 选择“智能客服”作为突破口,用 Dify 搭建最小可行性产品(MVP),用 AutoGPT 做营销智能体。
- 踩坑记录: 第一次本地部署 Rag , Agent ,Milvus 数据库 和 Mysql 数据库时,因内存不足崩溃,最后加了一根 8G 的内存条。
- 工具包: 本地调试用 Postman 测 API,代码管理用 GitHub Desktop(避免命令行劝退)。
- 成果: 体验到了完整的项目从 0 到 1 经历,让业务形成闭环,对于项目流程有了一定的心得。
阶段 4:求职期
- 目标: 找到一份满意的工作。
- 动作: 行动起来,修改简历,准备复习知识点,记录一些必要代码逻辑,疑难点。
- 初期:开始投递几份简历试试水,主要约一到二个面试,看看别人公司问什么,面试前可以准备手机录音,回家后,好好复盘总结下,包括回答好的问题,回答的不好的问题,面试官更看重什么,以备下次面试准备更充分。
- 中期:可以开始加大每天投递简历的力度,从十几份到五十份不等,保证一周不低于三五个面试机会,每天晚上花一个小时进行面试复盘,此时,对于大模型面试已经有了一定的经验和自己的面试心得,取长补短,再接再厉。
- 后期:疯狂海投,Boss 每天投满,至少有了一个 Offer,可以慢慢少投点,至少要有一个中意的 Offer 和一个普通的 Offer,不着急的话,可以再等等,然后可以逐步考虑是否入职了。
- 秘籍: 想象自己没有退路,只能勇往直前向前冲,冲就完事了,及时跟自己充电,吃点好的,多跟别人分享,释放压力。
核心内容(划重点!) :
- Prompt 工程:让 AI 听懂“人话”的关键(例:5 句话生成爆款直播间脚本)。
- RAG 与 Agent:企业级应用的核心技术
- 多模态与模型微调:面试必备加分项
核心技能 get√
- Prompt 设置秘诀:原来和 AI 说话要像指挥实习生,得明确说"你现在是营养师,用表格形式..."
- 智能客服搭建:教我们把公司产品资料喂给 AI,现在能回答 80%常见问题,更深层次可以结合企业业务并调用 Function Calling 接口,让模型可以实现一些基础的业务逻辑
- 多 AI 智能体协作超酷:让 3 个 AI 角色分工合作,一个查资料、一个写方案、一个检查错误,应用范畴更加广泛,简单点来说,就是定义模型为不同的角色,可单智能体单一的工作逻辑,多智能体,协同合作分工,堪比一个小团队,每个智能体完成不同的工作
更多推荐
所有评论(0)