一句话暴论:当面试官要求手搓FP16精度时,真正的考题是“你能否在硅基文明觉醒前跟上进化速度”。
一、面试地狱难度实录(开发者生存指南)
- 百度二面手搓FP16精度:考的不是浮点数,而是对硬件底层的敬畏(原文)
- 腾讯夺命11连问:混元大模型面试暴露行业真相——懂原理已不够,得会调参、训推、修故障的“全栈炼丹师”(解析)
- NVIDIA四轮拷打实录:GPU厂面试竟考Attention优化!Lighting Attention核心破局点:用KV分块+动态稀疏,把显存带宽压榨到极限(解读)
- 阿里淘天终面翻车现场:大厂终面转向“场景实战题”,产品思维成为新门槛(血泪史)
面试官潜台词:2025年的AI工程师,得是“算法+工程+硬件”的三体人。
二、训练技术:卷效率还是卷规模?
- RLVR:多模态后训练框架刷新认知——用强化学习教MLLM“看图推理”,泛化性能↑10%(论文)
- 微调争议:99%企业不该碰微调?数据质量不足时,微调=灾难性遗忘加速器(反常识)
- 显存压榨术:梯度检查点+LoRA量化,6B模型单卡可训(调参指南)
暴论:Scaling Law没失效,但 穷人玩家请走“小模型+精调”的猥琐发育路线。
三、模型战场:Qwen3 vs DeepSeek vs MiniMax
- Qwen3嵌入模型揭秘:为什么全行业用RoPE?旋转位置编码成LLM长文本标配(数学之美)
- MiniMax开源M1模型:3万字长文生成吊打Gemini,用混合注意力实现性价比逆袭(实测)
- GraphRAG杀疯了:清华DO-RAG用Agentic CoT让领域问答效果飙升33%,知识图谱+RAG=专业领域核武器(技术报告)
⚡️ 关键进展:多模态RAG进入“双线索时代”(文本+结构信息并行处理),SimpleDoc项目证明: 表格/代码类数据必须AST解析( 代码分块技术)。
四、Agent革命:MCP协议开启“工具主动调用”纪元
- MCP-Zero省98%算力:让Agent学会说“我要查数据库”,而不是傻等人类指令(范式颠覆)
- 爆款应用链:
- 安全警报:Karpathy坦言Agent攻击无解!六大防护模式紧急上线(防御指南)
创业者警告:别碰通用智能体! 垂直场景Data Agent才是摇钱树(金融/工业/运维场景已跑通)。
五、争议与反思
- RAG必要吗? Google用“选择性生成框架”让RAG准确率↑10%,但轻量任务Agent直接开干更高效(实验)
- Infra断代之争:AI Infra工程师在重构基础设施——传统分布式架构正被MoE+KV缓存分块技术颠覆(讨论)
- Karpathy炸场演讲:AI是终极操作系统,程序员转型“AI行为设计师”(金句)
彩蛋:本周最惨技术人
腾讯实习生把显存搞炸了——原因竟是忘关FlashAttention的deterministic模式(事故报告)
教训: 跑大模型前默念三遍“开deterministic=找死”。
面试
- 面试题:解释下minimax中lighting attention的由来
- 面试题:解释下minimax中lighting attention的由来
- 面试题:pretrain和test阶段的scaling law的资源分配策略区别是啥?
- 百度二面要我手搓FP16精度,差点跪了...
- 腾讯混元大模型面试:夺命11连问
- 腾讯混元大模型面试:夺命11连问
- NVIDIA面经:四轮“拷打”实录
- (51 封私信 / 90 条消息) 大模型面试 - 知乎
- 拒绝AI“一本正经地胡说八道”:我用三版Prompt驯服RAG模型的实战复盘
训练技术
- 多模态 LLM RLVR 引入后训练框架!显著提升MLLM推理与泛化
- 多模态 LLM RLVR 引入后训练框架!显著提升MLLM推理与泛化
- 新突破!大模型强化预训练RPT来袭
- 【大模型微调】5.调参经验总结与显存占用因素探究
- 大模型微调,为什么99%的企业都不应该碰这个坑?
聊聊模型
- Qwen3 嵌入模型和重排序模型解读
- RAG+:通过应用感知推理增强RAG系统
- 最新125种多模态大模型技术全面综述
- Agentic CoT驱动,清华DO-RAG领域问答性能飙升33%,远超FastGPT、Dify
- GraphRAG提速新思路E^2GraphRAG及DeepResearch Bench评估结果
- GraphRAG遇上DeepResearch:有趣的FusionGraphRAG项目推介
- 多模态RAG前沿速读:三看SimpleDoc双线索实现思路
- 表格RAG项目解读:一个过滤+澄清补充的数据工程式思路
- 代码类型的RAG做chunk切分怎么做?兼看改进AST方案
- Qwen和DeepSeek为什么都用RoPE?
- 多模态通用感知大模型的技术演进与应用探索
- 通俗易懂的总结!RL for LLM本质理解
- 深入解析多模态大模型推理技术的最新发展
- Fast-dLLM技术解析:分块KV缓存与置信度感知并行解码技术
- GitHub新晋“天花板”:企业级RAG引擎RAGFlow,Star飙升5.6万! - 今日头条
- 多模态RAG前沿速读:三看SimpleDoc双线索实现思路
- Qwen3 Embedding模型架构、训练方法、数据策略
- 不需要 RAG!手把手教你构建问答 Agent(只需 30 分钟)
- Google | 溯源分析RAG系统错误,提出选择性生成框架,让RAG问答准确率提升10%
- 剖析 LLM Agent 定义及返回结构体定义
- 快速理解热门LLM大语言模型
- 鹅厂实习生血泪贴:Agent/RAG黑科技,真相竟是这样!
- 智能体应用最佳组合,一台主机同时部署Dify和RAGFlow全流程避坑指南 | 实操保姆级记录
- 超越Gemini和Qwen!3B小模型横扫中英文文档识别,表格公式识别提升超15%
- AFFiNE:一款开源的下一代知识库,将结构化写作、可视化创作、任务管理、知识图谱四大核心能力熔于一炉
Agent
- MCP-Zero重塑工具调用范式:让Agent学会“主动要”,而不是被动等“喂”,可省下98%算力!
- MCP:AI界的“Type-C”——让AI模型和世界对话从此“零代沟”!
- Agent 前沿速递:生态、协作与上下文的关键演进
- Office-PowerPoint-MCP-Server:通过 AI 助手直接创建编辑 PPT
- 用Agent挖掘AI人才!DINQ AI人才引擎:不错过每一个AI Talent
- MiniMax M1开源:一口生成3万字吊打Gemini,智能体性价比完胜DeepSeek? - 今日头条
- 阿星:小说智能体发布,一小时30万字,3000万网文作者怎么办?
- 【深度】MCP + Cline + A2A + n8n + KAG 金融领域投资管理最佳实践 - 今日头条
- 精|知识探索新范式:深度研究Deep Research智能体全面综述,系统、方法与应用
- 别搞通用智能体,落地赚钱才是王道
- Data Agent:未来企业的“数据大脑”
- AI Agent 在角色扮演场景的研究进展
- MCP技术浪潮中的Agent应用开发新范式
- Sping Ai 接入 Mysql MCP 智能查询数据
- Spring Ai 接入Office Word MCP 智能改稿
- 如何使用 Agno 构建一个基础的 AI 智能体?
- 六个安全Agent设计模式:有效防止Prompt注入攻击
- MCP很好,但它不是万灵药!真正的技术进步,往往始于祛魅之后的清醒认知
- 万字长文深入浅出教你优雅开发复杂AI Agent
- Figma 推出官方 MCP,真正做到了所见即所得
- 即将淘汰80%普通人的7项AI技能:1、提示词工程;2、AI设计;3、AI智能体;4、工作流自动化
- Andrej Karpathy:对于AI Agent的安全风险,我也束手无策
- 「运维版Cursor」首发亮相!终结命令行地狱,Agent解放双手
- 工业AI Agent落地难?且看研华硬核破局之道
- Cursor-Agent 实战:构建端到端自动化取数工具的探索与思考
- 从概念到落地:有赞 Agent 应用与探索
RAG
未分类
- AI Infra 和传统 Infra 断代了吗?聊聊 Infra “三大难题”,以及其中的关联
- 最新总结,不同抽取任务哪个模型最能打
- 最新开源工具:实测提升PDF六大能力!
- 0%通过率!Code神话泡沫!LiveCodeBench Pro发布!
- 少说‘Wait’,多做题:NoWait重塑大模型推理路径
- 如何凭大模型权重就能逆向大模型训练数据
- EasyRec 推荐算法训练推理优化
- 再思考文档解析最新趋势方案及7类真实场景下文档解析Badcase记录
- MiniMax发布开源模型M1,性能直逼Gemini 2.5 Pro
- Gemini 2.5家族正式发布,聊一聊谷歌大模型的帕累托最优路线
- Karpathy YC演讲终极解码:AI即操作系统,产品即“钢铁侠战衣”
- AI Infra和传统Infra,区别在哪?
- 穷人版verl 671B GPRO跑通(亲测可行)
- 新来的实习生又双叒把显存搞炸了...
- 阿里淘天大模型终面:麻了,真的麻了!
- 大模型推理太慢?分布式部署搞定!
- 11Labs 增长负责人:搞营销要学着做视频,但创始人出镜会有点自恋
- 对话 ClackyAI 李亚飞:「套壳」之上还有厚度,数据闭环没那么重要
- 罗永浩:梁文锋建议我「靠嘴吃饭」,我想做个播客帮助科技创业者
- 新的OCR模型 MonkeyOCR-3B
- MiniMax-M1:全球首个开源权重的大规模混合注意力推理模型,专为处理长输入和复杂任务而生
- Gemini 2.5 技术报告
- unsloth制作了一份关于大模型强化学习的完整指南
- 在CloudMatrix 384超节点上部署 DeepSeek 的报告
- 让小爱音箱可播放任何想听的歌曲,还支持语音控制和本地音乐文件播放
- 持续学习的 python 文本分类器——adaptive-classifier
- MistralAI新模型:Mistral-Small-3.2-24B-Instruct-2506
- TransMLA|GQA/MHA转MLA获得10倍推理加速
- 月之暗面发布了 Kimi-Researcher
- 从公式到代码!一文梳理RLHF发展历程
- 多模型融合的系数到底应该是多少?
- 海报设计神器!字节开源CreatiDesign,拿下平面设计新SOTA! - 今日头条
- 介绍一个适合企业和单位使用文档管理系统TEEDY - 今日头条
- EasyRec 推荐算法训练推理优化
- DPO与GRPO谁更胜一筹?港中文、北大等发布首个系统性对比研究 - 今日头条
- Andrej Karpathy 爆火演讲刷屏技术圈:AI 开启软件 3.0,重写一切的时代来了! - 今日头条
- 足球小编走天下:全国房价跌幅榜震惊到我了。
- 阿里淘天大模型终面:麻了,真的麻了!
- OpenHands:替代开发者修改代码、运行命令、浏览网页、调用API - 今日头条
- Transformer联手Diffusion!Soul开源AI生图新范式!
- 编程神器Cursor终于更新到正式版,最新系统提示词来了!
- 装备类企业的AI战略发展浅析
- AI时代的生存-什么让我们脱颖而出?
- 工业大模型定义及技术架构
- "过时的?"提示词工程
- AI时代,从“数据可视化”到“数据可视听化”
- Automa-RPA实现京东商品自动搜索
- 一个人提升最快的方式:经验知识化
- AI的落地难题、应用案例和生产率悖论
- 大模型工程化:从“实验玩具”到“应用落地”的关键突破口
- 放弃国企工作,创办一人企业:我一定能用AI挣到钱!丨AI转型访谈录
- 提示词工程:从原理、实践到未来——一部系统性综述
- 「一人干掉整个市场部」| 对谈 Head AI 创始人 Kay
- 官宣|Zilliz Cloud 建表功能大升级,更多检索类型支持,更低成本
- PDF文档解析--MinerU
- AI越强,Prompt越没用?恰恰相反,不懂这些你将被淘汰
- 刚上线的大模型应用,为什么总是出现报错?
- 基于Perplexica与内网穿透工具的本地AI搜索服务远程访问实践过程
- AI识图,提取标题、点赞等数据,哪家效果好?
- Prompt Design 不只是写一句话给AI
- 搭建AI知识库踩了37个坑,血泪总结这套避雷手册
- 我把Prompt优化效果从2.8分提到4.7分,只用了这套“工程化”流程
- AI的认知象限:浅谈一下我们与AI的边界
- AI在人力资源管理中九个方面的成功应用及案例
- 知识库检索匹配的服务化实践
- 从模板到指标服务:解锁AI时代的数据新可能
- Al代码审查实践:从构想到快速落地
- AI智能地址识别实践:小帅的优化日记