AI周报：技术面试卷出新高度，Agent落地开启“工具觉醒”时代

发布于：2025-06-25 ⋅ 阅读:(358) ⋅ 点赞:(0)

一句话暴论：当面试官要求手搓FP16精度时，真正的考题是“你能否在硅基文明觉醒前跟上进化速度”。

一、面试地狱难度实录（开发者生存指南）

百度二面手搓FP16精度：考的不是浮点数，而是对硬件底层的敬畏（原文）
腾讯夺命11连问：混元大模型面试暴露行业真相——懂原理已不够，得会调参、训推、修故障的“全栈炼丹师”（解析)
NVIDIA四轮拷打实录：GPU厂面试竟考Attention优化！Lighting Attention核心破局点：用KV分块+动态稀疏，把显存带宽压榨到极限（解读）
阿里淘天终面翻车现场：大厂终面转向“场景实战题”，产品思维成为新门槛（血泪史）

面试官潜台词：2025年的AI工程师，得是“算法+工程+硬件”的三体人。

二、训练技术：卷效率还是卷规模？

RLVR：多模态后训练框架刷新认知——用强化学习教MLLM“看图推理”，泛化性能↑10%（论文）
微调争议：99%企业不该碰微调？数据质量不足时，微调=灾难性遗忘加速器（反常识）
显存压榨术：梯度检查点+LoRA量化，6B模型单卡可训（调参指南）

暴论：Scaling Law没失效，但 穷人玩家请走“小模型+精调”的猥琐发育路线。

三、模型战场：Qwen3 vs DeepSeek vs MiniMax

Qwen3嵌入模型揭秘：为什么全行业用RoPE？旋转位置编码成LLM长文本标配（数学之美)
MiniMax开源M1模型：3万字长文生成吊打Gemini，用混合注意力实现性价比逆袭（实测)
GraphRAG杀疯了：清华DO-RAG用Agentic CoT让领域问答效果飙升33%，知识图谱+RAG=专业领域核武器（技术报告)

⚡️ 关键进展：多模态RAG进入“双线索时代”（文本+结构信息并行处理），SimpleDoc项目证明： 表格/代码类数据必须AST解析（代码分块技术)。

四、Agent革命：MCP协议开启“工具主动调用”纪元

MCP-Zero省98%算力：让Agent学会说“我要查数据库”，而不是傻等人类指令（范式颠覆)
爆款应用链：
- Office-PowerPoint-MCP：一句话生成PPT并实时编辑（Demo)
- 小说Agent：1小时产出30万字网文，网文作者集体转型“AI监工”（争议)

安全警报：Karpathy坦言Agent攻击无解！六大防护模式紧急上线（防御指南)

创业者警告：别碰通用智能体！ 垂直场景Data Agent才是摇钱树（金融/工业/运维场景已跑通）。

五、争议与反思

RAG必要吗？ Google用“选择性生成框架”让RAG准确率↑10%，但轻量任务Agent直接开干更高效（实验)
Infra断代之争：AI Infra工程师在重构基础设施——传统分布式架构正被MoE+KV缓存分块技术颠覆（讨论)
Karpathy炸场演讲：AI是终极操作系统，程序员转型“AI行为设计师”（金句)

彩蛋：本周最惨技术人

腾讯实习生把显存搞炸了——原因竟是忘关FlashAttention的deterministic模式（事故报告)

教训： 跑大模型前默念三遍“开deterministic=找死”。

面试

面试题：解释下minimax中lighting attention的由来
面试题：解释下minimax中lighting attention的由来
面试题：pretrain和test阶段的scaling law的资源分配策略区别是啥？
百度二面要我手搓FP16精度，差点跪了...
腾讯混元大模型面试：夺命11连问
腾讯混元大模型面试：夺命11连问
NVIDIA面经：四轮“拷打”实录
(51 封私信 / 90 条消息) 大模型面试 - 知乎
拒绝AI“一本正经地胡说八道”：我用三版Prompt驯服RAG模型的实战复盘

训练技术

多模态 LLM RLVR 引入后训练框架！显著提升MLLM推理与泛化
多模态 LLM RLVR 引入后训练框架！显著提升MLLM推理与泛化
新突破！大模型强化预训练RPT来袭
【大模型微调】5.调参经验总结与显存占用因素探究
大模型微调，为什么99%的企业都不应该碰这个坑？

聊聊模型

Qwen3 嵌入模型和重排序模型解读
RAG+：通过应用感知推理增强RAG系统
最新125种多模态大模型技术全面综述
Agentic CoT驱动，清华DO-RAG领域问答性能飙升33%，远超FastGPT、Dify
GraphRAG提速新思路E^2GraphRAG及DeepResearch Bench评估结果
GraphRAG遇上DeepResearch：有趣的FusionGraphRAG项目推介
多模态RAG前沿速读：三看SimpleDoc双线索实现思路
表格RAG项目解读：一个过滤+澄清补充的数据工程式思路
代码类型的RAG做chunk切分怎么做？兼看改进AST方案
Qwen和DeepSeek为什么都用RoPE？
多模态通用感知大模型的技术演进与应用探索
通俗易懂的总结！RL for LLM本质理解
深入解析多模态大模型推理技术的最新发展
Fast-dLLM技术解析：分块KV缓存与置信度感知并行解码技术
GitHub新晋“天花板”：企业级RAG引擎RAGFlow，Star飙升5.6万！ - 今日头条
多模态RAG前沿速读：三看SimpleDoc双线索实现思路
Qwen3 Embedding模型架构、训练方法、数据策略
不需要 RAG！手把手教你构建问答 Agent（只需 30 分钟）
Google | 溯源分析RAG系统错误，提出选择性生成框架，让RAG问答准确率提升10%
剖析 LLM Agent 定义及返回结构体定义
快速理解热门LLM大语言模型
鹅厂实习生血泪贴：Agent/RAG黑科技，真相竟是这样！
智能体应用最佳组合，一台主机同时部署Dify和RAGFlow全流程避坑指南 | 实操保姆级记录
超越Gemini和Qwen！3B小模型横扫中英文文档识别，表格公式识别提升超15%
AFFiNE：一款开源的下一代知识库，将结构化写作、可视化创作、任务管理、知识图谱四大核心能力熔于一炉

Agent

MCP-Zero重塑工具调用范式：让Agent学会“主动要”，而不是被动等“喂”，可省下98%算力！
MCP：AI界的“Type-C”——让AI模型和世界对话从此“零代沟”！
Agent 前沿速递：生态、协作与上下文的关键演进
Office-PowerPoint-MCP-Server：通过 AI 助手直接创建编辑 PPT
用Agent挖掘AI人才！DINQ AI人才引擎：不错过每一个AI Talent
MiniMax M1开源：一口生成3万字吊打Gemini，智能体性价比完胜DeepSeek？ - 今日头条
阿星：小说智能体发布，一小时30万字，3000万网文作者怎么办？
【深度】MCP + Cline + A2A + n8n + KAG 金融领域投资管理最佳实践 - 今日头条
精|知识探索新范式：深度研究Deep Research智能体全面综述，系统、方法与应用
别搞通用智能体，落地赚钱才是王道
Data Agent：未来企业的“数据大脑”
AI Agent 在角色扮演场景的研究进展
MCP技术浪潮中的Agent应用开发新范式
Sping Ai 接入 Mysql MCP 智能查询数据
Spring Ai 接入Office Word MCP 智能改稿
如何使用 Agno 构建一个基础的 AI 智能体？
六个安全Agent设计模式：有效防止Prompt注入攻击
MCP很好，但它不是万灵药！真正的技术进步，往往始于祛魅之后的清醒认知
万字长文深入浅出教你优雅开发复杂AI Agent
Figma 推出官方 MCP，真正做到了所见即所得
即将淘汰80%普通人的7项AI技能：1、提示词工程；2、AI设计；3、AI智能体；4、工作流自动化
Andrej Karpathy：对于AI Agent的安全风险，我也束手无策
「运维版Cursor」首发亮相！终结命令行地狱，Agent解放双手
工业AI Agent落地难？且看研华硬核破局之道
Cursor-Agent 实战：构建端到端自动化取数工具的探索与思考
从概念到落地：有赞 Agent 应用与探索

RAG

一文了解dify实现智能分析助手的三种方式
硬核进化！BISHENG 1.3.0 发布：用实力，定义企业级知识库的“好用”

未分类

AI Infra 和传统 Infra 断代了吗？聊聊 Infra “三大难题”，以及其中的关联
最新总结，不同抽取任务哪个模型最能打
最新开源工具：实测提升PDF六大能力！
0%通过率！Code神话泡沫！LiveCodeBench Pro发布！
少说‘Wait’，多做题：NoWait重塑大模型推理路径
如何凭大模型权重就能逆向大模型训练数据
EasyRec 推荐算法训练推理优化
再思考文档解析最新趋势方案及7类真实场景下文档解析Badcase记录
MiniMax发布开源模型M1，性能直逼Gemini 2.5 Pro
Gemini 2.5家族正式发布，聊一聊谷歌大模型的帕累托最优路线
Karpathy YC演讲终极解码：AI即操作系统，产品即“钢铁侠战衣”
AI Infra和传统Infra，区别在哪？
穷人版verl 671B GPRO跑通（亲测可行）
新来的实习生又双叒把显存搞炸了...
阿里淘天大模型终面：麻了，真的麻了！
大模型推理太慢？分布式部署搞定！
11Labs 增长负责人：搞营销要学着做视频，但创始人出镜会有点自恋
对话 ClackyAI 李亚飞：「套壳」之上还有厚度，数据闭环没那么重要
罗永浩：梁文锋建议我「靠嘴吃饭」，我想做个播客帮助科技创业者
新的OCR模型 MonkeyOCR-3B
MiniMax-M1：全球首个开源权重的大规模混合注意力推理模型，专为处理长输入和复杂任务而生
Gemini 2.5 技术报告
unsloth制作了一份关于大模型强化学习的完整指南
在CloudMatrix 384超节点上部署 DeepSeek 的报告
让小爱音箱可播放任何想听的歌曲，还支持语音控制和本地音乐文件播放
持续学习的 python 文本分类器——adaptive-classifier
MistralAI新模型：Mistral-Small-3.2-24B-Instruct-2506
TransMLA｜GQA/MHA转MLA获得10倍推理加速
月之暗面发布了 Kimi-Researcher
从公式到代码！一文梳理RLHF发展历程
多模型融合的系数到底应该是多少？
海报设计神器！字节开源CreatiDesign，拿下平面设计新SOTA！ - 今日头条
介绍一个适合企业和单位使用文档管理系统TEEDY - 今日头条
EasyRec 推荐算法训练推理优化
DPO与GRPO谁更胜一筹？港中文、北大等发布首个系统性对比研究 - 今日头条
Andrej Karpathy 爆火演讲刷屏技术圈：AI 开启软件 3.0，重写一切的时代来了！ - 今日头条
足球小编走天下：全国房价跌幅榜震惊到我了。
阿里淘天大模型终面：麻了，真的麻了！
OpenHands：替代开发者修改代码、运行命令、浏览网页、调用API - 今日头条
Transformer联手Diffusion！Soul开源AI生图新范式！
编程神器Cursor终于更新到正式版，最新系统提示词来了！
装备类企业的AI战略发展浅析
AI时代的生存-什么让我们脱颖而出？
工业大模型定义及技术架构
"过时的?"提示词工程
AI时代，从“数据可视化”到“数据可视听化”
Automa-RPA实现京东商品自动搜索
一个人提升最快的方式:经验知识化
AI的落地难题、应用案例和生产率悖论
大模型工程化：从“实验玩具”到“应用落地”的关键突破口
放弃国企工作，创办一人企业：我一定能用AI挣到钱！丨AI转型访谈录
提示词工程：从原理、实践到未来——一部系统性综述
「一人干掉整个市场部」| 对谈 Head AI 创始人 Kay
官宣|Zilliz Cloud 建表功能大升级，更多检索类型支持，更低成本
PDF文档解析--MinerU
AI越强，Prompt越没用？恰恰相反，不懂这些你将被淘汰
刚上线的大模型应用，为什么总是出现报错？
基于Perplexica与内网穿透工具的本地AI搜索服务远程访问实践过程
AI识图，提取标题、点赞等数据，哪家效果好？
Prompt Design 不只是写一句话给AI
搭建AI知识库踩了37个坑，血泪总结这套避雷手册
我把Prompt优化效果从2.8分提到4.7分，只用了这套“工程化”流程
AI的认知象限：浅谈一下我们与AI的边界
AI在人力资源管理中九个方面的成功应用及案例
知识库检索匹配的服务化实践
从模板到指标服务：解锁AI时代的数据新可能
Al代码审查实践：从构想到快速落地
AI智能地址识别实践：小帅的优化日记