[原创]怎么新概念这么多？带你速通 ai 智能体时代的常见概念

#1 楼主 2026-06-01 21:09:16

前言置身于 2026 年的计算机行业，不管是哪个方向，都不可避免地要主动拥抱 ai 带给整个行业的变化。最初我自己在尝试接触如何将 ai 应用到实际的工作流程中时，被铺面而来的新概念英文词，比如 llm、prompt 等汇绕得手足无措，但实际去了解过后才发现，作为 ai 原住民的我们，往往已经习惯的操作就是这些概念的学术表达，理解起来非常容易，并不是一个高深莫测的领域。故有此总结性质的文章。
这篇文章并不会从人工智能专业的角度出发，深入了解许多专业的概念，而是作为安全方向的学习者角度，在解决我实际的工程性问题时，常用到的 ai 概念以及操作到底是什么，打通底层逻辑。如有不全与理解误差，欢迎积极交流纠正，不胜感激。LLM 全称Large Language Model，大语言模型，简称大模型或模型。我们平时刷到的 “xx 公司推出新模型”，在网页端与 ai 进行对话时进行模型的选择，以及使用 ai 编程软件中选择的模型，全部都是在聊 LLM 这个概念。
先用最好理解的方式讲讲大模型的工作原理是什么样的。我们日常在 ai 窗口与他进行对话时，可以注意到他常常是一段一段文字形式输出的答案，很像我们打字输出文本的状态。但 ai 的思考方式与我们的大脑是截然不同的，ai 回答的本质是一个“文字接龙”游戏，他的答案是基于“最初的问题”+“输出答案”来进行下一个词的预测，以此类推输出一段完整的回复。具体的例子可以观看参考视频的讲解从 LLM 到 Agent Skill，一期视频带你打通底层逻辑！衔接刚才对大模型回答方式的案例，当我们提问“你是谁？”的时候，ai 作出回答“我是人工智能”。对于他的回答方式我们大概了解了他是一段一段输出的答案。那么这个提到的一段一段就是这里要介绍的概念“token”。
token 是 LLM 中最小的处理单位，但 1 token 并不是一个英文字母，也不是一个中文汉字，而是按照特定的规则，将这些可能出现的词对应为具体的数字。
我们在对大模型进行提问时，首先会通过使用Tokenizer分词器的组件，将一段话分为碎片化的 token。比如刚才提到的“你是谁？” 我们在 openai 官网的Tokenizer 换算网站中就可以查看这些词他对应的 token 是什么。Tokenizer可以看到分词器并没有把一个汉字或者一个单词作为 1 token，上面的图片中，我们可以看到两个汉字对应 1 token，以及一个英文单词helpful对应 2 token 的情况出现。除此之外，不同模型的 token 也是不同的，他们往往对应一套不同的规则，就算是同一家的模型迭代，可以看到“是谁”从 4 代的 3 token 优化为了 1 token。往往随着模型的升级，对 token 的理解能力也有进一步的增强与节约。最近一段时间，token 也是正式被官方命名为“词元”，可以说在人工智能领域，不亚于计算机中“字节”概念的基本单元概念了。我们常听到“我使用的模型又消耗了多少 token”，每次提到 token 就和消耗离不开关系，几乎所有 API 都按 token 算钱，输入 token 和输出 token 单价还不一样。你贴一个 10 万行的反编译结果进去，可能就是几美金出去了。衔接刚才提到的 token 概念，我们在对大模型提问的过程中，为什么我们前几轮提示他的内容，在后续的提问中他还是能记住呢？这就是 context 在发力。中文翻译“上下文”很容易理解他的作用，就是为了让只有短期记忆的大模型可以知道前面的内容在聊什么，方便后续的沟通进一步回答。
但是 context 并不是一个无限制的上下文，每个模型都有自己的“上下文窗口”Context Window，单位是 token。超过这个数，要么报错、要么被静默截断、要么触发某种压缩机制。对话越久，上下文越长，越贵、越慢、越容易"忘事"。
除了提到的对话历史， context 的内容主要还有用户问题、当前输出、工具列表和 System prompt 等概念。prompt 并没有非常高深难理解，Prompt 就是你给 LLM 的输入指令。最常见的提示词就是你对 ai 的提问。直观理解，提示词越精致、越详细，输出答案也就一定更精准优质。之前还有像"提示词工程（Prompt Engineering）"这个方向，本质上就是学会怎么把话给 ai 讲清楚。
对 prompt 的具体分类大致如下：user prompt（用户提示词）、system prompt（系统提示词）。前者就是我们对 ai 的每一轮提问，后者就是提前在系统中给 ai 设定的身份，比如“你是一位资深的安卓逆向工程师，你熟悉···”等等，我们往往可以套用一些优质的提示词，来提高输出的质量，下面两个网站就收录了一些优质的提示词。268K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6H3M7X3!0E0M7s2b7I4x3U0y4Q4x3X3g2U0L8W2)9J5c8R3`.`.
487K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6%4N6%4N6Q4x3X3g2S2K9i4y4Z5L8%4u0@1i4K6u0W2N6r3!0H3此外在提示词方面，如果你提前告诉了大模型几个 "输入-输出" 示例，他们的答案就会输出相似的内容，这个叫Few-shot；相对没有这样的示例叫做Zero-shot。让模型"一步一步想"。加一句"请先分析步骤，再给出结论"，复杂推理准确率会明显提升，这个叫做Chain-of-Thought（CoT，思维链）思考这样的场景，我们像 ai 提问，今天上海的天气是什么样的。基于推测回答问题的大模型，他的知识库只局限于训练时的某个固定时间点，并不能做这样事实的回答。Tool（工具）就是给 LLM 装上的"手脚"，让它能主动调用外部能力。
技术上这个机制通常叫 Function Calling 或 Tool Use：你提前告诉 LLM "我这里有这些工具、每个工具需要什么参数"，LLM 在回答时如果判断需要用某个工具，就输出一个结构化的"工具调用请求"，由外部程序执行并把结果返回给它，然后它基于结果继续回答。2024 年 Anthropic 推出的 Model Context Protocol（MCP）在这两年已经成了事实标准。你可以把它理解成 LLM 领域的 USB-C：不管什么工具、什么模型，大家都按同一套协议对接，就不用每个模型每个工具都重新写一遍适配。
在逆向工程方向，常用的 mcp 就是 ida-pro-mcp 以及 jadx-mcp 这样的反编译工具的 mcp，结合我们本地的 agent 可以很好的做到逆向分析工作。MCP 的主要结构有：Host、Client、Server你真正在用的那个应用程序，比如 Claude Desktop、Cursor、Claude Code、VS Code 的某个 AI 插件。Host 是用户直接打交道的界面，负责 orchestrate 整个流程。Host 内部负责与 MCP Server 通信的组件。一个 Host 可以同时连接多个 Server，每个连接对应一个 Client

...(已截断)

---
来源: 看雪论坛
原文链接: https://bbs.kanxue.com/thread-290876.htm

#2 2026-06-01 21:09:16

#3 2026-06-01 21:09:16

好总结

#4 2026-06-01 21:09:16

好总结666

#5 2026-06-01 21:09:16

好总结

#6 2026-06-01 21:09:16

学习一下

#7 2026-06-01 21:09:16

学习

#8 2026-06-01 21:09:16

好总结

#9 2026-06-01 21:09:16

感谢科普了.真的是原创吗?

#10 2026-06-01 21:09:16

学习一下