Skip to content

22.1 人工智能术语与概念

以下全是废话,这里才是人工智能与大模型的精髓:超级无敌大开门. 什么萝卜纸巾?[EB/OL]. (2025-12-21)[2026-05-11]. https://www.bilibili.com/video/BV1Kvq2BiEqT/.

22.1.1 人工智能术语

人工智能(Artificial Intelligence,AI)的研究领域涵盖机器人、语言识别、图像识别、自然语言处理(Natural Language Processing,NLP)和专家系统等,既是计算机科学的分支,也是人文科学的研究对象。1956 年达特茅斯会议上,约翰·麦卡锡首次提出“人工智能”这一概念。

强人工智能(Strong Artificial Intelligence)指能够实现人类全部认知能力的智能机器:它能够真正推理和解决问题,具备知觉与自我意识(Self-awareness)。弱人工智能(Weak Artificial Intelligence)则相反,它依赖人类干预来设定学习算法参数、提供训练数据以确保准确性,只是表面上显得智能,并不真正拥有知觉与自我意识。

自动机(Automaton)是对人类计算行为的模仿,属于语言识别器,用于判定一个对象是否属于某个集合、一个字符串是否属于某种语言。最简单的自动机由一条输入带和一个有限状态控制器组成,有时还会附加一个辅助存储器。

图灵机(Turing Machine)是自动机的增强形式,由一个有限控制器和一条可无限延伸的读写带组成。可计算性理论的基本论题是丘奇-图灵论题(Church-Turing Thesis):如果一个函数能够通过某种算法人工计算,则它在图灵机上必然也是可计算的。

机器学习(Machine Learning,ML)是人工智能的子集。计算机自动分析与综合数据、事实或自身经验以获取知识,其算法专注于从训练数据中学习模式,进而对新数据做出准确 推理(Inference)。机器学习,尤其是深度学习(Deep Learning,DL),是现代 AI 系统的核心技术。

  • 监督学习(Supervised Learning)中,训练样本的期望输出已知,学习目标是预测新样本的输出,典型任务包括分类(Classification)与回归(Regression)。
  • 半监督学习(Semi-supervised Learning)中,学习器自行利用少量带标记样本和大量未标记样本进行学习。
  • 无监督学习(Unsupervised Learning)指学习没有类别标记的样本,旨在发现数据的内在结构,典型任务包括聚类(Clustering)与降维(Dimensionality Reduction):
    • 聚类将未标记样本集合划分为若干簇,使簇内数据比簇间数据更相似;
    • 降维减少所考虑的变量数量,涵盖特征提取(Feature Extraction)与特征选择(Feature Selection)等策略。

自监督学习(Self-supervised Learning)用无监督方法完成通常依赖监督学习的任务。自监督模型不依赖人工标记的数据集,而是从非结构化数据(Unstructured Data)中生成隐式标签。自监督学习包含两类任务:前置任务(Pretext Task)与下游任务(Downstream Task)。在前置任务中,模型学习非结构化数据的有意义表示;这些表示随后可用作下游任务(如监督学习或强化学习(Reinforcement Learning,RL)任务)的输入。将在新任务上复用预训练模型的做法称为“迁移学习(Transfer Learning)”。

自监督学习在计算机视觉(Computer Vision,CV)和自然语言处理等领域尤为重要,后者涵盖自然语言理解(Natural Language Understanding,NLU)、生成及其衍生技术。这些领域需要海量标注数据来训练人工智能模型,而构建标注数据集需耗费大量时间,收集充足数据极为困难。自监督方法更节省时间、更具成本效益,可部分或全部取代人工标注训练数据的环节。

要训练深度学习模型执行分类或回归等高精度任务,必须比较模型对给定输入的输出 预测 与该输入的“正确” 标注,即通常所说的标准答案(Ground Truth)。人工标注的训练数据充当标准答案:这种方法需要直接的人工干预,因此称为“监督”学习。在自监督学习中,任务设计为能够从未标记数据中推断出标准答案。

强化学习是一种将环境状态映射为动作的学习过程,其目标是使动作从环境中获得的累积奖励值最大化。人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)进一步引入人类偏好信号来引导学习方向。强化学习将学习转化为行动:它假设输入数据是相互依赖的元组(Tuple),即有序数据序列,并以“状态-动作-奖励”的形式组织数据。强化学习通过反复试错和奖励函数学习,其诸多应用旨在以正强化模仿现实中的生物学习方式。

与监督学习不同,强化学习不使用标注示例说明何为正确或错误行为:监督学习使用人工标注数据生成 预测 或分类。强化学习也有别于无监督学习:无监督学习从无标记数据中发现隐藏模式,而强化学习以动作为导向。自监督学习基于未标记训练数据导出伪标签(Pseudo Label)作为衡量模型准确性的依据。强化学习则不同,它并非分类方法而是行动学习方法,既不产生伪标签,也不依据标准答案进行度量。

深度学习是一种机器学习方法,也是现代 AI 系统的核心技术。2006 年,Hinton 等人关于深度信念网络的研究推动了深度学习的复兴。深度学习旨在研究信息的最佳表示及其获取方式。在神经网络与信念网络(Belief Network)中,深度学习基于深层结构或网络表示来学习输入-输出映射。

神经网络(Neural Network,NN)是一种模拟人脑结构的非线性系统,由大量人工神经元(Artificial Neuron,即生物神经元的抽象与简化)按照由线路与数学模型定义的拓扑结构互联而成。与传统机器学习中明确定义的数学逻辑不同,深度学习模型的神经网络由多个相互连接的“神经元”层组成,每个神经元执行特定的数学运算。通过调整相邻层神经元之间的连接强度(权重,Weight,与偏置,Bias),网络得以逐步优化并输出更精确的结果。神经网络直到 2000 年代末至 2010 年代初才取得突破性进展。

Transformer 模型擅长处理序列数据。Vaswani 等人 2017 年发表的《Attention is All You Need》首次提出了这一架构。Transformer 架构最初是为替代机器翻译(Machine Translation,MT)中的循环神经网络(Recurrent Neural Network,RNN)序列到序列(Sequence-to-Sequence,Seq2Seq)模型而提出的。此后,Transformer 在机器学习各细分领域均取得了显著进展。

注意力机制(Attention Mechanism)是一种机器学习技术,引导深度学习模型优先关注输入数据中最相关的部分。从数学上看,注意力机制计算出的注意力权重反映了输入序列中每个片段对当前任务的相对重要程度。Transformer 的核心价值在于,自注意力机制(Self-Attention Mechanism)使模型能够在不同时刻“关注”不同词元(Token)。自注意力机制能够计算词元之间的关系与依赖(尤其是文本中相距较远的词元之间的关系),这正是其优势所在。此外,Transformer 架构支持并行化处理,效率远超早期方法。这些特性使 LLM 得以处理前所未有规模的庞大数据集。

生成式人工智能(Generative Artificial Intelligence,GenAI)指具备文本、图像、音频、视频等内容生成能力的模型及相关技术。生成式人工智能依赖复杂的机器学习模型(即深度学习模型,模拟人脑学习和决策过程的算法)。这些模型的工作方式是:识别并编码海量数据中的模式与关系,再利用这些信息理解用户的自然语言请求或问题,生成相关的新内容作为响应。语言模型(Language Model,LM)是自然语言句子或词串的 概率(Probability)分布,依据语言样本 估计(Estimation)得出。

大语言模型(Large Language Model,LLM)是一类经过海量数据训练的基础模型,能够理解和生成自然语言及其他类型的内容以执行各类任务。LLM 的初始训练采用自监督学习。其中,仅使用解码器(Decoder-Only)架构的大语言模型推动了生成式人工智能在当代的发展。典型代表是 GPT(生成式预训练 Transformer)的第三个版本 GPT-3 及其后续改进版本 GPT-3.5,后者直接促成了 OpenAI 于 2022 年 11 月发布 ChatGPT。上下文窗口(Context Window)指模型生成文本时能一次性使用的最大词元数:早期 LLM 的窗口较短,新一代 LLM 已具备数百万词元的上下文窗口。

22.1.2 参考文献

22.1.3 课后习题

  1. 简述强人工智能与弱人工智能的区别。监督学习、无监督学习与强化学习各自适用于什么场景?请各举一例说明。