【入门科普】必了解的 20 个 AI 术语解析（上）

李文杰 2024-03-28 10:44:22

本文专为非技术背景的AI爱好者设计，旨在深入浅出地介绍AI的基础概念和关键技术，从最基础的逻辑回归到复杂的Transformer模型，带您一步步解锁AI技术的奥秘。

一、逻辑回归

如果你想通过人工智能判断某人是否会患糖尿病，则逻辑回归可以通过综合分析用户的年龄、体重、胰岛素水平等等来给出一个0~1的概率值，如果阈值设定为0.7，则高于0.7的我们就归类为高风险人群，以便更早期的干预和管理风险。

二、线性回归

逻辑回归解决的是0到1的概率问题，而很多时候是我们需要具体的值，比如你在摆摊卖冰激凌，你注意到温度越高，你卖出去的冰激凌越多。

线性回归就像是你用尺子和铅笔在历史销售数据的散点图表上画一条直线，尽量让这条线贴近所有的销售点（温度是x，销售额是y）。这样，你就可以用这条线预测，在任何给定温度下，你大概能卖多少冰激凌。

【入门科普】必了解的 20 个 AI 术语解析（上）

三、多元多项式回归

你一定发现了在前文冰激凌案例中，很显然温度对收入的影响并不是直线而是一个曲线，并且也不止温度这一个自变量。多元多项式回归就是一种可以综合考虑多个X自变量并且能得出非线性关系的机器学习算法。比如训练一个评估房价的模型，那么自变量就有：面积、房龄、距离地铁站距离、楼层数等等，自变量越多，模型越能去模拟真实世界。

【入门科普】必了解的 20 个 AI 术语解析（上）

四、决策树

本文前三节都是基于简单的数学公式的模型，这些模型要求输入数据是数值型，这意味着在处理性别、城市、疾病类别等非数值型时，需要进行数值转化的预处理，这增加了算法复杂度，造成过拟合等问题。

决策树可以直接处理分类特征，比如训练一个诊断心脏病类型的算法模型，我们搭建有很多决策点比如：患者的胸痛类型、心电图结果，这些决策点就构成了一个决策树，每个叶节点代表一个特定的心脏病诊断。需要注意的是决策树和前三种算法并不是互斥关系，决策树的叶节点上可以包含独立的算法模型。

【入门科普】必了解的 20 个 AI 术语解析（上）

五、随机森林

就像医生之间对于同一个症状会有不同的疾病诊断一样，对于同一个问题会无数种决策树方式，如果医生用投票的形式来最终决定是哪一个疾病诊断，这种诊断的准确性往往比一个医生的准确率高很多，这种集成多颗决策树的模型构建方式，叫做随机森林。

为什么叫“随机”森林呢？好比每个医生都是一个决策树，就算他们是从一个学校培养出来的，但他们个人接触到的病例样本不同，个人性格倾向于保守还是乐观也不同，这种随机性让每一个决策树结构都不同，所以被称之为随机森林。

【入门科普】必了解的 20 个 AI 术语解析（上）

六、聚类

在机器学习中训练模型就好比是用“大量已知的y和x”去倒推出在“y=f（x）”中的f，比如训练一个短视频推荐算法，x是用户数据，y是用户兴趣标签，如果y的颗粒度越精准那么推荐的视频也就越符合他的胃口。

但在实际中，我们很难去给用户标注合适的y来准备足够的训练集。此时，就常用到聚类算法，他可以自行从大量x中依据数据之间的相似度来划分成多个类别，聚类常用在机器学习的数据预处理阶段。

【入门科普】必了解的 20 个 AI 术语解析（上）

七、降维

假设你有一个信息超级全的地图，包含马路、铁路、景点、学校、医院、甚至地形海拔，但是你只是想知道从人民广场到陆家嘴要坐几号线而已，那最适合你的就只是地铁路线图而已，这种简化数据但保留重要信息的过程就叫做降维，人工智能对信息的降维可以减少计算成本（省电费、省显卡），比如，你要训练一个给脸部颜值打分的模型，那么采集到的照片背景、用户的衣服颜色等等就是多余的数据。

【入门科普】必了解的 20 个 AI 术语解析（上）

八、卷积神经网络

卷积神经网络（CNN）最典型的运用是图像识别，它模仿人的思维，自动捕捉典型特征，比如边缘、角落、纹理等，然后他们的发现会被汇总起来，以帮助整个团队理解整张图片的内容。比如我们判断照片上的动物是不是猫，我们会最先想到的是看它的三角形的耳朵、圆胖的脸蛋、小鼻子，综合这些特征后判断是不是猫。

【入门科普】必了解的 20 个 AI 术语解析（上）

九、循环神经网络

CNN适合处理图像或视频这种网格结构的数据，而循环神经网络（RNN）适合处理文本、语音、天气这类有时间顺序序列数据，它具有一定的记忆能力能够理解上下文关系。这个算法的缺点是容易“梯度爆炸”或者“梯度消失”，“梯度爆炸”可以类比为在阅读小说时，对之前章节非必要的细节过于沉浸无法忘怀，以至于影响了对当前内容的理解。而“梯度消失”则相当于你很快就忘记了之前的内容，使得理解当前内容变得困难。

【入门科普】必了解的 20 个 AI 术语解析（上）

十、Transformer

Transformer模型通过其独特的自注意力机制可以解决CNN中常有的“梯度爆炸”和“梯度消失”的问题，并且它不需要像RNN一样按顺序处理数据，而是可以一次性读取全部数据。就像是在一个巨大的图书馆里寻找信息，RNN是一本一本去读，而Transformer可以一次性看完，并迅速找到你需要的信息。这种方法特别适合处理语言，因为它需要同时理解句子中的每个词及其上下文关系。

【入门科普】必了解的 20 个 AI 术语解析（上）