AI 术语表(不断更新中)
- NLP:自然语言处理 Natural Language Processing
- 词向量:Word Vector,一种寻找词和词之间相似性的技术,词汇在各个维度上的特征用数值向量进行表示,利用这些维度上的特征相似程度,从而判断出词和词之间的相似程度。通常又叫做 ”词嵌入“(Word Embedding)。
- 词嵌入:Word Embedding。将词映射到向量空间的过程。
- 张量:概念源自物理学和数学中的张量分析,可以理解为多维数组的通用说法。可以是一维、或者 N 维的数组。
- 泛化:Generalization,模型在未见过数据上的表现能力。
- 过拟合:Overfitting,模型在训练数据上表现良好,但在新数据上表现不佳。
- 欠拟合:Underfitting,模型在训练数据上和新数据上都表现不佳。
- One-Hot 编码:一种用于处理分类数据的编码方法,基本思想是将每个类别的特征表示为一个二进制向量,向量的长度等于类别的数量。对于每个样本,该样本属于的类别的位置上的值为1,其余位置的值为0。这种编码方式确保了每个样本的表示是稀疏的,即除了一个位置为1外,其他位置都是0。