AI基础认知 最新 一、什么是数据分布? 简单说,数据分布描述了一个数据集中,各个不同值出现的频率或概率模式,它回答了“数据通常落在哪里?”、“数据是集中的还是分散的?”、“数据有没有特别的形状?”等问题,核心比喻:如果把数据比作一个国家的人... 星博讯 2026-04-09 2 #数据分布 #定义
AI基础认知 最新 一、核心定义 数据噪声 指的是数据集中存在的、不期望的、随机的或无关的干扰信息,它并非数据的内在特征,而是由各种因素引入的“杂质”,会掩盖或扭曲数据中真正的模式、信号和规律,一个生动的比喻:信号:你想听的音乐或对话... 星博讯 2026-04-09 2 #核心 #定义
AI基础认知 最新 一、核心认知,什么是异常值? 异常值 是指与数据集中其他观测值显著不同的数据点,它的“异常”是相对的,取决于你的数据和业务背景,统计视角:偏离整体分布模式,可能由测量误差、录入错误或小概率事件产生,业务视角:可能是“噪音”(需要处... 星博讯 2026-04-09 2 #核心认知 #异常值
AI基础认知 最新 第一部分,核心思想 不要盲目填充 处理缺失值的第一步不是“怎么填”,而是“为什么缺”,在统计学中,缺失机制通常分为三类:完全随机缺失:数据缺失是随机的,与任何已观测或未观测的变量都无关,这是最理想的情况,随机缺失:数据缺失与其他已观测... 星博讯 2026-04-09 3 #核心思想 #不要盲目填充
AI基础认知 最新 示例数据 数据归一化(Data Normalization)全面认知基本概念数据归一化是将不同量纲、不同范围的数据转换到统一尺度的过程,使所有特征具有可比性,主要目的与意义目的说明消除量纲影响避免“数值大的特征... 星博讯 2026-04-09 2 #最相关的关键词
AI基础认知 最新 特征缩放基础 特征缩放是机器学习数据预处理中的关键步骤,用于将不同特征的数值范围调整到相似的尺度,以提高模型性能和训练效率,为什么要进行特征缩放?主要目的:加速收敛:梯度下降等优化算法在特征尺度相近时收敛更快避免数... 星博讯 2026-04-09 2 #特征缩放 #标准化
AI基础认知 最新 示例数据 一句话核心定义独热编码是一种将分类数据(特别是名义分类数据)转换为数值格式的方法,以便计算机和机器学习算法能够处理,它的核心是为每个类别创建一个新的二进制特征(列),对于每个样本,只有属于该类别对应的... 星博讯 2026-04-09 1 #示例 #数据
AI基础认知 最新 什么是标签编码? 标签编码是一种将分类特征(或称类别特征)转换为数值形式的预处理技术,它的核心操作很简单:为每一个唯一的类别分配一个唯一的整数,原始类别数据: ["北京", "上海", "广州", "深圳", "上海"... 星博讯 2026-04-09 3 #标签编码 #概念
AI基础认知 最新 序列编码是将序列数据(如文本、时间序列等)转换为数值形式的过程,以便机器学习模型能够处理。下面介绍其基础概念、常用方法及应用 为什么需要序列编码?机器学习模型通常输入数值向量,但原始序列(尤其是文本)是符号化的(如单词、字符),序列编码旨在将这些符号映射为数值表示,同时尽可能保留语义和结构信息,常见编码方法1 独热编码(On... 星博讯 2026-04-09 2 #序列编码 #机器学习
AI基础认知 最新 一句话核心定义 词嵌入是一种将文本中的词(或短语)转换为计算机可以处理的稠密、低维数值向量的技术,这个向量能够捕捉词的语义和语法信息,为什么要词嵌入?—— 从问题出发在计算机看来,文字只是一串符号,为了让计算机“理解... 星博讯 2026-04-09 1 #核心 #定义