AI基础认知 最新 下面我将为你系统地梳理关于句向量的基础认知 核心定义与类比句向量 指的是将一个句子(无论长短)通过某种模型或算法,映射成一个固定长度、稠密的实数向量(即一列数字,[0.23, -0.45, 1.2, ..., 0.89],维度通常是几百到几千)... 星博讯 2026-04-09 2 #句向量基础 #语义表示
AI基础认知 最新 一、核心定义 数据噪声 是指在数据收集、传输或记录过程中,混入的非本质的、随机的、无意义的扰动或误差,它不是数据所代表的真实信号或模式的一部分,而是会干扰、模糊甚至扭曲真实信息的一种“杂质”,一个核心的比喻是:信号... 星博讯 2026-04-09 1 #核心 #定义
AI基础认知 最新 一、是什么?重新定义异常值 异常值不是“错误值”,它是一个“不寻常的值”,其定义高度依赖于业务背景和建模目标,统计定义:在数据分布中,远离其他大部分数据的观测点,常用识别方法有:标准差法:平均值 ± 3倍标准差之外的数据,四分位... 星博讯 2026-04-09 2 #异常值 #重新定义
AI基础认知 最新 假设 df 是你的DataFrame 这是一份清晰的缺失值填充基础指南,涵盖了核心概念、常用方法和实践流程, 为什么要处理缺失值?算法限制:大多数机器学习算法和统计模型(如逻辑回归、SVM、神经网络)无法直接处理包含缺失值的数据,会直接报... 星博讯 2026-04-09 1 #df #DataFrame
AI基础认知 最新 数据标准化是一个多维度概念,核心目标是将数据转化为统一、可比、规范的格式,以提升数据质量、可用性和分析效率。主要分为以下两个层面 统计与机器学习中的数值标准化(核心方法)这是最常用的含义,指通过数学变换消除数据量纲和数量级差异,使不同特征具有可比性,常见方法:Z-Score标准化公式:(x - μ / σ结果:数据均值为0,标... 星博讯 2026-04-09 3 #数据标准化 #数据质量
AI基础认知 最新 1.核心定义与目标 数据归一化 是指将数据按比例缩放,使之落入一个特定的、统一的尺度范围(通常是[0,1]或[-1,1])的过程,根本目标:消除数据特征之间因量纲和尺度不同而带来的消极影响,使不同特征具有可比性,从而确保... 星博讯 2026-04-09 2 #核心定义 #目标
AI基础认知 最新 公式,x x 特征缩放基础特征缩放是数据预处理的关键步骤,用于将数据的不同特征标准化到相似的数值范围,以提高机器学习模型的性能和稳定性,📌 为什么需要特征缩放?当数据特征具有不同量纲或范围时,会出现以下问题:梯度下... 星博讯 2026-04-09 1 #公式 #x x
AI基础认知 最新 这是一个在机器学习和数据处理中非常基础且重要的技术 核心定义独热编码是一种将分类数据(或称类别数据、名义数据)转换为数值数据的方法,它的核心思想是:对于有 N 个可能取值的类别特征,我们创建 N 个新的二进制特征(0或1),对于原始数据中的每一个样本,... 星博讯 2026-04-09 4 #机器学习 #数据处理
AI基础认知 最新 注意,这里映射是自动按大小中的拼音/字母顺序生成的,不一定符合我们的语义顺序! 核心定义标签编码 是一种将分类变量(尤其是有序分类变量或目标变量)转换为数值的数据预处理技术,它为每个唯一的类别分配一个唯一的整数,分类变量、有序、整数转换,主要目的与用途让算法理解:大多数机器学习算... 星博讯 2026-04-09 2 #自动生成 #顺序映射
AI基础认知 最新 序列编码是将序列数据(如文本、时间序列等)转换为机器可处理的数值表示的基础技术。以下是常见的序列编码方法及其特点 独热编码(One-Hot Encoding)原理:每个类别用一个长度为词汇表大小的向量表示,只有对应索引位置为1,其余为0,示例:词汇表 {猫, 狗, 鸟} → 猫: [1,0,0], 狗: [0,1... 星博讯 2026-04-09 2 #序列编码 #编码方法