归一化-处理连续特征和离散特征并存情况

阅读 1 分钟

0

别人答的已经很漂亮了，我就简单复述一下。
1、重新规划连续特征边界：就是将连续值缩放到[-1,1],注意既可以缩也可以放大。
2、标准化连续特征：这个就套公式就行，计算平均值和方差，但是如果方差小还是不大行。
3、是针对离散变量而言，更像是skearn里面的哑变量处理，所有离散变量不论多大全部改为01。

另外：
我自己补充，如果是机器特征学习上述就行。深度学习可以不改哑变量，现在万物皆可embedding，用嵌入层将离散变量压缩变得稠密，将连续变量rescale bound 就行。

ml 深度学习

阅读 4.5k更新于 2020-12-17

尹某某

1 声望1 粉丝

机器学习爱好者

« 上一篇

机器学习：SVM（支持向量机）原理推导

下一篇 »

引用和评论

推荐阅读

用PyTorch从零构建 DeepSeek R1：模型架构和分步训练详解

deephub赞 3阅读 2.8k评论 1

Manus邀请码如何获取，申请理由如何写及申请技巧

zlibrary阅读 1.7k

基于yolov5实现的AI智能盒子框架

贝壳里的沙阅读 1.7k

18个常用的强化学习算法整理：从基础方法到高级模型的理论技术与代码实现

deephub阅读 1.4k

【TVM教程】为 ARM CPU 自动调度神经网络

超神经HyperAI阅读 1.3k

2024-2025年汽车市场分析与预测报告300+份集萃解读|附PDF下载

拓端tecdat阅读 1.3k

AIBrix 深度解读：字节跳动大模型推理的云原生实践

字节跳动开源阅读 1.3k

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。