【算法】离散化

离散化

1. 离散化的目的

值域压缩：把无限空间中有限的个体映射到有限的空间中区，以提高算法的时空效率

当原数组中的数字很大、负数、小数时（大多数情况下是数字很大），难以将“元素值”表示为“数组下标”，一些依靠下标实现的算法和数据结构无法实现时，我们就可以考虑将其离散化。

简而言之：将稀疏离散化简为稠密连续的一段

离散化是在不改变数据相对大小的条件下，对数据进行相应的缩小。

2. 实现方式

数组离散化：

// arr[i] 为原数组
for(int i = 1; i <= n; i ++ ) tmp[i] = arr[i];
// 排序
sort(tmp + 1, tmp + n + 1);
// 去重：放回一个迭代器，指向去重后不重复序列的最后一个元素下标
int len = unique(tmp + 1, tmp + n + 1) - (tmp + 1);
// lower_bound 查找大于等于 a[i] 的第一个数的下标
for(int i = 1; i <= n; i ++ )
    arr[i] = lower_bound(tmp + 1, tmp + len + 1, arr[i]) - tmp;

vector 离散化：

// std::vector<int> arr;
std::vector<int> tmp(arr);  // tmp 是 arr 的一个副本
std::sort(tmp.begin(), tmp.end());
tmp.erase(std::unique(tmp.begin(), tmp.end()), tmp.end());
for (int i = 0; i < n; ++i)
  arr[i] = std::lower_bound(tmp.begin(), tmp.end(), arr[i]) - tmp.begin();

3. 示例代码

#include <bits/stdc++.h>
using namespace std;

const int N = 1e5 + 9;
int a[N];

vector<int> L;
int getidx(int x)
{
    return lower_bound(L.begin(), L.end(), x) - L.begin();
}

int main()
{
    int n; cin >> n;
    for(int i = 1; i <= n; i ++ ) cin >> a[i];
    for(int i = 1; i <= n; i ++ ) L.push_back(a[i]);
    
    sort(L.begin(), L.end());
    L.erase(unique(L.begin(), L.end()), L.end());
    
    cout << "离散化数组为："
    for(const auto &i : L) cout << i << ' ';
    cout << endl;
    
    int val; cin >> val;
    cout << getidx(val) << endl;
    
    return 0;
}

【算法】离散化

离散化

1. 离散化的目的

2. 实现方式

3. 示例代码

南池北塘

引用和评论

递归枚举

大模型中的Token究竟是什么？从原理到作用深度解析

深度探索 DeepSeek 微调：LoRA 与全参数微调实战指南

DeepSeek行业应用实践报告100+份汇总解读|附PDF下载

功率器件热设计基础（九）——功率半导体模块的热扩散

2025增长新前沿——AI人工智能拐点重塑人类潜力 400+份报告汇总解读 | 附PDF下载

DeepSeek的开源之路:一文读懂从V1-R1的技术发展,见证从开源新秀到推理革命的领跑者