搜索 - SegmentFault 思否

找到约 10000 条结果

HBase原理--布隆过滤器

如何高效判断元素w是否存在于集合A之中？首先想到的答案是，把集合A中的元素一个个放到哈希表中，然后在哈希表中查一下w即可。这样确实可以解决小数据量场景下元素存在性判定，但如果A中元素数量巨大，甚至数据量远远超过机器内存空间，该如何解决问题呢？

2020-07-27

面试官：项目中如何实现布隆过滤器？

谈起“布隆过滤器”相信大家都不陌生，它也算日常面试中的常见面试题了。例如，当面试官在问到 Redis 模块的相关问题时，可能会问到缓存穿透（Redis 四大经典问题之一），而缓存穿透的经典解决方案之一，则是“布隆过滤器”。

2024-09-25

HarmonyNext实战：基于ArkTS的高效日志系统设计与实现

在HarmonyNext的开发中，日志系统是保障应用稳定性和可维护性的关键组件。无论是调试、监控还是问题排查，一个高效、灵活的日志系统都能极大地提升开发效率和应用质量。本文将深入探讨如何在HarmonyNext中利用ArkTS设计和实现一个高效的日志系统，并通过一个完整的实战案例来展示具体的实现过程。

2025-03-19

深入理解redis——布隆过滤器BloomFilter

redis的布隆过滤器其实有点像我们之前学习过的hyperloglog 深入理解redis——新类型bitmap/hyperloglgo/GEO ，它也是不保存元素的一个集合，它也不保存元素的具体内容，但是能判定这个元素是否在这个集合中存在（hyperloglog是判定集合中存在的不重复元素的个数）。

2022-02-14

XXL-TOOL v2.4.0 发布 | 布隆过滤器、Excel流式读写、高性能BeanCopy

Release Notes1、【新增】BloomFilter（布隆过滤器）：一种基于多哈希函数和位数组的概率型数据结构，具有高效空间利用与快速查询特性；2、【新增】Trie（前缀数）：一种哈希树的变种，利用公共前缀来节省存储空间和提高查询效率；3、【新增】BeanTool 工具：支持 Bean&Map 转换、Bean对象复制等能力；4、【强化】Excel...

2025-12-14

答：数据可变长度的数据库设计

不是关系行数据库就好弄。这应该是存储树吧！nosql类型做起来容易很多。关系行数据库存树行结构有些麻烦。1。楼主需要高效查询。必然要牺牲插入入删除的效率。2。想高效的插入。删除。程序的简单。就会丢失查询的效率。你需要自己去权衡。我写过这样的结构。当时郁闷了几天。做的头疼。如果你有更好的办法。既可以高效查...

2015-09-03

【AI最前线】精准优质-资讯|分享|热议第43期

1.全能 | 一个模型通杀8大视觉任务[链接]2.利器 | 超强实时跟踪系统首次开源！支持跨镜头、多类别、小目标跟踪！[链接]3.提升｜MIT新研究：解决超大规模问题算法比硬件更有用[链接]4.高效 | 秒过！度目智慧通行让常态化防疫更高效[链接]5.荣誉 | 百度智能客服斩获 “金音奖—中国最佳客户联络中心技术与解决方案奖”[链接]

2021-12-06

掌握ES知识库管理：10个技巧让你的搜索效率翻倍

在当今信息爆炸的时代，es 知识库管理已成为企业和组织高效运作的核心。有效的知识库管理不仅能够提高信息检索的速度和准确性，还能促进团队协作和知识共享。本文将深入探讨es知识库管理的重要性，以及如何通过优化策略来提升搜索效率。

2025-04-16

布隆过滤器

布隆过滤器实质上是一种数据结构，比较巧妙的概率型数据结构（probabilistic data structure），特点是高效地插入和查询，可以用来告诉你 “某样东西一定不存在或者可能存在”。相比于传统的 List、Set、Map 等数据结构，它更高效、占用空间更少，但是缺点是其返回的结果是概率性的，而不是确切的。

2021-12-18

Google布隆过滤器与Redis布隆过滤器详解

一、什么是布隆过滤器？布隆过滤器可以用来判断一个元素是否在一个集合中。它的优势是只需要占用很小的内存空间以及有着高效的查询效率。对于布隆过滤器而言，它的本质是一个位数组：位数组就是数组的每个元素都只占用1bit ，并且每个元素只能是0或者1 布隆过滤器除了一个位数组，还有 K 个哈希函数。当一个元素加入布...

2019-11-25

问：mysql 如何高效建索引

大家好我有一张表，里面有差不多 100w的数据，建一个索引到现在为止耗费了我差不多十几分钟，还没建好请问大神有什么好的方法高效建立mysql索引？

2016-09-23

Quick BI取数模型深度剖析

在构建取数模型前，简单介绍一下数据集的概念。Quick BI 目前已经支持为20多种数据库建立连接，建立连接后我们会在系统内为每个连接生成一个逻辑实体称之为数据源。通过预览数据源可以查看对应数据库下面的物理表信息，并能够基于这些物理表创建数据集，每个数据集都是基于物理表加工和建模后的标准OLAP模型。在Quick B...

2019-03-13

答：求任意进制转换的高效算法

楼主的要求是：尽量用2进制来作为中介算法尽量高效用2进制作中介，速度其实更慢，或者相当。高效的算法一般是采用压位，用10000 ，或者 100w 做为中介。

2013-02-04

答：多级分类如何遍历

这种无限级分类最好不要使用递归的方法对于这种树型本身变动很少的分类信息有个比较高效的方案(左值右值方案)：[链接]

2015-02-25

问：php array存数据库用json_encode还是serialize

json_encode和serialize都可以让array变成string存入数据库，两个用哪个更方便和高效？

2014-11-11

布隆过滤器：原理与应用

本文已收录至GitHub，推荐阅读 👉 Java随想录微信公众号：Java随想录原创不易，注重版权。转载请注明原作者和原文链接在日常生活和工作中，我们经常需要处理海量的数据，筛选出有用的信息。这个时候，布隆过滤器（Bloom Filter）就派上了用场。作为一种空间高效的概率型数据结构，布隆过滤器能够快速有效地检测一个元素...

2023-10-12

问：spark sql和hive的问题？

看到spark sql兼容hive，并有一个hive on spark的项目那完全使用spark sql自己的解析，和hive on spark 让hive借助spark运行有什么不同？哪个更高效？ hive是否能提供比spark sql原生更好的sql支持，是否需要学习hive语法？

2016-04-18

✓ 已解决

Transformer 模型在征程 6 平台上的高效支持

相对于传统 CNN 模型来说，Transformer 模型的最大的一个特点就是灵活性。这个灵活性主要体现在模型中穿插大量的数据重排操作，即 Reshape 和 Transpose。如下图 1 所示，对于一个典型的 Attention 结构来说，Reshape 和 Transpose 操作的数量大概可以占到所有操作的一半。

2025-02-15

答：mybatis能否将results注解注释在类的上方，而不是方法的上方？

你好，@Results与@Result其对应ResultMap与result，他们都是方法级别上的注解，无法注解在类的上方，如果有一种注解可以做到的话，我们的效率将会大大提升，如果你发现了这一高效的方式，请回复我，我也很期待高效的形式

2018-07-19

在 Google 中搜索 »

在百度中搜索 »

只显示我发布的