查看 Elasticsearch 的 Cache 占用(qbit)

2020-11-19
阅读 1 分钟
4.2k
引子常说要留一半以上的内存给 ES 的 cache,那么怎样查看 ES 占用的 cache 的大小?(干货 | 吃透Elasticsearch 堆内存)实践环境介绍 {代码...} ES api 查看查看帮助 {代码...} 查看堆内存使用情况 {代码...} {代码...} 查看机器内存使用情况 {代码...} {代码...} Linux 工具查看htop 查看(11259 为 ES 进程 ID) {代...

esrally 离线测试(qbit)

2020-11-18
阅读 40 分钟
2.2k
测试环境 {代码...} 安装使用 pip3 安装 esrally {代码...} 查看版本 {代码...} 出现以下界面即安装成功esrally --version下载测试数据集官网项目地址 [链接]从/home/qbit/.rally/benchmarks/tracks/default/download.sh)中可以看到测试数据集存放在 AWS 的 [链接] 路径下。上面的目录并不能直接访问,我们需要研究里面...

配置最简单 systemd 开机启动脚本

2020-11-17
阅读 1 分钟
10.4k
截至 2020.11.17,SystemD 早已战胜 upstart 成为 SystemV 的接任者。CentOS 7/8、Ubuntu 18.04/20.04 LTS 默认配置都是 SystemD。

使用 nginx 快速搭建 elasticsearch ik 远程词典服务

2020-10-22
阅读 2 分钟
2.3k
es 配置IK Dictionary Configuration {代码...} 第一次配置需要重启 ES注意:如果文件服务器做了高可用或负载均衡,etag 返回值可能会轮换,使得词典文件被不断 reload测试环境Windows 10nginx 1.18.0步骤解压下载的压缩包,在里面新建 dic 目录编辑 conf 下的配置文件 nginx.conf {代码...} 只在默认配置文件中加了下面...

k8s 常用命令(qbit)

2020-10-13
阅读 4 分钟
1.4k
帮助 {代码...} 版本信息 {代码...} 显示集群信息(查看 master 节点) {代码...} 查看节点列表 {代码...} 查看所有 pod 和 namespace {代码...} 列出所有 node 和 pod {代码...} 查看某个 pod 里面的容器 {代码...} 列出某个容器里面的目录 {代码...} 删除容器里面的文件 {代码...} 创建目录 {代码...} 拷贝文件到容器...

Elasticsearch 推荐相关(qbit)

2020-09-21
阅读 1 分钟
1.2k
High-Quality Recommendation Systems with Elasticsearch使用 ElasticSearch 实现高质量的推荐系统Significant Terms Aggregation(Elastic 官方)Elasticsearch:significant terms aggregation(博客园)Elasticsearch:significant terms aggregation(Elastic 中国社区官方博客)本文出自 qbit snap

Elasticsearch 7.x 配置同义词(qbit)

2020-09-04
阅读 3 分钟
4.1k
前言推荐学习阮一鸣《Elasticsearch 核心技术与实战》本文对 Elasticsearch 7.17 适用,官方文档:[链接]同义词可以再建索引时(index-time synonyms)或者检索时(search-time synonyms)使用,一般在检索时使用本文介绍的是 search-time synonyms同义词文档格式单向同义词 {代码...} 双向同义词 {代码...} 试验步骤添...

Python 给图片补边(qbit)

2020-09-02
阅读 1 分钟
4.4k
前言本文主要是为了给宽图片上下补边试验环境 {代码...} 代码 {代码...} 示例输入图片样例(点击图片查看边框)输出图片样例(点击图片查看边框)相关阅读Python 去除图片纯色边框本文出自 qbit snap

配置 Hue 访问 AWS S3 中国区(qbit)

2020-07-18
阅读 1 分钟
3.3k
Hue: Hadoop User Experience环境 {代码...} qbit 参照这两篇 Hue 官方文档搞了很久都没配好:文档一,文档二文档编写者估计没考虑到独立运营的 AWS 中国区用户的痛搞明白了也简单,就是在官方文档的基础上还得配置 host 参数摘录配置如下 {代码...} 上面的配置一般通过 config.json 配置,不必登录到具体 EC2 上操作。...

Windows 下运行 Hadoop 并部署到 AWS(qbit)

2020-07-08
阅读 9 分钟
1.8k
本文环境 {代码...} 单机程序 新建 Maven 工程 修改 pom.xml 配置 {代码...} 新建 Package 和 Java Class 从官方拷贝代码到 WordCount.java {代码...} 将文本文件 demo.txt 放到 pom.xml 同级目录 添加运行配置 点击运行,报如下错误 {代码...} 到官网下载并解压 hadoop-2.8.5.tar.gz 下载 winutils/hadoop-2.8.5/,将 b...

Python 去除图片纯色边框(qbit)

2020-06-15
阅读 2 分钟
4.9k
前言本文主要参照 Trim whitespace using PIL试验环境 {代码...} 除了 Pillow 以外,qbit 还尝试了 skimage 和 opencv-python,效果不比 Pillow 好,且用法复杂很多PillowPillow 文档: [链接] {代码...} 调整尺寸 {代码...} 输入图片样例(点击图片查看边框)输出图片样例(点击图片查看边框)ImageMagick使用 ImageMag...

Windows 原生 SSH 配置(qbit)

2020-06-14
阅读 2 分钟
2.2k
前言 操作系统版本 {代码...} ssh 目录 {代码...} 直接登录 {代码...} 免密登录 证书生成 生成 {代码...} 查看 {代码...} 拷贝公钥到服务器 在服务器创建目录 {代码...} 在 Windows 10 上使用 scp 命令上传公钥 {代码...} 将公钥追加到 authorized_keys 文件 {代码...} ssh 客户端配置文件 在 C:\Users\qbit\.ssh 目录下...

Windows Terminal 配置(qbit)

2020-06-14
阅读 1 分钟
2k
本文的配置文件为 C:\Users\qbit\AppData\Local\Packages\Microsoft.WindowsTerminal_8wekyb3d8bbwe\LocalState\settings.json

Ubuntu 20.04 LTS 挂载硬盘(qbit)

2020-06-04
阅读 1 分钟
28.6k
背景机器上有两块硬盘:一块 256GB 的 SSD,一块 4TB 的机械硬盘原来装的 Windows 系统,改为装 Ubuntu 20.04 LTS,SSD 作为系统盘已装好查看磁盘信息 {代码...} 删除机械硬盘的 Windows 分区 {代码...} 将机械硬盘格式化为 ext4 {代码...} 挂载机械硬盘 {代码...} 设置开机自动挂载fstab中 每个字段代表的含义在 /etc/f...

ip route 命令(qbit)

2020-05-26
阅读 2 分钟
13.9k
前言iproute2 的 ip route 命令对标 net-tools 的 route 命令,可参考 iproute2 tips路由表(ip rule)查看路由表 {代码...} 删除一个路由表 {代码...} 添加路由表 {代码...} 路由(ip route)显示路由 {代码...} 查看指定网段的路由 {代码...} 删除接口路由 {代码...} 查看本地静态路由 {代码...} 查看直连路由 {代码.....

关于 Ubuntu 20.04 LTS 的网络(dchp/dns/route/PPPoE)

2020-05-26
阅读 4 分钟
17.8k
前言旧时代网络管理软件 net-tools、NetworkManager新时代网络管理软件 iproute2、resolvectl新时代旧时代大致可按 2010 年划分检查网卡是否已插入网线直接查看文件 {代码...} ip addr 或 ip link 命令查看网卡状态mii-tool {代码...} ip link {代码...} 查看物理网卡 ip在安装 docker 后,ip addr 显示的地址太多,想要...

Ubuntu 20.04 LTS 安装 docker(qbit)

2020-05-26
阅读 2 分钟
4.4k
docker 在发展中产生了很多的名字(docker/docker.io/docker-engine ),当前(2020/5/26)软件包名为 docker-ce(Docker Engine-Community)。可以尝试清理旧版软件:

Elasticsearch 查询权重(qbit)

2020-05-20
阅读 3 分钟
4k
前言本文对 Elasticsearch 7.17 适用提升字段的权重multi_match默认 type 为 best_fields {代码...} most_fields {代码...} query_string {代码...} simple_query_string {代码...} 提升子句的权重bool 查询 {代码...} 提升索引的权重indices_boost {代码...} Function score queryElasticSearch 相关性打分机制年份越大...

用 MongoDB 存放图片(qbit)

2020-05-20
阅读 2 分钟
2.6k
环境 {代码...} bson(小图片) bson 用来存放小于 16MB 的小文件 Python 示例代码 {代码...} {代码...} {代码...} GridFS(大图片) GridFS 用来存放大于 16 MB 的大文件 本文出自 qbit snap

MongoDB 语句备忘(qbit)

2020-05-19
阅读 1 分钟
1.2k
查询一个字段有哪几种取值 {代码...} {代码...} 取字段的前 2 位并去重 {代码...} {代码...} 统计一个字段的几种取值,并按统计量降序排列。 {代码...} {代码...} 本文出自 qbit snap

Java Maven 打包相关(qbit)

2020-05-17
阅读 1 分钟
1.9k
跳过测试 跳过测试代码运行,不跳过测试代码编译 {代码...} 跳过测试代码编译和运行 {代码...} war Web Archive file Java之Maven打包本地jar到war中 导出 pom.xml 依赖 {代码...} 中央仓库 Apache {代码...} Maven {代码...} 阿里云 {代码...} 本文出自 qbit snap

jvisualvm 监控 tomcat 实例(qbit)

2020-05-13
阅读 3 分钟
2.7k
打开 jvisualvm,qbit 的路径是 C:\Program Files\Java\jdk1.8.0_162\bin\jvisualvm.exe

JVM 参数调优(qbit)

2020-05-11
阅读 5 分钟
6.8k
前言JVM 的参数有好几百个,听着有点吓人,好在最常用的参数只有两个,其他绝大多数参数都无需调整。可以参考廖雪峰的文章: JVM调优的正确姿势 {代码...} 特别说明 -Xmn 在绝大多数情况下并不需要配置,详见后文Oracle 对 JVM 参数的说明文档打印 JVM 参数打印 JVM 参数初始值 {代码...} 打印 JVM 参数最终值 {代码...}...

Elasticsearch 7.x 的 JVM 内存配置(qbit)

2020-05-08
阅读 5 分钟
8.7k
官方文档摘要jvm.options一般情况下并不需要更改 JVM 的配置项。最可能更改的 JVM 配置是堆大小(heap size)可以使用 jvm.options 配置文件或 ES_JAVA_OPTS 环境变量更改 JVM 配置首选通过 jvm.options 更改配置heap sizeElasticsearch 通过 jvm.options 中的 Xms 和 Xmx 设置堆的大小应该讲 Xms 和 Xmx 设为相同的值 {...

Elasticsearch 7.x 学习路线图

2020-05-07
阅读 1 分钟
2.5k
ElasticSearch 架构解析与最佳实践 推荐学习阮一鸣《Elasticsearch 核心技术与实战》 本文出自 qbit snap

图书馆相关知识(qbit)

2020-05-05
阅读 1 分钟
1.4k
专家视频 索传军 {代码...} 由数字馆藏到数据馆藏—大数据时代我们的价值 {代码...} 智能图书馆的资源组织模式—基于情景和语义的知识组织 {代码...} 知识图谱在图书馆的应用—智能图书馆的基础 {代码...} 邵波 {代码...} 新一代服务平台环境下的数据管理和服务研究 {代码...} 文献资料 电子版ISBN/ISSN/ISSN-L及BIBFRAME用...

Spark 权威指南——Spark 是什么?(qbit)

2020-04-26
阅读 2 分钟
2.5k
第 II 部分 结构化 API——DataFrame、SQL和Dataset第4章 结构化API概述第5章 基本的结构化操作第6章 处理不同的数据类型第7章 聚合操作第8章 连接操作第9章 数据源第10章 Spark SQL第11章 Dataset

MARC 数据解析(qbit)

2020-04-22
阅读 7 分钟
4.8k
MARC 是 Machine Readable Catalog(ue) 的缩写,意即“机器可读目录”,即以代码形式和特定结构记录在计算机存储载体上的、用计算机识别与阅读的目录。

MongoDB 插入时间与更新时间(create_time/update_time)

2020-04-22
阅读 3 分钟
19.4k
MongoDB 在数据库层面不能像 MySQL 一样设置自动创建 create_time/update_time,自动更新 update_time

rsync tips(qbit)

2020-04-17
阅读 2 分钟
3.1k
简介rsync 是一款高效远程数据同步工具。rsync 能同步更新两处计算机的文件与目录,并适当利用差分编码以减少数据传输量。(增量同步)rsync 中的一项同类软件不常见的重要特性是每个目标的镜像只需发送一次。rsync 可以拷贝/显示目录内容,以及拷贝文件,并可选压缩以及递归拷贝。rsync 命令中,一个冒号走 ssh 协议,...