4

Elasticsearch

  • 反向索引又叫倒排索引,是根据文章内容中的关键字建立索引。
  • 搜索引擎原理就是建立反向索引。
  • 搜索引擎的三大过程:爬取内容,进行分词,建立反向索引。
  • Elasticsearch 在 Lucene库 的基础上进行封装,提供restful的API,实现了可以存储海量数据的分布式搜索引擎。
  • Elasticsearch 中的索引、类型和文档的概念比较重要,类似于 MySQL 中的数据库、表和行(记录)。
  • Elasticsearch 也是 Master-slave 架构,也实现了数据的分片和备份。
  • Elasticsearch 一个典型应用就是 ELK 日志分析系统。也就是日志分析系统。其中 E 就是 Elasticsearch,L 是 Logstash,是一个日志收集系统,K 是 Kibana,是一个数据可视化平台。

原文地址:终于有人把Elasticsearch原理讲透了!

ETL

Extraction-Transformation-Loading的缩写,中文名称为数据抽取、转换和加载。

名词解释:

ODS——操作性数据
DW——数据仓库
DM——数据集市

clipboard.png

neo4j

介绍

图形数据库(Graph Database)是NoSQL数据库家族中特殊的存在,用于存储丰富的关系数据,Neo4j 是目前最流行的图形数据库,支持完整的事务,在属性图中,图是由顶点(Vertex),边(Edge)和属性(Property)组成的,顶点和边都可以设置属性,顶点也称作节点,边也称作关系,每个节点和关系都可以由一个或多个属性。Neo4j创建的图是用顶点和边构建一个有向图,其查询语言cypher已经成为事实上的标准。

模型规则

表示节点,关系和属性中的数据
节点和关系都包含属性
关系连接节点
属性是键值对
节点用圆圈表示,关系用方向键表示。
关系具有方向:单向和双向。
每个关系包含“开始节点”或“从节点”和“到节点”或“结束节点”

clipboard.png

w3c上面的教程和官网也可以参考


stefanieliang
190 声望19 粉丝

一天一笔记~