预热看我之前的文章Node学习记录: mongodb
这个系列旨在系统的学习Mongodb
使用windows
的同学可以看这篇文章MongoDB开发学习
学习目标
MongoDB官网:https://www.mongodb.com/
MongoDB中文社区:http://www.mongoing.com/
mongodb github:https://github.com/mongodb
关系型数据库 与 非关系型数据库
MongoDB
是一个面向文档(document-oriented)的数据库,而不是关系型数据库。不采用关
系模型主要是为了获得更好的扩展性
。当然, 还有其他一些好处。与关系型数据库相比,面向文档的数据库不再有
行
(row
)的概念,取而代之的是更为灵活的文档
(document
)模型。通过在文档中嵌入文档和数组,面向文档的方法能够仅使用一条记录来表现复杂的层次关系,这与使用现代面向对象语言的开发者对数据的看法一致。
另外,不再有预定义模式(predefined schema
):文档的键(key
)和值(value
)不再是固定的类型和大小。由于没有固定的模式,根据需要添加或删除字段变得更容易了。通常,由于开发 者能够进行快速迭代,所以开发进程得得以加快。而且,实验更容易进行。开发者能尝试大量的数据模型,从中选择一个最好的。
MongoDB并不具备一些在关系型数据库中很普遍的功能,如连接(join
)和复杂的多行事务(multirow transaction
)。省略这些功能是出于架构上的考虑(为了得到更好的扩展性),因为在分布式系统
中这两个功能难以高效地实现。
基础概念
-
文档
是MongoDB中数据的基本单元,非常类似于关系型数据库管理系统中的行
,但更具表现力 - 集合(
collection
)可以看作是一个拥有动态模式(dynamic schema)的表 - MongoDB的一个实例可以拥有多个互相独立的数据库(database),每个数据库都拥有自己的集合
- 每个文档都有一个特殊的键"_id",这个键在文档所属的集合中唯一的。
- MongoDB自带一个简单但功能强大的
JavaScript shell
可用于管理MongDB的实例 或 数据操作
文档
- 文档就是键值对的一个
有序集
{"x" : 1, "y":2}
与{"y": 2, "x": 1}
是不同的
通常,字段顺序并不重要,无须让数据库模式依赖特定的字段顺序(MongoDB会对字段重新排序)。
在某些特殊情况下,字段顺序变得非常重要
一些编程语言对文档的默认表示根本就不包含顺序问题(如:Python中的字典、Perl和Ruby
1.8中的散列)。通常,这些语言的驱动具有某些特殊的机制,可以在必要时指定文档的顺序。
- MongoDB不但区分类型,而且区分大小写
下面的两个文档是不同的
{"foo" : 3}
{"foo" : "3"}
下面两个文档也是不同的
{"foo" : 3}
{"Foo" : 3}
- MongoDB的文档不能有重复的键
下面的文档是非法的:
{"greeting" : "Hello, world!", "greeting" : "Hello, MongoDB!"}
集合
- 集合就是一组文档。
如果将MongoDB中的一个文档比喻为关系型数据库中的一行,那么一个集合就相当于一张表。
- 动态模式
一个集合里面的文档可以是各式各样的,这意味着,下面两个文档可以存储在同一个集合里面:
{"greeting" : "Hello, world!"}
{"foo" : 5}
————> 这里引发一个问题:
因为集合里面可以放置任何文档,还有必要使用多个集合吗?(既然没有必要区分不同类型文档的模式,为什么还要使用多个集合呢)
- 如果把各种各样的文档不加区分地放在同一个集合里,无论对开发者还是对管理员来
说都将是噩梦。开发者要么确保每次查询只返回特定类型的文档,要么让执行查询的应用程序来处理所有不同类型的文档。如果查询博客文章时还要剔除含有作者数据的 文档,这会带来很大困扰。
- 在一个集合里查询特定类型的文档在速度上也很不划算,分开查询多个集合要快得多。例如,假设集合里面一个名为"type"的字段用于指明文档是skim、whole还是 chunky monkey。那么,如果从一个集合中查询这三种类型的文档,速度会很慢。但如果将这三种不同类型的文档拆分为三个不同的集合,每次只需要查询相应的集合,速 度快得多。
- 把同种类型的文档放在一个集合里,数据会更加集中。从一个只包含博客文章的集合里查询几篇文章,或者从同时含文章数据和作者数据的集合里查出几篇文章,相比之下,前者需要的磁盘寻道操作更少。创建索引时,需要使用文档的附加结构(特别是创建唯一索引时)。索引是按照集合来定义的。在一个集合中只放入一种类型的文档,可以更有效地对集合进行索引。
上面这些重要原因促使我们创建一个模式,把相关类型的文档组织在一起,尽管MongoDB对此并没有强制要求。
数据库
在MongoDB中,多个文档组成集合,而多个集合可以组成数据库。一个MongoDB实例可以承载多个数据库,每个数据库拥有0个或者多个集合。每个数据库都有独立的权限,即便是在磁盘上,不同的数据库也放置在不同的文件中。按照经验,我们将有关一个应用程序的所有数据都存储在同一个数据库中。要想在同一个MongoDB服务器上存放多个应用程序或者 用户的数据,就需要使用不同的数据库。
安装
或者
在 Ubuntu 16.04 上安装 MongoDB 可参考 MongoDB Docs:
//非二进制包安装方式
$ sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 0C49F3730359A14518585931BC711F9BA15703C6
$ echo "deb [ arch=amd64,arm64 ] http://repo.mongodb.org/apt/ubuntu xenial/mongodb-org/3.4 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-3.4.list
$ sudo apt-get update
$ sudo apt-get install -y mongodb-org
这样安装默认端口是27017
先启动mongod
sudo service mongod start
在 CentOS 7 上安装 MongoDB 可参考 MongoDB Docs:
$ sudo vi /etc/yum.repos.d/mongodb-org-3.4.repo
[mongodb-org-3.4]
name=MongoDB Repository
baseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/3.4/x86_64/
gpgcheck=1
enabled=1
gpgkey=https://www.mongodb.org/static/pgp/server-3.4.asc
$ sudo yum install -y mongodb-org
-
mongod
: mongodb数据库的执行程序(数据库部署使用这个程序) -
mongo
:用来连接mongodb数据服务器的客户端,对数据的所有操作,需要先使用mongo客户端连接到mongodb服务器之后才能进行 -
mongoimport
mongoexport
用来做mongodb的导入导出 -
mongodump
mongorestore
用来导入导出二进制数据,不能被直接读取,一般做数据的备份与恢复 -
mongooplog
用来做操作日志的回放,oplog
是mongodb复制集中用来记录操作记录的数据集合 -
mongostat
查看各种状态
搭建简单的mongodb服务器
搭建MongoDB服务器之后,需要使用客户端连接,才能进行操作。
连接方法:
- 使用编译时候生成的客户端连接
- 使用各种驱动连接
关闭服务
- kill进程
在kill进程时候需要注意需要使用 kill-15
或者kill不加任何参数,不要使用kill-9
。
Linux kill -9 和 kill -15 的区别
- db.shutdownServer()
use admin
db.shutdownServer()
图形操作工具
https://robomongo.org/
https://blog.csdn.net/jian1ji...
远程连接配置
https://www.cnblogs.com/jinxi...
mongodb的mongo.conf文件 启动参数
启动MongoDB有2种方式:
- 一是直接指定配置参数,
- 二是指定配置文件。
mongodb启动脚本为mongod,我们可以这样启动:
./mongod –port=27017 –host=127.0.0.1 –dbpath=db –logpath=27017.log –fork=true
也可以在bin目录创建如下mongo.conf文件
#bind_ip_all = true # 任何机器可以连接
bing_ip = 127.0.0.1,192.168.0.3 # 本机和192.168.0.3可以访问
port = 27017 # 实例运行在27017端口(默认)
dbpath = /usr/local/mongodb/db # 数据文件夹存放地址(db要预先创建)
logpath = /usr/local/mongodb/logs/27017.log # 日志文件地址
logappend = false # 启动时 添加还是重写日志文件
fork = true # 是否后台运行
auth = true # 开启校验用户
启动的时候在bin目录执行:
./mongod -f mongo.conf
# 或者
./mongod –config=mongo.conf
更多的配置信息点这里: https://my.oschina.net/pwd/bl...
这种方式启动方便的地方就是我们可以在依赖mongodb的项目中定义好mongodb.conf
(YAML-based格式的配置文件) `
项目代码在这里,欢迎folk和star:https://github.com/AlexZ33/eg...
systemLog:
verbosity: 0 #日志文件输出的级别,越大级别越低。
quiet: true #boolean 在quiet模式下会限制输出信息:数据库命令输出,副本集活动,连接接受事件,连接关闭事件。
syslogFacility: user #string,默认为user 指定syslog日志信息的设备级别。需要指定--syslog来使用这个选项。
destination: file # string指定一个文件或syslog。如果指定为文件,必须同时指定systemLog.path
path: /dev/null # string发送所有的诊断信息日志,默认重启后会覆盖。
quiet: true
logAppend: false # boolean是否启用追加日志。
timeStampFormat # string,默认为iso8601-local 日志信息中的时间戳格式
storage:
dbPath: /data/db
directoryPerDB: true
journal:
enabled: true
engine: wiredTiger
wiredTiger:
engineConfig:
directoryForIndexes: true
processManagement:
fork: true # boolean,默认为false是守护进程在后台运行。
net:
bindIp: 127.0.0.1
port: 27017
maxIncomingConnections: 1000000
我们可以在npm scripts中加入:
"mongod": "sudo mongod --config config/mongodb.conf"
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。