jupyter-notebook是我很喜欢的工具,搭环境稍显麻烦,其实jupyter web形式的使用方式,最好的部署方式是在云上,一次部署到哪里都可以使用,岂不快哉。现在各家云服务器还挺贵的,docker出来后,我就琢磨把jupyter-notebook放到容器中。
Docker及系统
已经安装好的同学可以忽略这一节。我喜欢用ubuntu,所以host 系统是ubuntu,docker容器中的系统也是ubuntu。ubuntu apt-get源默认按装的docker版本不是最新版本的,需要通过添加源的方式来安装最新版本的docker。参考链接
#添加ubuntu apt 的https访问能力
$ sudo apt-get install apt-transport-https
#将Docker官方资料库的访问Key添加到你本地系统
$ sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv-keys 36A1D7869245C8950F966E92D8576A8BA88D21E9
#将docker 资料库地址添加到apt源列表
$ sudo bash -c "echo deb https://get.docker.io/ubuntu docker main > /etc/apt/sources.list.d/docker.list"
#安装
$ sudo apt-get update
$ sudo apt-get install lxc-docker
Docker安装好以后就要拉一个ubuntu版本镜像,我拉的是ubuntu:14.04
docker pull ubuntu:14.04
启动容器
容器是存放jupyter-notebook的地方,我们要做的是基于精简版的ubuntu镜像启动一个容器,然后在里面安装sshd这种远程登录的工具。
先让容器以交互式虚拟终端的方式启动,如果需要使用和host不同的DNS server配置,可以使用--dns参数指定DNS server,否则新启动的docker 容器会复制host的/etc/resolv.conf。
docker run -i -t ubuntu:14.04 /bin/bash
安装sshd的过程比较简单,我通常安装openssh-server
sudo apt-get install openssh-server
然后编辑它的配置文件 /etc/ssh/sshd_config,注释掉配置文件中的"PermitRootLogin without-password",再增加一句"PermitRootLogin yes"使得root用户可以远程登录。然后用将这个安装好sshd的容器做成镜像。
之后基于新镜像启动容器,用端口映射的方式,映射ssh端口到host,之后通过ssh指定端口的方式登录到docker 容器。jupyter-notebook的默认端口号是8888,也可以提前考虑,在这里多映射几个外部端口。
docker run -d -p 30001:22 --name jupyter-notebook ubuntu:14.04-sshd /usr/sbin/sshd -D
安装jupyter
这个过程基本和在ubuntu系统上安装jupyter的过程是一样的,但容器中的ubuntu是个最简环境,没有安装python-dev包。
#更新apt-get环境
apt-get update
#安装python dev包
apt-get install python-dev
#安装jupyter
pip install jupyter
安装过程需要注意的是,由于墙的原因,ubuntu的源和pip的源都换成国内的源,我ubuntu用的是网易的源,pip用的是清华的源。
使用jupyter
jupyter 默认只能通过本地地址访问,要放开配置,允许jupyter远程访问。在放开远程访问时,需要设置密码,jupyter的配置文件只支持加密后的密文密码(赞一个)
#生成jupyter配置文件,这个会生成配置文件.jupyter/jupyter_notebook_config.py
jupyter notebook --generate-config
#使用ipython生成密码
In [1]: from notebook.auth import passwd
In [2]: passwd()
Enter password:
Verify password:
Out[2]: 'sha1:38a5ecdf288b:c82dace8d3c7a212ec0bd49bbb99c9af3bae076e'
#去配置文件.jupyter/jupyter_notebook_config.py中修改以下参数
c.NotebookApp.ip='*' #绑定所有地址
c.NotebookApp.password = u'刚才生成的密码'
c.NotebookApp.open_browser = False #启动后是否在浏览器中自动打开
c.NotebookApp.port =8888 #指定一个访问端口,默认8888,注意和映射的docker端口对应
配置完成以后,就可以用 jupyter notebook命令把jupyter启动起来了,然后你就可以看到一个超级简洁的jupyter登录界面了。输入密码就可以开始使用jupyter了。
扩展
如果要大数据分析,还需要安装很多大数据相关的包。
我用jupyter最多的还是使用pandas/scikit-learn,所以我会继续安装这两个包,大家可以根据自己需要继续安装自己想要的python包。
#安装numpy,安装过程中会有c文件的编译,可能会报些错,但不影响最终结果
pip install numpy
#安装scipy,安装过程中会有c文件的编译,可能会报些错,但不影响最终结果
pip install scipy
#安装matplotlib
pip install matplotlib
#安装pandas
pip install pandas
pip install scikit-learn
总体来说pip的包管理还是比较好的,除了numpy、scipy编译时报的一堆错误,整体安装过程比较顺畅。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。