SegmentFault QuanTalk最新的文章

ArchLinux Plasma 简洁优雅桌面环境设置

2022-05-02T23:07:22+08:00

一转眼自己使用 ArchLinux 已经 5 年了，期间自己尝试把桌面环境 Plasma 美化了下，用户体验更接近 MacOS。

预备知识

ArchLinux 是 Linux 操作系统的一个发行版，它的特点是简洁、轻量、滚动更新。定制化能力也很高，适合动手能力强的小伙伴。

而 Plasma 是一个由 KDE 开源社区维护的免费桌面环境，这款桌面环境的定制性也很强，可以自定义主题、应用图标、开机启动画面、窗口样式等。而且大量爱好者贡献了很多优秀插件，直接搜索安装就可以。

应用图标

最近刚刚换成由设计师 vinceliuice 贡献的图标库 McmoJave Circles Icon，该图标库模仿了 MacOS 的设计风格，提供了多种配色。而且完全开源，GitHub 链接为 vinceliuice-McMojave-circle。下载该图标库，在设置-外观中选择并应用即可。

壁纸

自己希望桌面尽可能简洁、壁纸要自然一些，经过 1 个小时的精挑细选，最终选择了下面的图片作为壁纸，链接在此，需要原图的小伙伴自取。

dock 栏

dock 栏使用 KDE 开发的 latte-dock，设置起来也非常方便，我把设置导出到文件中了，方便配置，需要的可以参考我的 dotfiles 仓库中找到kde-plasma-setting/assets/plasma.layout.latte文件导入到 dock 中即可。

恢复与备份

由于桌面环境设置相对繁琐和复杂，网络不好的话下载安装也很慢。我找到了一个插件 PlasmaConfSaver ，它可以很方便地将 plasma 配置进行备份和恢复，能够在多种配置间动态切换。

只需要安装该控件，然后将我设置好并导出的配置文件dotfiles/kde-plasma-setting/assets/kde-mcmojave-default.tar.gz导入自己的环境即可，大大简化流程，PlasmaConfSaver 视频介绍。

总结

对于软件工程师来说，笔记本和操作系统是重要的生产力工具，它可以帮助我们做很多事情。

本文结合笔者自身 5 年的 Linux 使用经验，从最基本的桌面环境设置入手，为大家提供快速设置 Linux Plasma 桌面环境的方法，希望给想尝试 Linux 的同学一个参考。

参考文献

如何定制Kubernetes调度算法？

2021-12-13T20:28:13+08:00

随着云计算和容器技术的发展，以docker为核心的容器技术迅速在开发者和科技公司中应用，Kubernetes凭借丰富的企业级、生产级功能成为事实上的容器集群管理系统。可是k8s的通用性削弱了调度算法的定制性，本文将调研定制化调度算法的方法，并且给出一个开源实现Demo。

k8s与调度器架构

下图1-1是Kubernetes的整体架构图，集群节点分为两种角色：Master节点和Node节点。Master节点是整个集群的管理中心，负责集群管理、容器调度、状态存储等组件都运行在Master节点上；Node节点是实际上的工作节点，负责运行具体的容器。

Kubernetes调度器是独立运行的进程，内部运行过程从逻辑上可以分为多个模块。图1-2展示了默认调度器内部包含的具体模块，配置模块负责读取调度器相关配置信息，并且根据配置内容初始化调度器。

优先队列模块是一个优先堆数据结构，负责将待调度Pod根据优先级排序，优先级高的Pod排在前面，调度器会轮询优先队列，当队列中存在待调度Pod时就会执行调度过程。
调度模块由算法模块、Node缓存和调度扩展点三部分组成，算法模块提供对Node进行评分的一系列基础算法，比如均衡节点CPU和内存使用率的NodeResourcesBalancedAllocation算法，算法模块是可扩展的，用户可以修改和添加自己的调度算法；Node缓存模块负责缓存集群节点的最新状态数据，为调度算法提供数据支撑；调度扩展点由一系列扩展点构成，每个扩展点负责不同的功能，最重要的扩展点是Filter、Score和Bind这三个扩展点。
最后是绑定模块，负责将调度器选择的Node和Pod绑定在一起。

Kubernetes调度器代码采用可插拔的插件化设计思路，包括核心部分和可插拔部分。图1-2中的配置模块、优先队列和Node缓存是核心部分，算法模块、调度扩展点属于可插拔部分。这种插件化设计允许调度器一些功能通过插件的方式实现，方便代码修改和功能扩展，同时保持调度器核心代码简单可维护。

下图1-3列出了调度器扩展点模块中包含的具体扩展点。Pod的调度过程分为调度周期和绑定周期，调度和绑定周期共同构成Pod的调度上下文。调度上下文由一系列扩展点构成，每个扩展点负责一部分功能，最重要的扩展点是调度周期中的预选(Filter)和优选(Score)扩展点和绑定周期中的绑定(Bind)扩展点。预选扩展点负责判断每个节点是否能够满足Pod的资源需求，不满足就过滤掉该节点。优选扩展点部分会对每个Pod运行默认的评分算法，并且将最终评分加权汇总，得到最后所有节点的综合评分；调度器会选择综合评分最高的节点，如果有多个节点评分相同且最高，调度器会通过水塘采样算法在多个节点中随机选择一个作为调度结果，然后将该节点上Pod申请的资源用量进行保留操作，防止被其它Pod使用。在绑定周期中，调度器将Pod绑定到评分最高的节点上，这一步本质是修改Pod对象中节点相关的信息，并且更新到存储组件etcd中。

定制化算法方案

如果要实现自定义调度算法，主要有三种方案：

修改默认调度器的源代码，加入自己的调度算法，然后重新编译和部署调度器，论文kcss和kubecg中的调度器研究基于此方案实现；
开发自己的调度器，和默认调度器同时运行在集群中；
基于Kubernetes Scheduler Extender机制，在扩展调度器中实现自定义算法，论文dynamic IO中的算法实现基于这种方案。

上述三种自定义调度算法实现方案的优缺点见表2-1。综合来讲，

方案1改动最小，但是这样做会破坏开源软件的可维护性，当Kubernetes主干代码更新时，改动后的调度器要和上游代码保持一致，这会带来大量的维护和测试工作。
方案2是实现自己的调度器，并且在集群中运行多个调度器，多个调度器之间没有集群资源数据同步，存在并发调度数据竞争和数据不一致的问题。
方案3需要默认调度器通过API和Extender交互，新增的网络请求会增加整个调度过程的耗时。

2-1 自研调度算法方案对比

方案	优点	缺点
方案1：修改调度器源代码	改动小	破坏源代码、不好维护
方案2：运行多个调度器	不改动源代码	存在数据竞争、不一致
方案3：开发扩展调度器	不改动源代码	存在网络耗时

本文的调度器实现采用方案3，设计并开发符合Scheduler Extender机制和API规范的扩展调度器，将其命名为Liang。代码2-1是扩展调度器JOSN格式的策略配置文件，通过配置文件参数将该策略文件传递给Kubernetes默认调度器，其中urlPrefix表示扩展调度器Liang运行后监听的API地址，prioritizeVerb表示优选扩展点在扩展调度器中的路由。当默认调度器在优选扩展点运行完评分插件后会发送HTTP POST网络请求到Liang的API地址，并将Pod和候选节点信息放在HTTP Body中一起传递过去。接收到POST请求后，扩展调度器Liang会根据评分算法对节点进行评分并将结果返回给默认调度器。

{
    "kind": "Policy",
    "apiVersion": "v1",
    "extenders": [
        {
            "urlPrefix": "http://localhost:8000/v1",
            "prioritizeVerb": "prioritizeVerb",
            "weight": 1,
            "enableHttps": false,
            "httpTimeout": 1000000000,
            "nodeCacheCapable": true,
            "ignorable": false
        }
    ]
}

图2-1是带扩展的默认调度器(kube-scheduler)启动过程，通过kube-policy.json配置文件将扩展调度器Liang的配置信息告诉默认调度器。

扩展调度器Liang

扩展调度器Liang独立于Kubernetes默认调度器，Liang的模块设计和组织架构如图3-1所示，包括多维资源采集存储和API服务两大部分。多维资源数据采集通过在集群中运行Prometheus和node-exporter实现，扩展调度器Liang负责从Prometheus获取多维指标然后运用调度算法，将结果返回给默认调度器。

api server模块，负责实现符合扩展调度器数据格式和传输规范的API接口，Liang接收到Kubernetes的评分请求后，解析得到请求中的Pod和候选节点信息，作为参数传递给内部的调度算法，得到候选节点的评分结果并返回给默认调度器。
调度算法模块，扩展调度器Liang的核心模块，负责实现自定义的调度算法。得益于扩展调度器机制，Liang中可以实现多个自定义调度算法。本文主要设计并实现了BNP和CMDN两个调度算法。
数据缓存模块，主要功能有两个：
1. 通过请求Prometheus的API得到整个Kubernetes集群中所有节点的状态数据。
2. 实现基于内存的指标数据缓存机制，提供指标数据的写入和读取接口，提高算法运行时获取多维指标数据的速度。

Liang使用Go语言开发，代码量约3400行，开源网址为Liang开源地址。

表3-1是扩展调度器是否使用缓存机制和默认调度器做出调度决策的耗时对比，调度耗时通过在Kubernetes调度器源代码中打印时间戳的方式获取，分别运行9次然后计算平均值。从表3-1中可以看到，默认调度器做出调度决策的耗时非常小，不到1ms。加上扩展调度器和缓存机制的情况下，平均调度决策耗时为4.439ms，比默认调度器增加了约3ms，增加的时间主要是默认调度器与扩展调度器Liang之间网络请求耗时以及Liang运行调度算法所需的时间。当扩展调度器不加缓存机制时，每次做出调度决策的平均耗时为1110.439ms，调度耗时迅速增加超过100倍，主要是每次做出调度决策都要请求Prometheus计算和获取集群中的指标数据。因此，扩展调度器加上缓存机制可以避免请求Prometheus带来的网络请求时间，降低扩展调度器的决策时间，提升了扩展调度器的性能。

3-1 不同调度器架构决策耗时

调度类型	平均决策耗时
默认调度器	0.945ms
扩展调度器-使用缓存	4.439ms
扩展调度器-不使用缓存	1110.439ms

BNP算法

BNP算法在Liang中实现，它将网络IO使用情况纳入k8s调度算法的考量，能够均衡集群中的网络IO用量。

图3-2是实验中默认调度算法和BNP算法中，整个集群中网络IO资源的变化情况，每部署一个Pod统计一次数据，共部署九个Pod。可以明显看到，BNP实验中网络IO资源要比默认调度算法分配更均衡。

CMDN算法

CMDN算法在Liang中实现，它的目标是让集群中的多维资源分配更加均衡或者更加紧凑，核心步骤是针对CPU、内存、磁盘IO和网络IO以及网卡带宽这五个指标进行综合排序，选择最佳Node部署Pod。图3-3是实验中CPU使用率变化对比情况，可以明显看到，CMDN均衡策略下CPU使用率均衡程度要比默认调度算法分配更均衡。

总结

Kubernetes调度算法的通用性削弱了算法的定制性。本文研究了k8s调度器架构和扩展机制，对比了三种定制化调度算法方案，选择扩展方案实现扩展调度器Liang，并在Liang中实现了两个调度算法BNP和CMDN用于展示定制化算法能力。

扩展方案极大丰富了定制化调度算法的能力，可以满足非常多定制化场景的需求。同时也需要注意，定制调度算法往往需要更多的数据，这就需要在k8s集群中额外部署数据采集模块，增加了运维成本，降低了定制化调度算法的通用性。

原文链接，文章持续更新，可以微信搜索「 机器学习与系统 」阅读最新内容，回复资料、内推、考研获取相关内容。

机器学习项目是如何开发和部署的？

2020-05-29T12:31:25+08:00

本文以一个小项目带你弄清ML的项目流程

这周做作业查资料时，无意中看到一个GitHub项目ML-web-app，它以PyTorch训练MNIST文字识别模型为例，介绍了从模型训练到部署上线的整个流程。是非常好的学习项目！下图是效果图:

笔者浏览了项目的代码,以学习为目的,简单解读下这个项目。

模型训练

模型训练是相对独立的部分，可以由算法工程师来做。总结起来就是调用PyTorch接口，建立一个神经网络，然后利用MNIST数据进行训练，最后把训练好的模型文件存储起来，后面部署的时候要用到。

服务部署

该项目使用Flask框架部署服务，为了方便阅读，笔者对代码进行了精简。

下面的代码中，通过加载预训练好的模型数据，得到模型实例，可以进行预测：

# initialize flask application
app = Flask(__name__)

# Read model to keep it ready all the time
model = MyModel('./ml_model/trained_weights.pth', 'cpu')

核心预测API路由，路径是/predict。

@app.route('/predict', methods=['GET','POST'])
def predict():
    results = {"prediction" :"Empty", "probability" :{}}

    input_img = BytesIO(base64.urlsafe_b64decode(request.form['img']))

    res =  model.predict(input_img)
    return json.dumps(results)

请求过程

默认主页是通过模板渲染的，在index.js中定义了两个核心函数：

onRecognition函数通过Ajax向/predict API路由发送POST请求，请求中封装了要识别的图片，然后获取模型预测结果。

// post data to server for recognition
function onRecognition() {
    $.ajax({
            url: './predict',
            type:'POST',
            data : {img : cvsIn.toDataURL("image/png").replace('data:image/png;base64,','') },

        }).done(function(data) {
            showResult(JSON.parse(data))
        })
}

showResult函数把结果渲染出来。

function showResult(resultJson){
    // show predict digit
    divOut.textContent = resultJson.prediction;
    // show probability
    document.getElementById("probStr").innerHTML =
        "Probability : " + resultJson.probability.toFixed(2) + "%";
}

总结

这个项目麻雀虽小，五脏俱全。可以帮助非算法类程序员一窥ML从建模到上线部署整个流程，透过火爆的趋势看清本质。

如果你对人工智能/机器学习感兴趣，给大家准备了福利，赠送三本周志华老师的新书《机器学习理论导引》，点击文末送书，周志华领衔撰写，历时4年，宝箱书问世！查看详情，或者点击某当200-30优惠券，百万好书任你选领取私人订制购书满减券。福利不要错过~

文章持续更新，可以微信搜索「 机器学习与系统 」阅读最新内容，回复资料、内推、考研获取我为你准备的惊喜~

操作系统是如何管理物理内存的？

2020-04-12T20:34:09+08:00

本文是操作系统系列第三篇，介绍物理内存管理。操作系统对内存的管理是非常复杂的，和程序的执行、硬件、编译器等密切相关。本文从物理内存入手，介绍内存管理的重要概念，也为后续的虚拟内存管理内容做铺垫。原文链接，更多内容见公号机器学习与系统，欢迎与我互动~

内存管理的需求

抽象，即给每个程序逻辑地址空间
保护，不同程序的地址空间互相隔离，无法越界访问
共享，对于一些公共函数库，可以只在内存中存一份，其它程序引用这一个库即可
虚拟化，通过逻辑地址和虚拟内存，可以使用更大的地址空间

地址的概念

地址是用来标志存储资源位置的，在计算机中用一串二进制数据表示。

一. 地址空间

地址空间就是指地址的范围，从最小值到最大值：

物理地址空间从0到物理内存的最大值：0~MAX_sys
逻辑地址空间从0到程序虚拟内存范围的最大值：0~MAX_prog

下图展示了物理地址空间，进程A、B的逻辑地址空间。

二. 地址生成

物理地址是已经确定的，逻辑地址的生成依赖于编译器。

编译：将高级语言编译成汇编语言。假设此时此时地址已知，如果起始地址改变，必须重新编译
汇编：将汇编语言翻译长机器能够识别的二进制代码，里面的地址是该程序执行时，对应地址空间中的位置
链接：将程序执行需要的函数库链接到可执行文件中，更新地址空间
加载：将函数加载到内存中时根据程序块在内存中的位置更新逻辑地址空间内的地址(重定位)
执行：执行代码时，程序在内存中可能会移动，这里需要地址转换(映射)支持

三. 地址解析

下图是CPU和计算机的基本架构，我们以此图来说明物理/逻辑地址在CPU和计算机中如何被解析处理的。

首先，CPU中的算数逻辑单元看到的都是逻辑地址
当CPU需要把数据写入内存或从内存中读取时，MMU会把逻辑地址转换成对应的物理地址
控制逻辑把数据、操作请求和物理地址发送到总线，分为读请求和写请求
- 写请求，则把数据写入内存
- 读请求，则把数据从内存中读取发送给CPU

在上面的过程中，MMU负责逻辑地址和物理地址之间的转换，操作系统负责建立逻辑地址和物理地址之间的映射关系。

连续内存分配

基本概念

连续内存分配：给程序分配一块连续内存区域
内存碎片：内存上一些没有被分配利用的区域
- 内部碎片：某个程序分配的内存没有充分利用。是否产生取决于分配算法，比如分配的内存大小是否要取整
- 外部碎片：被分配的内存区域之间没的的空闲区域
碎片整理：通过调整进程占用的内存区域位置来减少或避免分区碎片
碎片紧凑：通过移动分配给进程的内存区域，以合并外部碎片。要求运行的程序都可以动态重定位

动态分配

当程序被加载时，根据进程的实际需要动态分配内存空间，使分配的大小刚好与作业的大小相等。动态分区分配并不预先将内存划分成一块块分区，而是在程序进入内存时，根据程序的大小动态地建立分区，因此系统中分区的大小是可变的，分区的数目也是可变的。

有以下三种分配策略：

最先匹配(First-fit)：分配N个字节，使用第一个可用空间比N大的内存块。如分配400 byte的内存块，按照从上到下的查找顺序，应该分配1K byte内存区域。如果是从下往上查找，应该分配5K byte的区域。
最佳匹配(Best-fit)：分配N字节分区时，查找并使用不小于N的最小空闲分区。如果要分配2800 byte，应该分配3K byte区域。
最差匹配(Worst-fit)：分配N字节，使用尺寸不小于N的最大空闲分区。如果分配800 byte，则选择5K byte区域。

上述三种分区算法，在释放分区时，都要检查是否能和周围的分区合并。

非连续内存管理

连续内存分配会出现内/外部碎片、动态修改比较困难、内存必须连续，而且内存利用率不高。因此提出了非连续内存分配的方法，允许程序使用非连续的内存空间、允许共享代码和数据，以提高内存利用效率和管理的灵活性。

当然，这也带来了挑战：非连续内存分配中，如何有效实现和管理逻辑地址和物理地址间的映射。

下面介绍三种方式：

段式存储管理(segmentation)
页式存储管理(paging)
段页式存储管理(上面两者的综合)

段式存储管理

段(segment)指一类地址空间，一个段就是一个地址连续的内存块，若干个段组成程序的逻辑地址空间。

每个段由0到最大的线性地址序列构成。各个段的长度可以是0到某个允许的最大值之间的一个数。不同的段的长度可以不同(通常情况下也都不一样)，段的长度在运行期间可以动态改变，比如push数据时，堆栈段的长度会增加，pop时会减少。段也可以被装满，但是通常情况下段的长度很大，这种情况很少发生。

段式存储管理下的逻辑地址组成格式为(s, o)，s为段号，o为段内偏移量，段号和对应内存中的物理起始地址由段表记录。寻址时，先根据段号到段表中查到物理起始地址(基址)，然后加上偏移量，得到最终的物理地址。

页式存储管理

页式存储管理有两个至关重要的概念：

物理页帧(Frame | Page Frame | 帧 | 页帧)：把物理地址空间分成大小相同的基本单位。大小为2^n，如512/4096等。
逻辑页面(Page | 页)：把逻辑地址空间划分为相同大小的基本单位
页帧大小和页面大小必须一致

页式存储管理的寻址方式和段式管理类似，逻辑地址格式为(p, o)，表示页中的地址，其中p表示页号，o表示偏移量。物理地址格式为(f, o)，表示页帧中的地址，其中f表示页帧号，o表示偏移量，页偏移量和页帧偏移量是相等的。

页和页帧的对应关系使用页表(Page Table)来管理。寻址时首先根据页号找到页表中对应的页帧号，然后用得到的页帧号与偏移量组成实际的物理地址。

页面和页帧的大小相比分段要小得多，假设系统是32位，页帧大小1024字节，这样有2^32/2^10=2^22条页表记录，查询页表的时间要多很多。下面介绍两个提高性能的方法：

使用快表(Translation Look-aside Buffer, TLB)：直译为旁路快表缓冲，可以理解为页表缓冲。即在内存和CPU之间搭建页表缓存，寻址时先到TLB中查找，未命中再到内存中的快表查找
多级页表：(p1, p2, o)是两级页表的虚拟地址表示，先根据p1查找页表1中的p2，再根据p2查询真正的页帧号，然后根据偏移地址o查到最终的物理地址

分段和分页的比较

分页和分段系统有许多相似之处。两者都采用离散分配方式，且都要通过地址映射机构来实现地址变换。但在概念上两者完全不同，主要表现在下述三个方面：

页帧是信息的物理单位，分页是为了实现非连续分配，以便解决内存碎片问题, 提高内存的利用率。段是信息的逻辑单位，分段的目的是为了能更好地满足用户的需要。
页的大小固定且由系统决定，由系统把逻辑地址划分为页号和页内地址两部分，是由机器硬件实现的，因而在系统中只能有一种大小的页面。而段的长度却不固定，决定于用户所编写的程序，通常由编译程序在对源程序进行编译时，根据信息的性质来划分。

段式存储和页式存储都是为了更好管理内存，段式从程序的角度入手，页式从物理底层的角度入手，在理解上，可以结合两者的优缺点进行选择：

	分段	分页
优点	段长可动态修改，方便编程，分段共享，分段保护，动态链接，动态增长	非连续分配，减少内存碎片，提高内存利用效率
缺点	内部碎片，地址计算需要更多硬件支持	需要两次内存访问，页表可能很大

段页式存储管理

段页式存储管理充分利用了段式存储在内存保护方面有优势，页式存储在内存利用和优化转移到后备存储方面有优势。

在段式存储管理基础上，给每个段加一级页表。逻辑地址格式为(s, p, o)，s为段号，p为页号，o为页内偏移。寻址时，现根据段号s查找段表中的页表地址，然后到页表中查找p对应的起始地址，最后加上偏移o得到最终的物理地址。

总结

程序在执行时，CPU看到的是逻辑地址，当CPU读写数据时，由MMU根据逻辑地址找到对应的物理地址，然后到总线上读写数据。通过这种管理机制，可以更好地管理内存，在多道程序执行中做到隔离和共享。

文章持续更新，可以微信搜索「 机器学习与系统 」阅读最新内容，回复【内推】【考研】获取我准备的头条内推以及考研信息

Reference

只要15美元，畅享O'Reilly所有在线学习资源！

2020-01-15T16:05:55+08:00

O'Reilly是世界著名信息技术图书出版公司，它为读者提供了丰富的在线学习资源，但是个人会员499美元/年，是一笔不小的开销。笔者发现通过注册ACM会员，只要15美元/年就可以畅享O'Reilly所有学习资料，读完1-2本书，就赚回会员费了！

这里分享给大家具体实践方法：主要有两种方式，一个是通过CCF协助注册ACM会员，另一个是在ACM官方网站直接注册。

CCF协助注册ACM会员

需要先注册CCF会员（学生50元/年，成人200元/年），然后登录CCF网站，通过CCF网站协助注册ACM会员。注册信息如下：

......
交费标准：会员：175元人民币；学生会员：133元人民币
......
会员资格何时生效？
根据CCF与ACM达成的协议，CCF会员部每月25日（如遇周末提前至周五或延至周一）将当月交费的会员信息提交给ACM。ACM将在次月10日左右给申请者发送资格生效手续邮件，交费凭证、会员号和会员有效期也将一并发至邮箱。

ACM官网直接注册

官网注册优惠的原理是，ACM针对发展中国家提供了折扣，我国还是发展中国家，根据2020年1月15号的数据，成人15美元/年、学生8美元/年。如果有美国信用卡，注册起来会很方便，如果没有的话，可以在某宝上找代付。算下汇率和手续费也比CCF协助注册要划算。注册链接如下：

专业会员(非学生)折扣注册链接 https://services.acm.org/publ...
学生会员注册链接 https://services.acm.org/publ...

填写完信息提交后，ACM会在后台生成数据和收费链接，这个收费链接要牢记。

可选：如果需要代付，把收费链接发给代付，付完钱ACM会发送邮件到你的邮箱，根据邮箱中的链接和网页提示激活账号、设置密码等。

两种方案比较

比较项	CCF	ACM
生效时间	每月25号提交给ACM，次月10日生效	立即生效
价格	成人375元，学生183元	成人15美元，学生8美元
权益	CCF会员权益+ACM会员权益	ACM会员权益

通过对比可以发现，如果是已经工作的软件开发人员，直接注册ACM会员是最划算的。

进入O'Reilly学习网站

注册完后，可能会找不到如何用ACM的账号进入O'Reilly的学习资源页面，这里介绍网页、App和ACM官网三种方法。

网页

浏览器输入http://learning.oreilly.com/，登录时输入ACM的账号邮箱，会自动跳到ACM的统一认证网页，输入ACM账号密码，成功后进入O'Reilly学习网页。

移动端App

移动端的登录方式和web网页端原理是一样的，登录的时候输入ACM邮箱，O'Reilly会自动跳到ACM统一认证页面，输入ACM账号密码，成功后自动跳回O'Reilly App。

ACM网站跳转

访问ACM学习中心https://learning.acm.org/，点击右上角O'Reilly，即可跳转到O'Reilly学习中心。

Reference

欢迎关注公众号QuanTalk，了解更多计算机科学与技术、阅读分享、独立思考内容。

从社区报告看美国未来20年的AI战略

2019-09-24T07:18:52+08:00

2019年8月6号，美国计算社区联盟(CCC)和人工智能促进协会(AAAI)联合发布了美国未来20年AI研究路线图。主要关注如何发挥AI的价值和减轻AI的风险。小编对摘要部分进行翻译梳理，总结后分享给读者。关注公众号QuanTalk，回复“ai20”，获取完整PDF报告~。

概览

数十年AI研究产生了强大的技术，为工业、政府和社会带来了巨大的收益。现在的AI系统可以做到多语言翻译、识别图片和视频中的物体、简化生产过程以及控制汽车。AI系统的部署不仅创造了万亿美元的产业（这一数字将在3年内翻翻），也暴露了很多问题：如何让AI系统更加公平、可信、值得信赖和更加安全。未来的AI系统将能有效地识别它们所处的世界，高效、合乎道德地处理复杂任务，进行有意义的交流并且通过经验提高它们的意识。

如何充分发挥AI技术的潜力呢？这需要对AI研究企业进行根本地变革，并通过大量、持续的投资促进变革。下面的内容是由计算社区联盟和人工智能促进协会社区合作完成的主要建议，目的是为未来20年的人工智能研究和发展制定路线图。

AI带来了哪些社会效益

AI系统有潜力对社会各个部门产生根本性影响，并带来实质性创新和经济增长。主要有：

促进健康和提高生活质量
提供终生学习和培训的机会
重构企业创新和竞争规则
聚合科学发现和技术创新
证据驱动的更科学和合理的社会机会和政策
变革国家防御和安全手段

可以看到，AI将对个人、组织、社会产生巨大影响。

如何实现这些社会效益

在AI研究上，需要注意以下重点，它能激发社会驱动力：

集成智能
有意义的互动
主动学习

社区建议

开创和运营国家AI基础设施
- 开放AI平台和开放资源建设
- 社区驱动持续产生AI挑战
- 建立国家AI研究中心
- 建立任务导向的AI实验室
重新定义和培训全面的人工智能员工
- 开发不同层次的AI课程
- 为高级AI学位创建招聘名额和保留计划
- 重视少数群体和弱势群体
- 激励新兴的跨学科AI领域
- 强调AI道德准则和政策
- 解决AI和工作新旧更替期间的挑战
- 训练高水平AI工程师和技术人员
基础人工智能研究的核心项目至关重要

路线图

总结

AI被认为是新的水和电，是社会发展至关重要的生产力。目前中国和美国在AI领域处于世界领先位置，但是中国以应用为主、美国基础研究实力雄厚，即中国在基础研究上不及美国。

上面的社区研究报告可以给我们参考，决定未来的研究领域，以更好地实现陶融品性、创获智慧，促进民族和社会的发展。

全民CS、校训就是搬砖，这所学校计算机顶尖是有原因的

2019-08-23T18:18:50+08:00

原文链接

卡耐基梅隆大学（下文简称为CMU）的计算机科学享誉全美，被视为该领域的领导者。CMU的计算机科学研究生教育全美最佳，软件工程专业更是遥遥领先于其它名校，本科生的声誉也在雇主中排名第一。

像这样的顶尖大学，本文无法面面俱到，而是从计算机专业培养入手，结合院系、课程、培养方案等角度总结其培养学生的特点，为CS领域或想转行CS的小伙伴提供可借鉴的方法和参考。

校训

CMU的校训是卡耐基先生的名言：My heart is in the work（我心于业），即使经历了百年内数次重大革新，这样的信念依旧根深蒂固融于整个大学文化中。

在校训的指引下，卡耐基梅隆大学对学生的训练异常严格，课业繁重，在普林斯顿评论（Princeton Review）每年“学生累得像狗的大学排名”中，从来高居前几位，与加州理工学院、麻省理工学院、芝加哥大学、普林斯顿大学等同为美国乃至全世界训练最为残酷的大学。

最大的学院

在院系设置上CMU和UC Berkeley、MIT和Stanford都不同，计算机是一个独立的学院-计算机科学学院，School of Computer Science 下面简称SCS。SCS是为数不多将计算机科学独立设院的大学，隶属于CMU七大学院之一，是全美乃至全世界最大的计算机学院。因此，CMU的学生戏称自己是全民CS。

SCS下面设置多个部门和研究所，由这些研究所为学生提供专业和培养方案。

丰富专注的课程

CMU的课程也是按编号管理的，格式为XX-xxx，前缀XX表示课程由哪个部门开设，计算机科学部的编号是15，后面的xxx是一个三位数，第一位表示课程的难度/水平，一般数字越大，难度和级别越高。

计算机科学学院的课程信息查询有多种方式：

课程表。
不同部门开设的课程。
Catalog为学生指引。

课程表

以学期为单位发布当前学年的完整课程表，里面列出当前学年的所有课程，但是只有课程信息、上课地点，没有具体的课程页面，适用于本校学生查询。

研究所课程

除了上面的两种方法，在计算机科学学院每个部门、研究所官网上都有详细的课程信息：

Computer Science Department Course List：计算机科学学院的课程列表
Machine Learning Department：人工智能系课程
Human-Computer Interaction Institute：人机交互研究所课程
Robotics Institute：机器人研究所课程
Language Technologies Institute：语言技术研究所课程
Computational Biology Department下的本科课程和研究生课程
Software Engineering Institute Courses：里面的课程偏向培训

课程目录(Catalog)

计算机学院大而全，院系和课程都非常多，Catalog是以学院下属的研究所、部门为单位进行细分的：

如果上面的课程让你眼花缭乱，你可以到专门的课程搜索页查询课程。

上面介绍的三种方法可以让你找到自己需要的课程，这里总结几个比较出名的课程：

15-440/640 Distributed Systems，这门课有两个版本，Yuvraj Agarwal和Srini Seshan上的Fall学期，以及Satya和Babu上的Spring学期。Fall的15640用Go语言，更加偏向于应用一些（e.g. 实现mapreduce、比特币挖矿），Spring的15640用C和Java,更加偏系统一些。
Fundamentals of Programming and Computer Science，全美最好的五门计算机课程之一，面向本科生的基础课程，最新课程页面为：https://www.cs.cmu.edu/~112/，目前还没有更新，感兴趣的小伙伴可以持续关注。
15-213: Introduction to Computer Systems，该门课程诞生了著名神书CSAPP，书和课程配套学习效果最佳！
10-605 in Fall 2017 Machine Learning with Large Datasets
17-445/645 Software Engineering for AI-Enabled Systems

教育

SCS的研究生教育和人工智能专业全美排名第一，做到如此成就，在教育上自然有其自身的特点，笔者总结为：方向丰富、领域专注、提供交叉专业。

本科

因为SCS是一个大学院，下设七个部门，而且有全美顶尖的专业，所以它不仅为本系学生提供了全面的培养体系，也为CMU的所有学生提供了计算机学习机会。SCS的专业设置大概分为以下几个类型：

Undergraduate Majors：面向CS系学生的专业
Undergraduate Additional Majors：类似国内双学位，学生可以修两个专业，这里的CS是第二学位
Undergraduate Minors：辅修专业，全校的学生只要符合条件都可以选择

基于上面的专业框架，CS系为本科生提供了丰富、灵活的选择：

Computer Science：计算机科学专业，也是CS领域的核心
Artificial Intelligence：全美排名第一的人工智能专业
Human-Computer Interaction：人机交互专业
Robotics：机器人专业
Computer Science and the Arts：计算机科学与艺术专业，交叉学科
Music and Technology：音乐与计算理论专业，交叉学科
Computational Biology：计算生物专业，交叉学科

丰富的专业下，为了让学生更深入、专注学习某个核心领域，SCS提出了Concentration的概念，让学生能聚焦以下领域：

Algorithms & Complexity：算法与复杂性，学生学完应该达到申请博士项目的水平。
Computer Systems：计算机系统，学生能够理解系统的设计和开发，比如内核开发、编译器优化、分布式系统设计等，达到申请博士水平或工业界同等水平。
Security and Privacy：安全和隐私。
Software Engineering：教授高效开发现代大规模软件的技巧和知识。
Computational Biology

老师们考虑周到，在提供丰富、灵活选择的同时，为避免由此带来的广而不精，为学生们提供了核心领域，让他们能够专注学习，做到广而精，成为T型人才。

研究生

硕士学位分布在上文提到的7个部和研究所中，这些研究所负责提供学位、培养学生。硕士专业和方向网站上一共有20个专业，非常多！这里笔者列举几个和计算机相关的：

Computer Science
Machine Learning
Computer Vision
Product Management
Computational Data Science
Artificial Intelligence and Innovation
Intelligent Information Systems
Language Technologies
Robotics

每个专业都有专门的培养方案和要求，相关信息都列举在各个专业详细网页里面。

总结

CMU的计算机是单独设院的，并且是全美最大的计算机学院。在向学生提供广泛方案的同时，还帮助学生聚焦在某个领域深入学习，同时提供交叉学科培养方案，使学生成为广而精的顶尖人才。

因此，作为开发者，要能做到致广大而尽精微：广泛阅读学习的同时，要能专注于某个领域。

Reference

Grail：Uber是如何管理大规模基础设施的

2019-08-21T17:50:01+08:00

本文介绍Uber存储平台团队是如何管理自己的存储基础设施的。他们把基础设施抽象成图模型，以此收集状态，然后根据这些信息执行运维任务、制定决策。

易于获取当前系统状态对于规模化构建、维护基础设施至关重要。由于Uber的商业持续扩张，我们的基础设施在规模和复杂性上不断增加，使得我们必要时获取所需信息变得很困难。

为了解决这个问题，我们开发了Grail，一个聚合状态信息并在一个全局视图中展示、横跨多个数据中心和区域的平台。有了Grail，我们可以更容易地开发快速、健壮的运维工具。

继续阅读以了解Grail如何通过图模型，根本性地改变Uber工程部门操作存储的方式，使团队更容易缝合不同源头的数据。

设计简单的管理方式

2016年末，为了支撑不断增加的负载，我们把所有数据库主机从旋转式硬盘更新到固态硬盘。有一步很重要，就是依然能够鉴别和追踪使用旧硬件的成千上万数据库。

那时候我们没有容易的方式获取设备的当前状态，并且还要追踪大量脚本和任务。这驱使我们寻找不同的方法来开发大规模运维工具，需求如下：

持续收集整个基础设施的状态。
唯一的全局视图。
低延迟从所有数据源获取所有数据。
关联所有数据源的数据。
简单添加和删除数据源。

Grail简介

不像Metricbeat和osquery等类似信息收集系统，Grail不收集特定领域的信息，它的角色是一个平台，以高可用和响应式的方式聚合、链接和查询来自不同数据源的数据，例如主机、数据库、部署和所有权等信息。它高效隐藏了实现细节。

此外，你可以接近实时的方式，快速获取下面问题的答案：

哪些主机当前空闲空间超过4TB？
某个团队的数据库使用多少磁盘空间？
哪些数据库运行在旋转磁盘上？

如果你的服务和主机很少，这些问题就不重要。你只需要写一个脚本，在需要的时候直接收集信息就行了。但是以Uber的规模，当你有一堆服务和数十万主机时，这种方法就失效了。节点太多响应就会慢，查询完后数据关联会出错，结果也不能反映真实情况了。大规模场景下很难及时收集状态。

一个关键结论是“不存在唯一的真理来源”。数据中心和系统的信息总是分布在多个地方，只有把它们关联起来才能做决策。更复杂的是这些状态一直在变：主机的空闲磁盘空间在变、供应新的存储集群、并行发生的其它事件。整个系统的状态不可能实时获取，只能接近它。

规模化维护

Uber的存储平台团队开发维护的存储系统支撑了拍字节的关键任务数据，我们的运维工具有一套标准的自我修复范式，有三个简单步骤：首先我们收集系统状态，然后和正常状态比较，最后处理异常数据。

如前文所述，在大规模场景下，不使用Grail这样的聚合平台是很难收集状态。举个例子，当我们想获取所有运行主机当前状态时，比如trips数据。首先我们要先找出哪些主机包含这个数据。接下来我们要连接到这些主机并收集当前状态。最后转换并展示结果。

有了Grail，我们只需要运行一条查询语句，就可以获得需要的信息：

TRAVERSE datastore:trips (
  SCAN cluster (
    SCAN db (
      SCAN host (
        FIELD HostInfo
      )
    )
  )
)

结果以json文档的形式返回，与查询结构非常相似，对代码友好。下面的代码片段展示了运行上面查询语句的精简版结果：

{
    "__id": "datastore:trips",
    "cluster": [{
        "__id": "cluster-trips-us1-44",
        "db": [{
            "__id": "cluster-trips-us1-44-db26",
            "host": [{
                "__id": "host:database862-sic1",
                "HostInfo": {
                    "cpuCount": 24,
                    "puppetRole": "database",
                    "memory": {
                        "freeBytes": 1323212425,
                        "totalBytes": 137438953472
                    },
                    "disk": {
                        "freeBytes": 48289601723,
                        "totalBytes": 1598689906787
                    }
                }
            }]
        }]
    }]
}

拼接数据

Grail围绕对Uber基础设施的两项观察进行设计。第一，基础设施中节点和节点间的联系可以很自然地建模为图。

模型图中的节点通过唯一的键进行标识，键由类型和名字以type:name的形式构成。数据源使用节点键将包括属性和连接的数据附加到节点上，因此数据就好像被节点键标识一样。节点的键空间是全局的，而属性和连接的键空间相对于节点是局部的。

Grail的对象模型是这样的，建模图中的节点由数据源生成的属性和连接隐式定义，这意味着下面条件至少满足一条节点A存在：

数据源产生的数据有A的属性。
数据源将节点A与至少一个其它节点关联。
数据源至少将其它一个节点与A关联。

第二点是单个基础设施概念，比如主机或数据库的信息是去中心化的。这意味着获取完整数据视图需要结合不同系统的信息。

Grail的方法是让每个数据源提供自己所属子图来解决去中心化问题。这些子图可能会有重叠，因为数据源可能把属性和连接附加到同一个节点。

上图最上面展示了三个子图。实线和颜色表示子图由哪些数据源提供，虚线表示整个图。下面的图表示从Grail用户的角度看到的视图。

通过方法，我们可以自动更新数据源的所有数据。对不同数据源，我们能够以不同的速度并行更新数据。

上图中，数据源1在键HostInfo下附加属性，数据源2键ServiceInfo下附加属性，并将此节点和关联类型Service下的一系列服务建立联系。

数据导航

随着设计的实施，我们需要一种简单的方法，能够在图中执行特定遍历。我们调研的技术中没有能很好符合需求的。比如，GraphQL需要定义模式，且不支持映射和节点间命名关联。Gremlin)似乎可以，但实现并单独使用它非常复杂。所以我们开发了自己的方案。

我们的查询语言YQL，用户只需要指定一个开始节点集，然后通过后面的条件遍历图，同时与沿图属性中的字段交互。举个例子，下面的查询语句列出了所有满足条件的主机：空闲内存大于40G、剩余磁盘空间大于100G且是SSD：

TRAVERSE host:* (
  FIELD HostInfo
  WHERE HostInfo.disk.media = “SSD“
  WHERE HostInfo.disk.free > (100*1024^3)
  WHERE HostInfo.memory.free > (40*1024^3)
)

迁移到内存

从发布起Grail的架构经历多次迭代。起初，它是我们之前数据库运维工具的内部组件。第一版迭代受TAO启发，基于Python开发，使用redis存储图。当它变得低效时，我们决定把它作为一个单独服务用Go重写，使用共享的ElasticSearch集群存储。但是随着时间的推移，我们发现这个方案在快速、有效摄取和查询所需信息时，缺少伸缩性和低延迟。

我们重新思考它的架构，把之前存到共享ElasticSearch集群中的数据迁移，改为直接存储到每个查询节点上定制的内存数据库里。

当前Grail的高层架构包含三个组件：

Ingesters，从配置的数据源收集数据。
Coordination，确保严格的数据更新顺序。
Query Nodes，为数据获取提供水平扩展能力

Ingesters周期性从预配置的数据源中收集数据，然后通过Coordination集群传输，最后存储到每一个查询节点上的datastore中。Coordination由定制的内存Raft集群实现，基于etcd Raft库开发。Raft协议确保数据更新和被存储到datastore的顺序，同时确保重启后数据一致。Coordination Nodes和Query Nodes都包含了存储在datastore中的每个数据源最新数据更新。当Raft-logs被截断时，Coordination Nodes只使用datastore中的数据来创建当前数据的快照。

datastore是一个简单的键/值抽象，数据源的名字作为键，不同的键下面存储每个数据源最新的数据更新。所有数据源的数据分开存储，只有在执行查询时才聚合起来。

Grail通过在每个区域运行各自的实例，为我们提供基础设施的全局视图。每个实例负责从本地主机和服务收集数据。查询节点根据配置追踪本地和远程区域上的raft-log。当执行查询时，查询引擎把本地和远程信息结合起来。

为了扩展Grail，我们可以部署多个coordination集群、扩展查询引擎来支撑分布式查询，以便将来可以增加数据吞吐量和大小。

处理精确问题

在与分布式系统交互时，考虑到信息不准确非常重要。不管数据如何提供，来自聚合平台或直接来自源头，在系统变化时不可避免会有延迟。分布式系统不是事务的，你不能用一致的快照获取它。不管基础设施规模如何，这些条件都是对的。

我们的运维工具使用Grail的信息做决策。当这些决策需要改变系统时，在应用改变之前，我们总是确保双重检查源头的信息。举个例子，当主机端的代理程序被分配任务时，代理程序在执行任务前会先检查先决条件是否满足，比如判断主机是否有足够的磁盘空间。

关键点

正如前面所讨论的，高效基础设施管理需要深刻洞察系统状态。当规模很小时这很简单，你只需要按需查询数据即可。但是这个方法不适用大规模系统，这时你要将信息聚合到一处。正如我们在实践中学到的，当有数十万主机和许多系统时，快速获取合理且最新的系统状态很重要。

最后Grail的优势可以总结为三点：

所有数据都被聚合到支持通用查询API的单一共享模型。
低延迟查询所有地区当前状态。
团队可以附加自己特定领域的概念，并将它们与来自其它领域的相关概念关联起来。

目前，Grail服务我们存储方案的大多运维工具，并且对基础设施的各个方面都有几乎无数的使用案例。事实上随着信息范围不断增加，会有更多的使用案例。

欢迎关注公众号QuanTalk，专注于计算机科学与技术、独立思考、阅读分享，开发者认知、学习、成长平台。

黑客图标

2019-02-17T15:55:11+08:00

Linux社区有他们的企鹅Logo，BSDers有他们的Daemon Logo。Perl有骆驼Logo，FSF粉丝有他们的gnu和OSI有一个开源徽标。从历史上看，我们所没有的是一个代表整个黑客社区的标志，标志是所有这些组织的一部分。这是一个我们采用的提议 - 灵感来游戏Game of life的Glider pattern。

在alpha测试中，大约一半的黑客看到这个想法后立刻说说“哇！酷！”，无需测试者进一步解释。如果你不知道Glider pattern是什么，或者为什么它会成为一个好的标志，或者如果你对可能的标志感到怀疑，请阅读FAQ页面。

我在2003年10月首次提出这个标志。从那以后，它已经广泛应用，你可以从左边的国际翻译数量看出来。Glider标志的成功并不是绝对的，因为许多黑客原则上反对徽章的想法。

如果我展示它，意味着什么？

当你将Glider标志放在网页上、或将其印在衣服上、或以其他方式展示时，你就会明显地将自己与黑客文化联系起来。这与声称自己是黑客并不完全相同--因为黑客是一种荣誉称号，通常必须由他人授予，而不是自我假设。但是通过使用这个标志，你表达了对黑客目标、黑客价值观和黑客生活方式的认同。有关详细信息，请阅读FAQ页面。

是的，在提案发布后仅仅四天，就有杯子和T恤周边。但请注意，我与此无关并且不发表评论;事实上，收益将转移到Electronic Frontier Foundation（电子前沿基金会）。另一个早期的商品已经消失，但其他商品已经填补了这个空白。

谁不应该使用这个标志？

如果你认为黑客攻击是入侵他人的计算机，那么我们这些提出此标志的人不希望你展示它。去发明你自己的徽章。如果与我们混为一谈，我们会找到一些拒绝公开的方法羞辱你。

我曾经禁止将Glider用于商业。一些固执的人认为这是不切实际且不公平。但我认为要保持它的初心，否则你会引火烧身。

如何使用它？

Glider不受版权保护也没有注册商标。推荐在网页上使用它，图像和链接返回到此页面或直接指向如何成为黑客。以下是你可以粘贴到页面中的XHTML片段。

<a href='http://www.catb.org/hacker-emblem/'>
<img src ='http：//www.catb.org/hacker-emblem/glider.png'alt ='黑客会徽'/> </a>

你可以随意放大或缩小图像。此PNG文件是从PIC源生成的，尺寸减半。你还可以下载SVG版本，可内联的SVG版本，封装的PostScript版本，甚至TEX源。

买图标的地方？

我与这些地方无任何关联，这里列出来是方便大家，而不是认可。链接可能随时过期，使用风险由你自己承担。你的邮费可能会改变。

变种

在制作自己的变体之前，请阅读FAQ页面。以下是我发送过的一些内容：

.O.
..O
OOO

| _ | 0 | _ |
| _ | _ | 0 |
| 0 | 0 | 0 |

  . 
    .
. . .

这是一个karamba主题，用于在KDE桌面上显示Glider标志。

这是一个ico版本，这是另一个版本。如果你将其中一个命名为favicon.ico并将其放在网站的文档根目录中，它将成为你的网站图标。

这些纹身图像1和图像2令人印象深刻，但也许有点过了。

说明

翻译：@AdolphLWQ
项目地址
tt：自动生成翻译模板
2019翻译任务：7/52

AutoML：自动设计自动驾驶机器学习模型

2019-01-25T12:35:10+08:00

译者说

本人介绍了谷歌自动驾驶子公司Waymo在AutoML领域的研究成果。自动驾驶对神经网络模型的准确性和延迟要求，这要求工程师手动调优不同的神经网络架构，这不仅花费了大量的时间，而且能够调优的数量是有限的。因此，Waymo和Google AI的研究员合作，自动生成神经网络架构并训练评估，即AutoML，以便节约时间并寻找最佳模型。本文介绍了他们的初步研究成果，从取得的进展来看，未来可期。

正文

By: Shuyang Cheng and Gabriel Bender

在Waymo，机器学习几乎在我们自动驾驶系统的每个模块都起着关键作用。它可以帮助我们的汽车看清周围的环境、感知世界、预测其他人的行为，并决定自己下一步最佳移动。

采取感知：我们的系统组合多个神经网络，使车辆能够解释传感器数据以识别物体，并随着时间的推移跟踪它们，以便车辆能够深入理解周围的世界。创建这些神经网络通常是一项耗时的任务; 我们要优化神经网络架构，以使网络的质量和速度满足在自动驾驶汽车上运行，这是一个复杂的微调过程，一项新任务的调优通常花费工程师数月时间。

现在，我们与Brain团队的Google AI研究员合作，将前沿研究付诸实践来自动生成神经网络。更重要的是，这些自动生成的神经网络比工程师手动调优的网络具有更高的质量和更快的速度。

为了把我们的自动驾驶技术带到不同的城市和环境，我们需要以极快的速度优化我们的模型以适应不同的场景。AutoML让我们做到这一点，它提供了大量的有效且持续的ML解决方案。

迁移学习：使用现有的AutoML架构

我们的合作始于一个简单的问题：AutoML能否为汽车生成高质量和低延迟的神经网络？

质量衡量神经网络的准确性。延迟衡量神经网络的速度，它也称为推理时间。由于驾驶是一项需要车辆实时反馈、系统足够安全的关键活动，因此我们的神经网络需要低延迟运行。我们大部分直接运行在车辆上的神经网络提供结果的延迟小于10ms，这比在数据中心数千台服务器上运行的许多神经网络快。

在他们的初版AutoML论文中，我们的Google AI同事能够自动探索超过12000种架构来解决经典的CIFAR-10图像识别任务：将小图像识别为十个类别中的一个，例如汽车、飞机、狗等。在一篇后续文章中，他们发现了一组神经网络构建模块，称之为NAS单元，对于CIFAR-10和类似的任务，NAS单元自动构建的神经网路比手工调优的要好。通过这次合作，我们的研究人员决定使用这些单元自动构建针对自动驾驶任务的新模型，从而将在CIFAR-10上学到的知识迁移到自动驾驶领域。我们的第一个实验是语义分割任务：将LiDAR点云中的每个点标识为汽车、行人、树等。

One example of a NAS cell. This cell processes inputs from the two previous layers in a neural net.

为此，我们的研究员编写了一个自动搜索算法，在卷积网络架构（CNN）中探索数百种不同的NAS单元组合，训练和评估我们的LiDAR分割任务模型。当我们的工程师手工微调这些神经网络时，他们只能探索有限数量的架构，但通过这种方法，我们自动探索了数百个架构。我们发现新的模型在以下两方面优于以前手工调优的模型：

质量相似，但延迟显着降低。
延迟相似，但质量更高。

鉴于初步尝试取得的成功，我们将相同的搜索算法应用于两个与交通车道的检测和定位相关的附加任务。迁移学习技术也适用于这些任务，并且我们能够在汽车上部署三个新训练和改进的神经网络。

端到端搜索：从头开始的新搜索架构

我们受到这些初步结果的鼓舞，因此决定寻找可以提供更好结果和更广泛应用的全新架构。通过无限制组合已发现的NAS单元，我们可以更直接地寻找满足严格的延迟要求的架构。

进行端到端搜索通常需要手动探索数千种架构，会带来大量的计算成本。探索单一架构需要在具有多个GPU的数据中心计算机上进行数天的训练，这意味着单个任务找到理想的架构需要数千天的计算。因此我们设计了一个代理任务：缩小的LiDAR分割任务，可以在几小时内完成训练。

团队必须克服的一个挑战是找到一个类似于我们原始分割任务的代理任务。在我们能够确定新任务架构的质量与原始任务中架构的质量之间的关联之前，我们尝试设计了几个代理任务。然后，我们启动了类似于初版AutoML论文中的搜索算法，但现在用在代理任务上进行搜索：代理端到端搜索。这是该概念首次应用于LiDAR数据。

Proxy end-to-end search: Explore thousands of architecture on a scaled-down proxy task, apply the 100 best ones to the original task, validate and deploy the best of the best architectures on the car.

我们使用了几种搜索算法来优化质量和延迟，因为这对车辆至关重要。我们查看不同类型的CNN架构并使用不同的搜索策略，例如随机搜索和强化学习，我们为代理任务探索10000多种不同的架构。通过使用代理任务，原来在Google TPU集群上需要一年多计算时间的任务现在只需要两周时间。我们刚开始迁移NAS单元时就发现了比以前更好的神经网络：

延迟降低20-30％，质量相同。
质量更高，错误率降低8-10％，与之前的架构具有相同的延迟。

1) The first graph shows about 4,000 architectures discovered with a random search on a simple set of architectures. Each point is an architecture that was trained and evaluated. The solid line marks the best architectures at different inference time constraints. The red dot shows the latency and performance of the net built with transfer learning. In this random search, the nets were not as good as the one from transfer learning.
2) In the second graph, the yellow and blue points show the results of two other search algorithms. The yellow one was a random search on a refined set of architectures. The blue one used reinforcement learning as in [1] and explored more than 6,000 architectures. It yielded the best results. These two additional searches found nets that were significantly better than the net from transfer learning.

搜索中发现的一些网络架构显示了卷积、池化和反卷积操作的创造性组合，如下图所示。这些架构最终适用于我们最初的LiDAR分割任务，并将部署在Waymo的自动驾驶车辆上。

One of the neural net architectures discovered by the proxy end-to-end search.

下一步呢？

我们的AutoML实验只是一个开始。对于我们的LiDAR分割任务，迁移学习和代理端到端搜索都提供了比手工调优更好的神经网络。我们现在有机会将这些机制应用于新类型的任务，这可以改善许多神经网络。

这一发展为我们未来的ML工作开辟了新的令人兴奋的途径，并将改善我们自动驾驶技术的性能和能力。我们期待与Google AI进一步工作，敬请期待！

致谢

Waymo和Google之间的合作由Waymo的Matthieu Devin和Google的Quoc Le发起和赞助。这项工作由Waymo的Shuyang Cheng和Google的Gabriel Bender以及Pieter-jan Kindermans执行。特别感谢Vishy Tirumalashetty的支持。

Members of the Waymo and Google teams (from left): Gabriel Bender, Shuyang Cheng, Matthieu Devin, and Quoc Le

说明

翻译：@AdolphLWQ
项目地址
tt：自动生成翻译模板
用时: 2.5h(人机混合)
2019翻译任务：3/52

参考文献

Barret Zoph and Quoc V. Le. Neural architecture search with reinforcement learning. ICLR, 2017.
Barret Zoph, Vijay Vasudevan, Jonathon Shlens, Quoc V. Le, Learning Transferable Architectures for Scalable Image Recognition. CVPR, 2018.

如何像程序员一样思考 - 解决问题的经验与教训

2019-01-13T17:19:20+08:00

如果你对编程感兴趣，你可能看过这句话：

“这个国家的每个人都应该学习计算机编程，因为它会教你思考。” - Steve Jobs

你很可能想知道这句话是什么意思？以及如何做到？本质上讲，这句话是关于更高效解决问题的方法。

在这篇文章中，我的目标是教会你这种方法。读完本文，你将明确知道要采取哪些步骤来成为更好的问题解决者。

为什么这很重要？

解决问题是元技能。

我们都面临问题。大的和小的。有时，我们处理它们的方式，呃......很随意。

你需要有一个系统方法，这可能是你“解决”问题的方式（我开始编程时就是这么做的）：

尝试一个方案。
如果这不起作用，请尝试另一个。
如果还不起作用，请重复步骤2直到解决。

可能你运气好解决了问题。但这是最糟糕方法！浪费大量的时间。

最佳方法是：a）有一个框架， b）练习掌握这个框架。

“几乎所有雇主都优先考虑解决问题的技能。
相比编程语言的熟练程度、调试和系统设计，解决问题的技能几乎是雇主寻求的最重要的技能。

展示计算思维或将大型、复杂问题拆分的能力与工作所需的基线技能一样有价值（如果不是更多）。” - Hacker Rank（2018年开发人员技能报告）

拥有一个框架

为了找到合适的框架，我参考了Tim Ferriss关于学习的书《The 4-Hour Chef》中的建议。

这让我采访了两个人，他们非常令人印象深刻：C.Jordan Ball（在Coderbyte的65000多名用户中排名第一或第二）和V.Anton Spraul（《像程序员一样思考：解决创造性问题导论》一书的作者“）。

我问他们同样的问题，猜猜结果如何？他们的回答非常相似！

很快，你也会认识他们。

旁注：这并不意味着他们对待每件事都用同样的方式。每个人都是不同的，你也和大家不一样。但是如果你遵从我们都认可的原则，你会更快进步。

“我看到新程序员犯下的最大错误就是专注于学习语法，而不是学习如何解决问题。” - V.Anton Spraul

那么，当遇到新问题你该应该怎么做？

下面是步骤：

1. 理解你的问题

明确被问的问题是什么。大多数问题很难是因为你不理解它们（因此这是第一步）。

如何确定你理解了问题？当你能用简单的语言准确描述它，你就理解了这个问题了。

你还记得曾经被困在一个问题上，你尝试描述它，却立即发现之前没有考虑到的逻辑漏洞？

大多数程序员都知道这种感觉。

这就是为什么你应该写下你的问题、画画涂鸦，或告诉别人你的问题（或者有些人使用橡皮鸭调试法）。

“如果你不能用简单的术语来解释某事，那你还没理解它。” - Richard Feynman

2. 做好计划

没有计划前就不要开始解决问题。你需要计划你的解决方案。

如果你不能写下明确的步骤，别人就没法帮你。

在编程中，这意味着不要立即开始hacking。给大脑时间来分析问题和处理信息。

要想获得一个好的计划，请回答这个问题：“给定输入X，返回输出Y所需的步骤是什么？”

3. 分割问题

请注意,这是最重要的一步。不要试图解决一个大问题，你会哭的。相反，将其分解为子问题。这些子问题更容易解决。

然后，逐个解决每个子问题。从最简单的开始。最简单意味着你知道答案（或者很接近答案），还意味着要解决的这个子问题不依赖于其它问题。

一旦解决了每个子问题，请连接所有“子解决方案”，你就得到原始问题的解决方案了。恭喜！

这种方法是解决问题的基石。务必记住它（如果有必要，这个步骤要多读几遍）。

“如果我能教会每个初学程序员解决问题的技巧，那就是'减少问题的技巧性'。
例如，假设你是一名程序员新手，被要求编写一个程序：读取十个数字，确定第三大的数字。对于一个全新的程序员来说，这可能是一个艰难的任务，即使它只需要基本的编程语法。

如果你遇到困难，你应该把问题简化为更简单的问题。找到最大的那个数，而不是第三大的数字。还是太难了？那找到三个数字中最大的一个呢？或者两个数中较大的一个？

将问题简化到你知道如何解决，然后写下解决方案。然后稍微扩展问题并重写解决方案以匹配，并继续扩展直到你回到起点。“ - V.Anton Spraul

4. 卡住了？

到现在为止，你可能正坐在那里思考“嘿理查德......这很酷，但是如果我被困住，甚至无法解决一个子问题怎么办？”

首先，深吸一口气。其次，这很公平。因为每个人都会遇到这个情况！

不同之处在于，最好的程序员/问题解决者面对bug/错误时，他们很感兴趣而不是恼火。

事实上，面对打击时可以尝试以下三件事：

调试

逐步执行你的解决方案，尝试找到出错的地方。程序员称这为调用（事实上，这都是调试器做的）。

“调试的艺术是弄清楚你真正告诉程序要做什么，而不是你认为你告诉它要做的事情是什么。” - Andrew Singer

重新评估

退后一步，换个角度看问题。是否有地方可以被抽象为更一般的方法？

“有时我们会在问题的细节上迷失方向，而忽略了在更一般的层面上解决问题这个原则。
当然，这个经典的例子是连续整数求和，1 + 2 + 3 + ... + n，非常年轻的高斯很快就认识到结果是n（n + 1）/ 2，从而避免了冗余计算。“ - C.Jordan Ball

旁注：另一种重新评估方式是重新开始。删除所有内容，然后重新开始。我是认真的，你会惊讶于这个方法很有效。

研究

啊，尝试谷歌。不管你遇到什么问题，有人可能已经遇到并解决了，你要找到那个人/解决方案。事实上，即使你已经解决了问题，也要这样做！（你可以从其他人的解决方案中学到很多东西）。

警告:不要寻找解决这个大问题的方法，只寻找子问题的解决方案。为什么？因为除非你挣扎（甚至一点点），否则你将无法学到任何东西。如果你什么都不学，那就浪费了你的时间。

练习

不要指望练习一周后就变得更好。如果你想成为一个好的问题解决者，你需要解决很多问题！

实践。实践。实践。在你意识到“这个问题可以通过某个方法解决前”，你需要大量时间来练习。

如何练习？你有很多问题可以选择：国际象棋谜题、数学问题、数独、围棋、大富翁、视频游戏、加密......

事实上，成功人士的共同点是他们有练习“解决微观问题”的习惯。例如，Peter Thiel下棋、Elon Musk玩视频游戏。

“Byron Reeves说：'如果你想看看三到五年里的商业领导力是什么样的，那就看看在线游戏中正在发生什么。'
回到今天，Elon Musk、Reid Hoffman、Mark Zuckerberg和其他许多人都认为游戏是他们在建立公司方面取得成功的基础。” - Mary Meeker（2017年互联网趋势报告）

这是否意味着你应该只玩视频游戏？当然不。但是视频游戏到底带给人们什么？解决问题！

所以，你应该做的是找到练习的方法。可以让你解决许多微观问题的东西（理想情况下，是一些你喜欢的东西）。

例如，我喜欢编程挑战。每天，我都尝试解决至少一个问题（通常在Coderbyte上）。

就像我说的，所有问题都有相似的模式。

结论

现在，你更清楚理解什么是“像程序员一样思考”。你也意识到解决问题的能力是一项需要培养的令人难以置信的技能（元技能）。这好像这还不够，请记住如何练习解决问题的能力！

“就在你认为自己已成功驾驭一个问题时，另一个问题出现了。但生活也因此而变得有趣。
生活是突破这些障碍的过程 - 我们也必须突破。

每一次，你都会学到一些。

每一次，你都锻炼力量、智慧和观点。

每一次，竞争会减少一点，直到最后剩下的就是你：最好的你。” - Ryan Holiday（《The Obstacle is the Way》）

现在，去解决问题吧，祝你好运。

译者说

本文以“像程序员一样思考”为题，介绍了如何成为合格、优秀的程序员。作者结合两位顶尖程序员的回答、参考一些关于学习的书籍，认为最重要的是培养解决问题的能力/技能，分享了培养这个能力的方法：形成思维框架，然后在实践中不断练习。笔者理解为多刷OJ。

说明

原文链接
翻译：@AdolphLWQ
项目地址
tt：自动生成翻译模板
用时: 3h (人机混合)

2018AI最佳应用回顾

2019-01-06T22:53:15+08:00

译者说

AI商业化迅猛发展，即便如此，普通大众对AI仍然缺少专业性、科学性的认识。作者在本文中精选了7篇2018年关于AI应用的文章，并对内容做了简短、启发性的介绍，旨在帮助公众了解AI能做的事情，帮助大家了解AI在未来能达到的成就。本文还是更偏向学术性，内容比较前沿，对科研人员了解行业应用帮助较大。

毫无疑问，人工智能正在飞速发展，2019年很可能带来许多新的、意想不到的飞跃，比如开发出具有真实、类似人类的通用人工智能机器。我们知道我们远未到达这一目标，但是由于那里有大量与人工智能相关的故事，我们很难跟上过去一年里我们取得的成就，以便了解我们将来能实现的目标。话虽如此，这里列出了过去一年中人工智能和机器学习这个不断发展的世界的一些亮点。

读心AI

去年众多有趣进展中的一个便是AI可以“阅读”你的想法。虽然乍一看这可能令人不安，但另一方面，这些技术可能会帮助残障人士更好地沟通或观察，甚至帮助改善图像搜索（想象一下仅通过可视化来查找特定图像）。为了展示这种可能性，一个来自日本京都大学的团队开发了一种重建算法，它能够解码和优化人们观察物体形成脑电波中的视觉信息，让我们离“机器能精确读取人们想法”更进一步。

详情见：Mind-Reading AI Optimizes Images Reconstructed from Your Brain Waves

具备“视觉预见”的机器

深度学习是机器学习的一个特殊子领域，它启发于生物大脑的结构和功能，旨在开发更好的人工神经网络，这些网络将成为像人一样学习和思考的机器的基础。今年早些时候，加州大学伯克利分校人工智能研究实验室（BAIR）的研究人员创造了一种能够直观可视化未来的机器，使用他们所谓的“视觉预见”。灵感来自人类婴儿，婴儿在环境中实验和操纵的倾向，以便学习然后将这些知识应用到新的未知情境中，这对人类而言理所当然，但实际上机器难以掌握。这样的研究可以为机器“视觉想象能力”铺平道路，使它们能够自主地与周围环境进行交互。

详情见：This Robot Can Visualize Its Immediate Future with Deep Learning

具备社交技能的合作机器

人们可能会认为合作和社交技能是只有人类才具备的领域，但最近的实验表明，机器也可以被赋予一套人的社交技能，使它们能够与其它类型的机器以及人协作。在为机器合作的社交技能创建一个算法过程中，一个国际团队的研究人员指出：“最终目标是我们理解与人合作背后的数学知识以及人工智能发展社交技能需要具备的属性。AI需要回应人类并清楚地表达它正在做什么事情。它必须能够与人互动。”

详情见：AI Algorithm with ‘Social Skills’ Cooperates Better Than Humans

从错误中学习的AI

没有什么比从错误中吸取教训让我们更像人。人们可能会在机器的强化学习中找到类似的结论，但OpenAI的研究人员指出，设计强化学习模型背后的奖励系统可能会越来越非常复杂，实际上可能会抑制机器探索超出任务目标的可能性。相反，这个团队提出了一个开源替代方案，他们称之为Hindsight Experience Replay（HER）。

详情见：OpenAI Algorithm Allows AI to Learn from Its Mistakes

自我复制AI

传递成功经验的能力是生物有机体区别其它事物的决定性特征。今年早些时候，来自哥伦比亚大学的两位研究人员找到了将这一原理应用于人工智能系统的方法-创建称为“quines)”的自我复制神经网络。自我复制、自我进化的AI可以自动采用前几代的成功经验，这个想法非常诱人，具有许多潜在有用的应用场景。

详情见：AI Researchers Create Self-Replicating Neural Network

AI中的文化偏见

冷血机器的绝对可靠性是一个容易被人接受的谬误。但正如专家所言，我们的算法中存在大量隐秘的文化和性别偏见，当这些算法用于自动化决策系统时，会影响人们的生活。例如人力资源部门或刑事司法系统。在2019年开展AI工作时，我们必须找到解决这种算法偏见的方法，这样才能避免长期存在的偏见和社会不公正现象延续到机器中。

详情见：Cultural Bias in Artificial Intelligence

AI辅助自动化

当然，人工智能的讨论绕不过一些事实，即人工智能正在帮助各行各业进一步实现自动化，无论是制造业，物流还是金融等白领领域。虽然更智能的AI系统导致工人失业，但是仍然可以期待一些积极的事情。例如使用人工智能帮助自动预测新药物相互作用中的危害或者自动化游戏设计--拯救生命或制造更多娱乐性。

详情见：Decagon AI Predicts New And Dangerous Drug Interactions && AI Automates Video Game Design With ‘Conceptual Expansion’

说明

翻译：@adolphlwq
项目地址
tt：自动生成翻译模板
用时: 3h（人机混合翻译）

Linux环境下载百度网盘文件

2018-07-21T22:43:01+08:00

原文链接

Linux中使用浏览器下载百度网盘的文件，如果文件很大或者下载的是文件夹，则会默认打开网盘客户端，但是Linux下没有官方的网盘客户端，这就导致无法下载。虽然有开源bcloud，但是已经不维护了，笔者试了下发现存在很多问题，这里不推荐。

摸索几个方案后，找到一个相对好一点的方案，这里记录下来分享之。

Overview

aria2 命令行下载工具，负责下载百度文件
BaiduExporter 浏览器插件，能够把选中的云盘文件/文件夹下载地址导出到aria2，支持Chrome和Firefox
webui-aria2 webui，可视化aria2下载进度

原理就是先运行aria2服务端,监听6800端口。浏览器安装BaiduExporter插件后，选中下载项，页面会多出一个tab（下文详细列出），点击“下载地址导出到aria”，aria就会开始下载。然后运行webui查看下载过程。

下面以ArchLinux为例简介配置过程

Install

aria2

sudo pacman -S aria2

BaiduExporter

这个插件很重要，没有她就没办法生成文件的下载地址。参考官网安装教程：

下载crx插件文件，下载后浏览器可能会提示文件有风险，建议删除（Discard），忽略这条提示
chrome打开chrome://extensions，将下载的crx文件拖到浏览器里面

webui-aria2

clone project

git clone https://github.com/ziahamza/webui-aria2

启动webui服务

cd webui-aria2
node node-server.js

浏览localhost:8888

下载文件

先运行aria2

aria2c --enable-rpc --rpc-listen-all

选择要下载的文件/文件夹，导出到aria2 rpc

启动webui-aria2，浏览localhost:8888查看

Reference

搭建Gitea服务

2018-07-21T19:47:10+08:00

原文链接

Overview

使用容器部署
Sqlite DB
shell script
mail config

脚本

#! /bin/bash
docker run -d --name=gitea --restart=always \
    -p 32722:22 -p 32780:3000 \
    -v /var/lib/gitea:/data \
    gitea/gitea:latest

配置

因为Gitea的文档还不是很完整，所以很多地方需要摸索实验，所以这个是重点，防止少踩坑。

基本项

SSH Server Domain：git.example.com # git服务域名
Gitea Base URL：http://git.example.com # 配置后gitea自动跳转到这个页面

Mail

邮件的配置Gitea文档没有详细列出，这里参考GitLab的配置

SMTP Host: smtp.mailgun.org:587
Send Email As: Adolphlwq <name@server.com>
SMTP Username: your name
SMTP Password: your password

Local git config

Gitea sshd服务运行在容器中，暴露在主机10022端口，这样需要修改本地的ssh配置才能防止git使用默认的22端口。

Host git.example.com
    HostName git.example.com
    Port 32722

问题

测试发现使用Mailgun的邮件服务发送给网易邮箱会被当垃圾邮件过滤掉。参考：http://mail.163.com/help/help...

Reference

kde5与archlinux环境下配置libinput-gestures多手势操作

2017-09-23T22:23:12+08:00

初衷

自己的笔记本是archlinux+kde plasma5的环境，看到同事的macbook pro支持很多手势操作（gestures），自己也希望在archlinux和kde的环境下配置方便的手势操作。

查询资料后发现touchegg和libinput-gestures都可以满足需求，但是在实际配置过程中，touchegg存在很多问题一直都没能解决，而libinput-gestures基本没有太大的问题。所以本文主要介绍如何配置libinput-gestures。

预备知识

计算机窗口管理器
kde是X.Org桌面环境，aur上维护了一个基于X.Org Server的驱动xf86-input-libinput-git，很方便。它们间的关系如下：

X11 client在我这里就是kde plasma5。

驱动程序libinput，linux生态提供了很多驱动，本文使用的驱动是libinput，它负责分析内核从输入设备得到的数据，发送给桌面环境，桌面环境根据不同的数据进行反馈。

术语解释

touchpad：通常意义上的触摸板。
clickpad：指底部没有按钮的touchpad，参考clickpad。clickpad中通过不同手指数量的点击行为来模拟鼠标左键、中键、右键点击。这些都可以配置或者关闭。
click：点击，本文语境中之物理按钮的“按压”和“释放”。
Clickpad software button behavior：clickpad上软按钮的行为，详情见Clickpad software button behavior。

libinput

安装

install basic libinput and xf86-input-libinput

sudo gpasswd -a $USER input
sudo pacman -S libinput xf86-input-libinput

配置

libinput有两种配置方式：

使用配置文件的永久配置方式
使用xinput命令行工具，针对运行时(runtime)进行实时配置，主要用来调试。

配置文件

libinput安装后默认的配置文件在/usr/share/X11/xorg.conf.d目录下，如何你安装多个驱动，会存在多个文件：

➜  xorg.conf.d ll
total 12K
-rw-r--r-- 1 root root 1.4K Aug 14 05:40 10-quirks.conf
-rw-r--r-- 1 root root  964 May  5 20:24 40-libinput.conf
-rw-r--r-- 1 root root 1.8K Nov 18  2016 70-synaptics.conf

笔者这里安装了3个驱动，所以有3个配置文件，默认情况下，kde会根据文件前缀数字的大小决定优先使用哪个配置文件，数字越大，优先级越高。

我们需要把默认配置文件复制到/etc/X11/xorg.conf.d/目录下：

sudo cp /usr/share/X11/xorg.conf.d/40-libinput.conf /etc/X11/xorg.conf.d/40-libinput.conf

下面是文件中touchpad部分的配置：

Section "InputClass"
        Identifier "touchpad"
        MatchIsTouchpad "on"
        MatchDevicePath "/dev/input/event*"
        Driver "libinput"
        Option "Tapping" "on"
        Option "ButtonMapping" "1 3 0 4 5 6 7"
        Option "TappingButtonMap" "lmr"
        Option "DisableWhileTyping" "on"
        Option "TappingDrag" "on"
EndSection

详细参数和解释见libinput man page: based on X.Org input dirver，解释下几个重要的配置参数：

Option "Tapping" "on"：手指点击touchpad发送鼠标点击事件
Option "TappingButtonMap" "lmr"：1个手指点击对应鼠标左键，2个手指点击对应鼠标中键，3个鼠标点击对应鼠标右键。
Option "ButtonMapping" "1 3 0 4 5 6 7"，按钮映射，详情见libinput#Button_Mapping，这里笔者关闭了3指对应的左键。
Option "DisableWhileTyping" "on"：打字时不检测touchpad事件，防止用户不小心触碰touchpad引起不必要的影响。
Option "TappingDrag" "on"：开启点击拖拽。

调试

确定touchpad设备

➜  ~ xinput list
⎡ Virtual core pointer                          id=2    [master pointer  (3)]
⎜   ↳ Virtual core XTEST pointer                id=4    [slave  pointer  (2)]
⎜   ↳ SynPS/2 Synaptics TouchPad                id=13   [slave  pointer  (2)]
⎜   ↳ TPPS/2 IBM TrackPoint                     id=16   [slave  pointer  (2)]
......

查看touchpad的详细配置

➜  ~ xinput list-props "SynPS/2 Synaptics TouchPad"
Device 'SynPS/2 Synaptics TouchPad':
        Device Enabled (142):   1
        Coordinate Transformation Matrix (144): 1.000000, 0.000000, 0.000000, 0.000000, 1.000000, 0.000000, 0.000000, 0.000000, 1.000000
        libinput Tapping Enabled (295): 1
        libinput Tapping Enabled Default (296): 0
        libinput Tapping Drag Enabled (297):    1
        libinput Tapping Drag Enabled Default (298):    1
        libinput Tapping Drag Lock Enabled (299):       0
        libinput Tapping Drag Lock Enabled Default (300):       0
        libinput Tapping Button Mapping Enabled (301):  0, 1
        libinput Tapping Button Mapping Default (302):  1, 0
        libinput Accel Speed (277):     0.000000
        libinput Accel Speed Default (278):     0.000000
        libinput Natural Scrolling Enabled (282):       0
        libinput Natural Scrolling Enabled Default (283):       0
        libinput Send Events Modes Available (262):     1, 1
        libinput Send Events Mode Enabled (263):        0, 0
        libinput Send Events Mode Enabled Default (264):        0, 0
        libinput Left Handed Enabled (284):     0
        libinput Left Handed Enabled Default (285):     0
        libinput Scroll Methods Available (286):        1, 1, 0
        libinput Scroll Method Enabled (287):   1, 0, 0
        libinput Scroll Method Enabled Default (288):   1, 0, 0
        libinput Click Methods Available (303): 1, 1
        libinput Click Method Enabled (304):    1, 0
        libinput Click Method Enabled Default (305):    1, 0
        libinput Middle Emulation Enabled (291):        0
        libinput Middle Emulation Enabled Default (292):        0
        libinput Disable While Typing Enabled (306):    1
        libinput Disable While Typing Enabled Default (307):    1
        Device Node (265):      "/dev/input/event10"
        Device Product ID (266):        2, 7
        libinput Drag Lock Buttons (293):       <no items>
        libinput Horizontal Scroll Enabled (294):       1

这里面有一个值很重要Device Node (265): "/dev/input/event10"，后面使用libinput命令行时会用到这个路径。

使用libinput debug-events 监控touchpad事件

➜  ~ libinput debug-events --device /dev/input/event10
-event10  DEVICE_ADDED     SynPS/2 Synaptics TouchPad        seat0 default group1  cap:pg  size 100x56mm tap(dl off) left scroll-nat scroll-2fg-edge click-buttonareas-clickfinger dwt-on
 event10  GESTURE_SWIPE_BEGIN  +2.82s   3
 event10  GESTURE_SWIPE_UPDATE  +2.82s  3  0.00/ 0.44 ( 0.00/ 3.63 unaccelerated)
 event10  GESTURE_SWIPE_UPDATE  +2.84s  3  0.00/ 3.43 ( 0.00/19.38 unaccelerated)
 event10  GESTURE_SWIPE_UPDATE  +2.87s  3  0.00/ 5.00 ( 0.00/19.38 unaccelerated)
 event10  GESTURE_SWIPE_UPDATE  +2.89s  3  0.00/ 3.33 ( 0.00/10.90 unaccelerated)
 event10  GESTURE_SWIPE_UPDATE  +2.92s  3  0.00/ 2.74 ( 0.00/ 8.48 unaccelerated)

使用libinput debug-gui 监控touchpad事件

➜  ~ libinput debug-gui --device /dev/input/event10
info: event10 SynPS/2 Synaptics TouchPad     added

这时会出现一个GUI画面帮助检测。

libinput-gestures

配置好touchpad和手势后，下面利用libinput-gestures来解析touchpad的数据，然后执行相关的操作。这里主要用到xdotool，xdotool是模拟键盘/鼠标输入和窗口管理等的命令行工具。libinput-gestures依赖xdotool。

libinput-gestures安装后会有默认的配置，位置在/etc/libinput-gestures.conf，用户可以在~~~/libinput-gestures.conf~~ $HOME/.config/libinput-gestures.conf配置自己的配置。笔者根据自己的需要修改了相关配置，如下：

# Switch to next desktop
gesture swipe right 4   xdotool key ctrl+F1
# Switch to prev desktop
gesture swipe left 4 xdotool key ctrl+F2

# Present windows (current desktop)
gesture swipe down 3 xdotool key ctrl+F9
# Present windows (all desktop)
gesture swipe down 4 xdotool key ctrl+F10

# Show desktop
gesture swipe up 3 xdotool key super+d
# Show desktops grid
gesture swipe up 4 xdotool key ctrl+F8

主要思想是针对不同的手势触发相关的快捷键，快捷键的配置则可以在系统偏好设置-->快捷键中设置。下图是笔者在plasma5中的切换桌面的快捷键配置：

Demo

四指横向滑动切换桌面：

四指上下滑动显示所有桌面和所有活动窗口：

TODOs

通过捏和(pinch in/pinch out)来放大/缩小网页（对标macbook）

$HOME/.config/libinput-gestures.conf中添加如下内容（方向可以自己定义）：

# back history of chromium/chrome
gesture swipe right 3   xdotool key alt+Left
gesture swipe left 3   xdotool key alt+Right

网页的前进/后退（对标macbook）

$HOME/.config/libinput-gestures.conf中添加如下内容

# pinch 
gesture pinch in 2 xdotool key ctrl+minus # 2指捏: 缩小
gesture pinch out 2 xdotool key ctrl+plus # 2指张: 放大

总结

本文从想法到配置好前前后后花了大约1个月时间，大部分时间用在了理解输入驱动、配置驱动以及配置调试toucgegg和libinput-gestures上了。

笔者在配置好自己的archlinux 手势后，机缘巧合用了一个星期的macbook pro，体会了苹果下面的手势操作。总体感觉苹果的手势操作更流畅，识别更准确。毕竟苹果是自己的生态系统，可以针对自己的macOS系统进行封装和调试。而在Linux生态中，因为存在多个Linux发行版和桌面环境，手势操作很难兼容所有发行版，这就要求用户要有较强的动手能力和理解能力。可以说两者都能实现丰富的手势操作，而且Linux的扩展性更强一些，但是需要更专业的知识和动手能力。

install wireless firmware on archlinux

2017-01-24T21:27:47+08:00

编者按：这篇文章介绍了笔者解决archlinux+kde plasma环境无法链接无线网的问题。笔者通过查阅archlinux wiki与Google定位问题，重新安装Linux无线网卡固件解决了问题。

背景介绍

hp440,i54200U 64bit.
archlinux 20170101.iso
kde5 plasma

问题描述

安装NetworkManager（负责提供网络功能的服务，简称nm）和network-manager-applet，network-manager-applet适用于使用plasma桌面的场景，它是一个托盘程序，通过图形化的界面管理计算机的网络，下面简称nm-applet，正确启动nm后，点击nm-applet图标后只显示有线链接，不显示可用的无线网列表。

即使自己手动添加的linkernetworks2也无法激活。

解决步骤

参考archlinux wiki cn

archlinux wiki-NetworkManager (简体中文))主要介绍了：

archlinux上NetworkManager的安装与使用
GUI的安装

这部分信息适合安装archlinux后配置基本的网络链接。不适用无线网络的debug。

archlinux上无线网络的配置

先在kde-cn频道上提问并没有解决自己的问题。

又参考Wireless network configuration (简体中文))

查看pci设备没发现问题

$ lspci -k
09:00.0 Network controller: Broadcom Limited BCM43228 802.11a/b/g/n
        Subsystem: Broadcom Limited Device 05e2
        Kernel driver in use: bcma-pci-bridge
        Kernel modules: bcma

查看网卡设备，发现没有无线网卡的信息。

$ ip link show
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN mode DEFAULT group default qlen 1
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
2: enp8s0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc fq_codel state UP mode DEFAULT group default qlen 1000
    link/ether 5c:b9:01:f6:3b:18 brd ff:ff:ff:ff:ff:ff

以上两步发现没有无线网卡的设备信息。猜测有两个：

无线网卡设备没有开启，（在笔记本上）手动开启
无线网卡坏了

自己尝试在hp上开启网线网卡发现没用。这是我有点慌，难道网卡坏了？宝宝刚申请的笔记本就坏了无线网卡，蓝瘦香菇！

安装archlinux就像堆积木，许多东西都需要自己适配，并且这时我发现了[archlinuxcn-bbs找不到无线网卡[已解决]](https://bbs.archlinuxcn.org/v...，参考对方的解决方案感觉是自己没安装对固件(firmware)。

最后定位了自己的问题：内核中无线网卡固件和无线网卡硬件不一致。找到问题后参考wiki中的链接正确安装固件后重启笔记本解决问题。

有用的参考

Wireless network configuration (简体中文))
[archlinuxcn-bbs找不到无线网卡[已解决]](https://bbs.archlinuxcn.org/v...
Linux wireless b43 firmware-archive 这个链接详细介绍在Linux上安装和硬件版本一致的firmware的过程。
Linux wireless b43 firmware

小推广

原文地址
欢迎关注我的公众号泉Talk，介绍Spark、Python、读书笔记等内容:

install virtualbox on centos server

2017-01-18T22:25:23+08:00

摘要：本文介绍在centos 7.2 server上下载安装virtualbox，记录遇到的问题:"CentOS 内核版本与yum install kernel-devel版本不一致",以及自己解决问题的过程。

核心在于下载和主机内核版本一致的源码，然后安装virtualbox。

原文：QuanTalk

Env

CentOS 7.2-1511（笔者利用U盘镜像安装在物理机）

Add repo url

cd /etc/yum.repos.d
wget http://download.virtualbox.org/virtualbox/rpm/rhel/virtualbox.repo

Install denpendiencies

yum --enablerepo=epel install dkms

Install epel

CentOS/RHEL 7, 64 Bit (x86_64): 
# rpm -Uvh http://epel.mirror.net.in/epel/7/x86_64/e/epel-release-7-8.noarch.rpm

CentOS/RHEL 6, 64 Bit (x86_64): 
# rpm -Uvh http://epel.mirror.net.in/epel/6/x86_64/epel-release-6-8.noarch.rpm

这一步报错：找不到url，笔者自己复制url到浏览器发现确实没有这个链接。但是我在仓库下找到另一个链接：

http://epel.mirror.net.in/epel/7/x86_64/e/epel-release-7-9.noarch.rpm

替换一下就好了。

Install kernel-devel

sudo yum install kernel-devel

kernel-devel是kernel（内核）源码，默认会安装到/usr/src/kernels目录下面。之所以需要内核源码。是因为virtualbox需要结合内核源码编译特定内核版本的模块。

笔者遇到的问题是yum install kernel-devel的版本和CentOS上的内核版本不一致。如下(下面的结果是笔者解决了所有问题后列出来的，可以看到没安装的版本3.10.0-514.2.2.el7和主机版本不一致)：

➜  alpine uname -r                  
3.10.0-327.36.3.el7.x86_64
➜  alpine sudo yum list kernel-devel
Loaded plugins: fastestmirror
Loading mirror speeds from cached hostfile
 * base: mirror.0x.sg
 * epel: mirror.smartmedia.net.id
 * extras: mirror.0x.sg
 * updates: mirror.0x.sg
Installed Packages
kernel-devel.x86_64                       3.10.0-327.36.3.el7                       installed
Available Packages
kernel-devel.x86_64                       3.10.0-514.2.2.el7                        updates

这就导致编译安装的virtualbox模块和主机内核版本不一致，无法运行。

现在解决方案有两大类：

下载和主机内核版本一直的源码。
升级内核版本到3.10.0-514.2.2.el7，深思后觉得这个方法不妥，因为升级内核后会导致软件不兼容问题。后续的工作量很大。

最后还是决定下载版本一直的内核源码。步骤如下：

Google kernel-devel-3.10.0-327.36.3.el7.x86_64
成功找到内核源码的有效地址，果断下载。

参考

安装

sudo yum install kernel-devel-3.10.0-327.36.3.el7.x86_64.html

添加源码到环境变量

# export KERN_DIR=/usr/src/kernels/3.10.0-327.36.3.el7.x86_64

安装virtualbox（见下一步）

List pkg

~ yum search virtualbox
Loaded plugins: fastestmirror
Determining fastest mirrors
 * base: centos.usonyx.net
 * epel: mirrors.tuna.tsinghua.edu.cn
 * extras: centos.usonyx.net
 * updates: centos.usonyx.net
virtualbox                                                                                                                                                                             31/31
VirtualBox-4.3.x86_64 : Oracle VM VirtualBox
VirtualBox-5.0.x86_64 : Oracle VM VirtualBox
VirtualBox-5.1.x86_64 : Oracle VM VirtualBox

Install

yum install VirtualBox-5.1

Reference

sbt编译Spark App依赖问题

2017-01-07T14:24:49+08:00

背景简介

Spark App（用Spark APIs编写的）需要submit到Spark Cluster运行，对于Scala编写的代码，提交之前要用sbt或者maven把以下内容：

源代码
依赖的jar包

全部打包成一个大的jar文件，这样代码就不会因为没有依赖无法在集群中运行。

问题

我司用Scala编写Spark streaming应用，实现读取Kafka数据，处理后存储到cassandra集群中。这里需要用到一个包spark-streaming-kafka，之前用的spark1.6.0的版本。sbt中的配置如下：

libraryDependencies ++= Seq(
  // Spark dependency
  "com.eaio.uuid" % "uuid" % "3.2",
  "org.apache.spark" %% "spark-core" % "1.6.0" % "provided",
  "org.apache.spark" %% "spark-sql" % "1.6.0" % "provided",
  "org.apache.spark" %% "spark-streaming" % "1.6.0" % "provided",
  "org.apache.spark" %% "spark-streaming-kafka" % "1.6.0",
  "com.datastax.spark" %% "spark-cassandra-connector" % "1.6.0-M2",
   // Third-party libraries
  "com.github.scopt" %% "scopt" % "3.4.0"
)

升级到Spark 2.0.0后需要更新软件包版本，于是将sbt构建配置中的依赖部分改为：

libraryDependencies ++= Seq(
  // Spark dependency
  "com.eaio.uuid" % "uuid" % "3.2",
  "org.apache.spark" %% "spark-core" % "2.0.0" % "provided",
  "org.apache.spark" %% "spark-sql" % "2.0.0" % "provided",
  "org.apache.spark" %% "spark-streaming" % "2.0.0" % "provided",
  "org.apache.spark" %% "spark-streaming-kafka" % "2.0.0",
  "com.datastax.spark" %% "spark-cassandra-connector" % "2.0.0-M2",
   // Third-party libraries
  "com.github.scopt" %% "scopt" % "3.4.0"
)

本以为这样修改后重新构建就没问题了。但是我太天真了，构建后报错，提示：

[warn]     ::::::::::::::::::::::::::::::::::::::::::::::
[warn]     ::          UNRESOLVED DEPENDENCIES         ::
[warn]     ::::::::::::::::::::::::::::::::::::::::::::::
[warn]     :: org.apache.spark#spark-streaming-kafka_2.10;2.0.0: not found
[warn]     ::::::::::::::::::::::::::::::::::::::::::::::
[warn] 
[warn]     Note: Unresolved dependencies path:
[warn]         org.apache.spark:spark-streaming-kafka_2.10:2.0.0 (/home/linker/workspace/linkerwp/linkerStreaming/build.sbt#L12-23)
[warn]           +- Linker Networks Inc.:linker-streaming_2.10:0.0.1
sbt.ResolveException: unresolved dependency: org.apache.spark#spark-streaming-kafka_2.10;2.0.0: not found

说明这个包是不存在的，于是马上到maven repo上去找。常见的Maven公共repo有：

search.maven.org...用于搜索你的依赖包。
https://mvnrepository.com/...maven仓库。

进入网址输入spark-streaming-kafka搜索后数来好几和选项，前面4个结果都是不支持Spark 2.0.0的，这让我误以为Spark 2.0.0还不支持Kafka，这个想法被前面几个搜索结果误导了。因为对于2.0.0的Spark，Kafka添加了具体的版本号！spark-streaming-kafka-->spark-streaming-kafka-0-8就可以找到了（实际上这个版本也在maven repo的搜索结果，因为靠后我没有去看）！！

总结

对于Java/Scala的编译问题，我曾经特别抗拒，因为maven和sbt的配置文件很冗杂，没有Python的简洁明了。Python里20行的依赖文件在maven/sbt里至少200行，而且只要有一个地方没写正确就无法正确编译。
现在发现要想正确编译，保证源代码没问题的情况下，就需要指定正确的依赖包和格式。这个需要到maven的仓库上去搜索，确认无误后再添加到配置文件中。
要学会发散、拓展思考。当看到sbt编译失败的时候就应该根据报错信息推测出问题的原因：“依赖包版本不正确”，然后把版本指定正确就可以了。

docker image 实践之容器化 ganglia

2016-01-27T14:24:00+08:00

基础镜像

单播模式下检测效果

使用centos:6作为基础镜像,因为centos:7没有使用systemd作为系统服务管理工具.这在后面启动ganglia进程的时候会带来很多麻烦,但是有解决方案(由dockone社区微信群大神给出的解决方案,个人并未尝试):

使用supervisor来统一管理进行
runt管理进程

Dockerfile

FROM centos:6
MAINTAINER wlu wlu@linkernetworks.com

RUN rpm -Uvh https://dl.fedoraproject.org/pub/epel/epel-release-latest-6.noarch.rpm

RUN yum install -y php-common php-cli php-gb php

# install ganglia server
RUN yum install -y rrdtool rrdtool-devel ganglia-web ganglia-gmetad \
    ganglia-gmond ganglia-gmond-python httpd apr-devel zlib-devel \
    libconfuse-devel expat-devel pcre-devel

# install ganglia client
#RUN yum install -y ganglia-gmond

RUN mkdir -p /var/lib/ganglia && \
    chown nobody:nobody /var/lib/ganglia && \
    chmod 777 /var/lib/ganglia

ADD supervisord.conf /etc/supervisord.conf
RUN yum install -y python-setuptools && \
    easy_install supervisor && \
    yum clean all

RUN yum install -y vim && \
    ln -f -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

CMD ["/usr/bin/supervisord", "-n", "-c", "/etc/supervisord.conf"]

注意:这里可以把多个指令合并以减少镜像层数.

ganglia的配置

原理图:

ganglia可以监控整个集群的信息.这里有两个概念:

ganglia 中央机器...对应gmetad进程.对应配置信息在/etc/ganglia/gmetad.conf(centos6下)
ganglia client...对应gmond进程.对应配置信息在/etc/ganglia/gmond.conf(centos6下)
有点类似于master和slave的关系.

在集群中需要有一个中央机器来统一接收其它机器上收集到的监控信息(也可以包括中央机器自身),在这个中央机器上运行gmetad进程.

在其它机器上运行gmond进程,用来收集机器上的监控信息.

ganglia的两种模式

单播模式

这种模式下client上的数据会发送给中央机器,下面看下client(即gmond)的配置(只摘取部分需要的配置项):

gmond.conf

......
cluster {
  name = "unspecified"
  owner = "unspecified"
  latlong = "unspecified"
  url = "unspecified"
}
......
udp_send_channel {
  #bind_hostname = yes # Highly recommended, soon to be default.
                       # This option tells gmond to use a source address
                       # that resolves to the machine's hostname.  Without
                       # this, the metrics may appear to come from any
                       # interface and the DNS names associated with
                       # those IPs will be used to create the RRDs.
  mcast_join = 239.2.11.71
  port = 8649
  ttl = 1
}
......
/* You can specify as many udp_recv_channels as you like as well. */
udp_recv_channel {
  mcast_join = 239.2.11.71
  port = 8649
  bind = 239.2.11.71
  retry_bind = true
  # Size of the UDP buffer. If you are handling lots of metrics you really
  # should bump it up to e.g. 10MB or even higher.
  # buffer = 10485760
}
......

cluster name,这个必须指定并且相同集群使用相同的name
udp_send_channel,因为单播模式下各个client把数据以udp协议发给中央机器,所以需要配置中央机器的ip,配置后的结果:

udp_send_channel {
  #bind_hostname = yes # Highly recommended, soon to be default.
                       # This option tells gmond to use a source address
                       # that resolves to the machine's hostname.  Without
                       # this, the metrics may appear to come from any
                       # interface and the DNS names associated with
                       # those IPs will be used to create the RRDs.
  #mcast_join = 239.2.11.71
  host = host_ip
  port = 8649
  ttl = 1
}

这条需要注释:#mcast_join = 239.2.11.71,ganglia默认是多播.

注释掉多播的配置:

udp_recv_channel {
  #mcast_join = 239.2.11.71
  port = 8649
  #bind = 239.2.11.71
  retry_bind = true
  # Size of the UDP buffer. If you are handling lots of metrics you really
  # should bump it up to e.g. 10MB or even higher.
  # buffer = 10485760
}

note:这里注释掉多播和绑定的ip.我还不是太明白,详情参考这里

配置好后就可以通过service gmond start来启动client上的gmond进程了.

gmetad.conf

data_source "my cluster" localhost

改为

data_source "your cluster name" host_ip #host_ip指中央机器的配置

配置好后就可以通过service gmetad start来启动中央机器上的gmetad进程了.

多播模式

多播的特点:

集群中的每个client把自己的数据发送给集群中的其它client
中央机器指定一个client作为数据源.

个人觉得这种方式很浪费,因为单播模式下数据传输次数要少

参考连接

reference 1
reference 2
本项目对应的GitHub地址
 httpd访问控制问题

ps

南京docker meetup已经于2015年3月份成立,将于2016年开始举办线下技术分享.诚挚欢迎各位对docker及容器技术感兴趣的同学加入Docker Nanjing meetup

Kafka文档阅读笔记（一）

2015-10-27T11:20:35+08:00

老大让我用Kafka+Spark Streaming搭建简单的数据处理平台，以下记录我在学习中的一些要点。目前我的整理基于Kafka 0.8.22 documentation的文档。

入门指南

overview

Kafka中有几个概念很重要：partition、topic、producer、consumer。partition要深入了解，因为它和msg order guarantee， fault tolerace关系很大！

简介

Kafka is a distributed, partitioned, replicated commit log service.像官方介绍的那样，Kafka是分布式、分区、可复制的提交日志服务。它采用独特的设计来实现消息服务系统。

回顾一些术语

topics...maintains feeds of messages in categories（维护目录中的消息源）
producers...发布消息到Kafkatopic的进程
consumers...订阅topic中消息与处理源（feeds）中发布过消息的进程
broker...运行一个或多个服务的Kafka集群

概念图见下：

clients与servers端使用TCP协议通信

Topics&Logs

Topic是目录或订阅源的名字，用来接受发布过的消息。对于每个topic，Kafka维护一个分区日志，看起来如下：

每个分区有序，不断附加不可变的消息，称之为a commit log，每个分区中的消息被分配连续的数字称之为offset，每个分区中消息的offset不同

Kafka集群维护所有已经发布的消息。当然我们可以配置时间来决定集群维护消息的时间长短。在可用时间内消息都可以被消费者消费，超过这个时间消息会被删除来节省时间。Kafka's performance is effectively constant with respect to data size so retaining lots of data is not a problem：Kafka的性能是一个相对高效常亮，不管数据量多少，所以它维护大量的数据不是问题。

每个消费者维护一个元数据：它指消费者读取的消息在日志中的位置，即offset。它由consumer控制。随着读取消息，offset会线性递增。consumer可以按照任意顺序消费消息。 For example a consumer can reset to an older offset to reprocess.

以上特性的组合使得consumer的代价很小。consumer数量可以增加或减少而对整个集群影响很小。例如在不影响consumers和消费内容的情况下从topic尾部内容读取消息。

分区 && Distribution

partitions意义重大：

First, they allow the log to scale beyond a size that will fit on a single server. Each individual partition must fit on the servers that host it, but a topic may have many partitions so it can handle an arbitrary amount of data.
Second they act as the unit of parallelism—more on that in a bit.

Each partition is replicated across a configurable number of servers for fault tolerance.每个分区（内容）都是课重复的，需要在承载分区的服务器上配置。这是实现容错的一种方案。

每个分区都有1个server作为leader，0/多个server作为followers
leader处理分区的读写请求，followers服从leader，复制leader的操作。
若leader故障，自动选取followers为新的leader

Each server acts as a leader for some of its partitions and a follower for others so load is well balanced within the cluster.

Producer

选择发送什么消息给哪个topic的哪个分区。[从这个角度看producer角色也很厉害]
This can be done in a round-robin fashion simply to balance load or it can be done according to some semantic partition function (say based on some key in the message). More on the use of partitioning in a second.

Consumers

传统上有2中处理消息的方法：队列和发布/订阅机制。

队列模式下，消费者池从一台服务器上读取消息，并且每条消息只能发送给消费者池中的一个消费者
发布/订阅模式下，消息广播到所有的消费者。

consumer group，给一组consumers打标签，标签名即组名

Consumers label themselves with a consumer group name, and each message published to a topic is delivered to one consumer instance within each subscribing consumer group. Consumer instances can be in separate processes or on separate machines.

结合这张图理解

大致意思是：每个发送到topic的消息都会被发送给订阅这个topic的consumer group中的一个consumer。consumer实例可以在不同的进程或机器中。

当所有consumers属于一个group，这时的发布/订阅模式等同于队列模式。

当所有的consumer都属于不同的group时，这就是典型的发布/订阅模式，topic的消息发送给所有的consumer。

更一般的情况是每个topic有少量的groups，每个group都是topic的“逻辑订阅者”。此时每个group有多个consumer实现扩展性和容错。这里订阅者是sonsumer集群而不是单个进程。这里依然符合发布/订阅语义。

相比传统的消息系统，Kafka有健壮的顺序保证。

Kafka提出了分区的设计，将不同topics下的不同分区的消息分配给sonsumer group下的consumers，确保每个分区都能够被唯一一个consumer按消息发送的顺序处理消息数据。根据情况设计多个分区实现负载均衡。note：consumer数量不能超过partition数量

Kafka只保证每个分区内的顺序，不同的分区间无法保证消息的顺序性。如果你需要所有的消息都按照顺序，那么只能设置一个分区，一个consumer实例。这时注意负载均衡和扩展性就无法保证了

guarantee

order
- 对于1个分区，早发送到分区的offset<后发送到分区的offset
- 对于存放在log中的内容按照存储的先后顺序读取
如果replication factor为N，最多允许N-1台server故障

Use Cases（使用案例）

Website Activity Tracking（网站活动跟踪）
Metrics
Log Aggregation（日志聚合）
Stream Processing

原文连接

Working with Docker Hub

2015-09-06T09:39:34+08:00

Working with Docker Hub

到目前为止我们已经学习了如何使用命令行在主机上运行Docker。你已经学习了如何下载镜像，如何从已经存在的镜像运行容器，以及如何创建你自己的镜像。

下一步，你将学习如何使用Docker Hub来简化和加强你的Docker工作流。

Docker Hub是由Docker公司维护的公共注册仓库。你可以利用它：

下载超过15000的镜像来构建容器
身份验证、工作组织结构以及像webhooks和trigger这样的工作流工具
一些私人工具，比如私人仓库用来存放你不想和他人分享的镜像

Docker commands and Docker Hub

Docker本身提供了一些命令用于获取Docker Hub服务：

docker login
docker search
docker pull
docker push

Account creation and login

要想使用Docker Hub的服务，首先要有Docker Hub的账号并且登录。你可以在Docker Hub上注册或者通过命令：

docker login

这条命令后会提示输入用户名，会成为你公共仓库的共有命名空间，如果已经有了用户名，Docker会提示你输入密码和邮箱，然后自动登录。登录成功后你就可以向Docker Hub上自己的仓库中推送自己的镜像了。

注意：你的身份验证信息会被存在用户目录的.dockercfg认证文件中

Searching for images

我们可以通过Docker自己的search接口或者是命令行中的接口来查找Docker Hub中的镜像。关键字可以是镜像名，用户名甚至是镜像的描述信息。

$ sudo docker search centos
NAME           DESCRIPTION                                     STARS     OFFICIAL   TRUSTED
centos         Official CentOS 6 Image as of 12 April 2014     88
tianon/centos  CentOS 5 and 6, created using rinse instea...   21
...

其中有两个结果：centos，tianon/centos。第二个tianon/centos表示它来自于一位叫tianon的用户的仓库。第一个结果没有显示列出仓库则意味着它是受信任的官方顶级名称空间存储库。/将仓库名和镜像名分割开。

找到镜像后pull下载镜像

docker pull [imagename]

Contributing to Docker Hub

任何人都可以从Docker Hub下载镜像，但是如果你想向Docker Hub推送镜像，首先要注册

Pushing a repository to Docker Hub

为了将仓库推送到register中，你需要已经命名的镜像或者把你的容器保存为命名的镜像，详情见这里

 docker push yourname/newimage

Features of Docker Hub

现在我们就来看看Docker Hub有哪些特性，更多信息见这里

私人仓库
组织和团队
自动构建
webhooks

Private Repositories

如果你有镜像不想公开或和他人分享，Docker允许你拥有自己的私人仓库

Organizations and teams

私人仓库的一个好处是你可以把里里面的镜像分享给组织或团队里的人。Docker Hub允许你创建自己的组织，在组织里你可以和同伴一起工作，以及管理自己的仓库。详情见这里

Automated Builds

自动构建和更新github和bitbuckets中的镜像，这些工作直接在Docker Hub中进行（不是本地）。它的工作方式是这样的：在你选中的github或bitbucket中添加hook，当你更新仓库时会触发构建和更新操作。

自动构建的步骤：

创建账号并登录
连接github或bitbucket的账号
配置自动构建的选项
选中github或bitbucket中带有Dockerfile的项目
选择分支
命名
分配可选的Docker标签
指定Dockerfile文件的位置，默认是/目录

在 Automated Builds page查看自己自动构建的项目

不能对自动构建的仓库使用docker push命令。只能通过向github或bitbucket更新代码来管理自己的镜像。

你也可用为同一个项目的不同分支创建多个自动构建的项目。

Webhooks

webhooks附着到你的仓库并且在你更新镜像或者push操作时触发事件。通过webhook，push镜像时，你可以指定一个目标URL或者JSON负载均衡。

Apply custom metadata

2015-05-19T20:15:15+08:00

你可以用过LABEL把元数据应用到你的镜像，容器或者是守护进程中。元数据可以服务于广泛的用途。使用标签可以给镜像添加注释或者是许可信息，还可以用来标志你的主机

标签是<key> / <value>键值对，Docker以字符串的方式存储标签。你可以指定多个标签但是每一个<key> / <value>必须不同防止对已经存在的键值对覆盖。如果你给同一个key指定了多个不同的值，新的值会把之前的值覆盖掉。记住，对于相同的key，Docker只会应用你提供的最后一个值。

注意:Docker1.4.1之后的版本才支持daemon-labels，对标签和容器的标签支持是1.6.0中的新特性。

Label keys (namespaces)

标签的键，（也就是命名空间）

Docker对你创建的标签中的键没有什么硬性的限制，但是简单的键也有可能冲突。例如，你通过architecture标签来给你的镜像分类：

languageLABEL architecture="amd64"
LABEL architecture="ARMv7"

而且用户也可以通过不同风格的标签来给镜像打标签：

languageLABEL architecture="Art Nouveau"

为了防止命名冲突，Docker的命名空间标签键使用反向域名表示。参考下面来命名你的键：

所有的（第三方）工具都用反向域名前缀+标签的方式来命名，这个反向域名要和工具作者提供的域名一致，如com.example.some-label，com.example.some-auther="root"
com.docker.*, io.docker.*和com.dockerproject.*保留给Docker内部使用
键只能是小写字母，数字，点和-表示，及[a-z0-9-.]
键名的开始和结束只能是字母和数字
不能包含连续的-和点
没有名称空间的标签保留给CLI，这就允许最终用户给容器和镜像添加元数据而不必在终端输入繁琐的命令

上面列举的都是准则且Docker严格遵守执行。如果你没有遵守这些准则有可能导致标签名的冲突。如果恰巧你也在使用标签构建工具的话，赶快为你的标签和键使用名称空间吧

Store structured data in labels

在标签中存储结构化数据

标签中的值可以包含任何能被存储为字符串的值，例如下面的JSON格式的数据：

shell{
    "Description": "A containerized foobar",
    "Usage": "docker run --rm example/foobar [args]",
    "License": "GPL",
    "Version": "0.0.1-beta",
    "aBoolean": true,
    "aNumber" : 0.01234,
    "aNestedArray": ["a", "b", "c"]
}

要想把这个结构存储在标签中，首先你要把它序列化为字符串：

languageLABEL com.example.image-specs="{\"Description\":\"A containerized foobar\",\"Usage\":\"docker run --rm example\\/foobar [args]\",\"License\":\"GPL\",\"Version\":\"0.0.1-beta\",\"aBoolean\":true,\"aNumber\":0.01234,\"aNestedArray\":[\"a\",\"b\",\"c\"]}"

虽然可以在标签中存储结构化的数据，但是Docker把它（结构化的数据）看作是普通的字符串。这意味着Docker本身并不提供基于嵌套属性的查询（过滤器）。如果你的工具需要通过嵌套属性来过滤，那么你的工具本身要实现这个功能，二不要让Docker去做。

Add labels to images; the LABEL instruction

使用LABEL指令给镜像添加标签

languageLABEL [<namespace>.]<key>[=<value>] ...

LABEL指令用来给镜像添加标签，可选择设置它的值。对于使用空格的标签，要用双引号或者反斜杠。
e.g.

languageLABEL vendor=ACME\ Incorporated
LABEL com.example.version.is-beta
LABEL com.example.version="0.0.1-beta"
LABEL com.example.release-date="2015-02-12"

注意：上面的第二行中只有键，没有值。
LABEL指令支持在一个LABEL下设置多个
e.g.

languageLABEL com.example.version="0.0.1-beta" com.example.release-date="2015-02-12"

Docker允许使用反斜杠\,将1行指令分割为多个行

languageLABEL vendor=ACME\ Incorporated \
      com.example.is-beta \
      com.example.version="0.0.1-beta" \
      com.example.release-date="2015-02-12"

Docker更推荐你在一个LABEL指令中设置多个标签，每个标签都用指令单独设置的话会让你的镜像很低效，这是因为每一个Dockerfile中的LABEL指令都会产生1个镜像层（怒了，这个解释直达本质啊）！！！

我们可以使用docker inspect来查看镜像或者容器的标签

Query labels

查询标签

标签除了可以用来存储元数据，还可以用来过滤镜像和容器。下面的命令将会列出所有包含com.example.is-beta标签并且运行这的容器：

languagedocker ps --filter "label=com.example.is-beta"

color标签且值为blue的运行中的容器

languagedocker ps --filter "label=color=blue"

包含vendor和ACME的镜像

languagedocker images --filter "label=vendor=ACME"

Daemon labels

守护标签

docker info这条命令的解释是：Display system-wide information（显示全部信息）
下面是我电脑上的结果：

languageadolph@geek:~$ docker info
Containers: 7
Images: 44
Storage Driver: aufs
 Root Dir: /var/lib/docker/aufs
 Backing Filesystem: extfs
 Dirs: 58
 Dirperm1 Supported: false
Execution Driver: native-0.2
Kernel Version: 3.13.0-52-generic
Operating System: Ubuntu 14.04.2 LTS
CPUs: 4
Total Memory: 7.687 GiB
Name: geek
ID: HGR7:UGWW:VQVV:WYMF:CSEE:KJ4C:QS4U:IRIU:LREB:M4YC:GDJY:YPI5
Username: adolphlwq
Registry: [https://index.docker.io/v1/]
WARNING: No swap limit support

可以看出里面主要是关于Docker daemon的信息，这里并没有关于它的标签信息。但是我们可以通过``docker -d label=value`的方式给Docker daemon本身添加标签：

languagedocker -d \
  --dns 8.8.8.8 \
  --dns 8.8.4.4 \
  -H unix:///var/run/docker.sock \
  --label com.example.environment="production" \
  --label com.example.storage="ssd"

Dockerfile 基础实战：构建基础的 ubuntu14.04 镜像

2015-05-19T17:22:59+08:00

我们可以从Docker Hub上下载官方仓库中的镜像，我自己就下载了ubuntu镜像，只有188M左右，很小巧了。但是看了下，里面的软件源还是官方的，而且没有安装vim，所以就打算自己写一个Dockerfile，用它来构建适合自己的ubuntu基础镜像。

languagedeb http://archive.ubuntu.com/ubuntu/ trusty main restricted
deb-src http://archive.ubuntu.com/ubuntu/ trusty main restricted
...................

构建上下文

build context，一个自定义的文件夹，里面放置Dockerfile和一些需要的文件。比如我的：

Dockerfile...这个是必须的
sources.list...自己在官方社区找的ubuntu14.04的源
vimrc...安装好vim后用到的配置文件。我事先配置好的，都是些基础的配置。

language.
├── baseimage
│   ├── Dockerfile
│   ├── README.md
│   ├── sources.list
│   └── vimrc

Dokerfile

制作image有两种方法：

从现有容器通过commit命令创建
- dockerfile中不方便的操作可以在容器中操作然后提交
- 没有批量启动容器的需要
- 自己学、习练习，不需要移植
利用Dockerfile构建
- 方便，灵活，可移植
- 适合部署大量的镜像和容器

Dockerfile基础

'#'表示注释，一般Dockerfile第一行注释容器的基本信息和版本。
Dockerfile以命令：参数为基本构建语句，命令全部大写，后面的参数视命令而定
FROM，必须是第一个命令项，表示我的镜像是以哪个镜像为基础构建的
```
languageFROM ubuntu
```
MAINTAINER，后面接构建这的姓名和邮箱，方便联系
```
languageMAINTAINER adolphlwq <kenan3015@gmail.com>
```

LABEL，用键值对的方式来指定image的元数据

languageLABEL Description="it is used as a basic image for DuoHuoStudio and my study.I will update and install vim." Vendor="Basic image"

ADD，在构建时向Docker daemon传递文件
```
languageADD sources.list /etc/apt/
```
RUN，接操作和命令sudo apt-get install -y vim等
```
languageADD sources.list /etc/apt/ 
```
CMD，构建成功的镜像第一次启动时默认启动的命令
- CMD只有1条，一般默认在Dockerfile的最后
- 如果有多个CMD，只有最后一个起作用
- CMD会被docker run ..后面的命令覆盖
```
languageCMD ["/bin/bash"]
```
ENV，设置环境变量
```
languageENV REFRESHED_AT 2015-05-18
```

构建命令

languagecd baseimage(构建上下文文件夹)
docker build -t="duohuosrudio/ubuntu:14.04_64_base_image" .

docker build中-t表示容器的名字
duohuosrudio/ubuntu中duohuostudio表示仓库名（不允许大写），ubuntu表示镜像名。
ubuntu:14.04_64_base_image后的14.04_64_base_image是标签，如果没有指定，默认的是latest

构建过程：

实践中遇到的错误

apt-get upgrade和apt-get install vim都要加上** -y**选项，不然会报错
ADD后面必须接两个参数，ADD <src>... <dest>表示要添加的文件，表示文件添加到哪里。
ADD添加的文件必须以构建上下文为根目录来找，不能超出构建上下文的范围。

如果除错停止构建了也不要担心，Docker会把构建过程中的文件都缓存起来，再次构建时会从缓存的地方开始，节省时间。

除错停止后docker images会出现一个只有IMAGE ID的镜像，这个就是构建失败后留下的缓存，我们可以通过image id来运行这个镜像，然后执行除错的命令来检查为什么出错！（下图的最后1行）

languageadolph@geek:~/programs/DockerWorkspace/dockerfile/baseimage$ docker images
REPOSITORY               TAG                   IMAGE ID            CREATED             VIRTUAL SIZE
test/ubuntu              14.04_64_base_image   e9390454465c        14 hours ago        269.1 MB
test2/ubuntu             14.04_64_base_image   e9390454465c        14 hours ago        269.1 MB
duohuostudio/ubuntu      14.04_64_base_image   e9390454465c        14 hours ago        269.1 MB
<none>                   <none>                f6efc4dac25a        16 hours ago        269.1 MB

总结

languagedocker build -t="duohuostudio/ubuntu:14.04_64_base_image" .

这条命令的最后一个参数是用来指定Dockerfile的路径，千万不要忘记。

dockerfile已经上传到 github 地址

镜像也已经上传到Docker Hub上了，可以通过下列命令下载镜像

docker pull adolphlwq/ubuntu

Managing Data in Containers

2015-05-18T12:19:56+08:00

前面已经介绍了许多基础的知识，现在我们来一起学习如何管理Docker容器里面以及容器之间的数据

先介绍两种原始的方法来管理Docker中的应用:

Data volumes
Data volume container

Data volumes

data volumns是专门设计的工具，它绕过了UFS直接工作于一个或多个容器。它为数据持久和分享提供了许多功能：

容器被创建时，卷（volumn）被初始化。如果基础镜像在指定的挂载点包含数据，这些数据也会被复制到新容器的卷中。
数据卷可以在多个容器间分享和复用
可以直接更改卷里面的数据
更新镜像时对容器数据卷的更改将不会被包含到新的镜像中
即使容器被删除，数据卷依然存在

数据卷的设计被用来持久化数据，让数据能够独立于容器的生命周期。因此当删除容器时Docker也不会自动删除数据卷。

Adding a data volume

增加数据卷

docker create -v和docker run -v中的-v标记来给容器添加数据卷，我们可以在一条命令中多次使用-v标记来添加多个数据卷，下面的例子挂载了一个数据卷在我们的web应用容器中。

languagedocker run -d -P --name web -v /webapp training/webapp python app.py

这条命令执行后会在容器中创建一个新的卷webapp

Mount a Host Directory as a Data Volume

为数据卷挂在主机目录

除了使用-v标记来创建卷之外，你还可以挂载Docker守护进程主机的目录到容器中。

注意：如果你使用Boot2Docker，那么你的Docker守护进程只能被限制访问OSX/windows特定的文件目录。Boot2Docker会努力自动分享OSX中的/users目录和windows中的C:users目录。因此你可以通过docker run -v /Users/<path>:/<container path> ... (OSX)或者docker run -v /c/Users/<path>:/<container path ...(Windows).来挂在文件或目录。所有的其它路径（不是/users和C：users）都来自Boot2Docker虚拟机中的文件系统。

languagedocker run -d -P --name web -v /src/webapp:/opt/webapp training/webapp python app.py

上述命令会把主机的/src/webapp目录挂在到容器中的/opt/webapp下

注意：如果/opt/webapp目录已经存在与容器的镜像中，那么/opt/webapp中的内容会被主机上的/src/webapp中的数据替换，这个和mount命令是一致的。

数据卷挂在数据对测试非常有用，比如我们可以把源代码挂在到容器中，然后修改代码看看应用会发生什么。主机上的目录必须是绝对路径，如果这个目录不存在Docker会自动去创建1个。

注意：不能在Dockerfile中来配置挂载目录，因为Dockerfile的目的是更方便的来一直和分享镜像，而主机目录依赖于主机，（对于一个目录，在不同的主机上可能绝对路径不一致）所以Dockerfile中目录挂载不会适用于所有的主机

挂载的数据卷默认是可读写的，当然我们可以通过命令标记来让它只读

languagedocker run -d -P --name web -v /src/webapp:/opt/webapp:ro training/webapp python app.py

上述命令中我们通过ro选项来让数据卷只读

Mount a Host File as a Data Volume

挂载主机文件作为数据卷

-v标记还可以用来挂在来自主机的文件，而不仅仅是目录

languagedocker run --rm -it -v ~/.bash_history:/.bash_history ubuntu /bin/bash

上述命令会带你到一个新容器的shell界面，你会有来自主机的bash历史。因为容器和主机共享了一个.bash_history文件，所以你在容器中的命令历史和主机中的历史都会记录到.bash_history中，这样当你退出容器中时，你在容器中的命令历史被保存下来了，在主机的shell历史记录中仍然能够看到容器中的历史。

注意：人们会使用很多工具来编辑文件，vi，sed --in-place，这些都会导致文件的索引节点改变。Docker 1.1.0之前，文件修改会报如sed: cannot rename ./sedKdJ9Dy: Device or resource busy这样的错误。但是在Docker 1.1.0之后，挂载文件让文件修改变得非常简单而不需要再去挂在包含这个文件的父目录了。

Creating and mounting a Data Volume Container

创建一个专门防数据的数据卷容器

如果你有一些持久化的数据需要在容器之间共享，或者想从非持久化容器使用持久化数据。最好的办法是创建名为Data的卷容器，把数据都挂在到Data容器里
我们创建一个能分享数据的命名容器，他不运行任何应用，它重复使用training/postgres镜像以便所有的容器使用同一个层，这样可以节省磁盘空间。

languagedocker create -v /dbdata --name dbdata training/postgres /bin/true

我们使用--volumes-from标记来绑定/dbdata卷到另一个容器

languagedocker run -d --volumes-from dbdata --name db1 training/postgres

或者

languagedocker run -d --volumes-from dbdata --name db2 training/postgres

在是上述的例子中，我们在容器中挂在了/dbdata卷，如果恰巧镜像training/postgres中也有/dbdata这个目录，那么容器会隐藏镜像的目录，而让容器中的/dbdata目录可见，新建多个数据容器同样是隐藏镜像的文件而显示容器中的文件，这种机制实现了数据卷的数据共享。
你可以在一条命令中使用多个--volumes-from标记参数把多个容器的数据卷绑定在一起。
上述的代码中db1和db2是挂载dbdata这个容器来扩展的，你也可以挂载db1或者db2来扩展你的数据卷。

language docker run -d --name db3 --volumes-from db1 training/postgres

如果你想删除包含挂载数据卷的容器，甚至是初始化的容器dbdata，或者是由dbdata扩展的db1和db2，容器会删除，但是数据卷会留下。使用docker rm -v来删除容器的数据卷。

注意：当你删除容器没有使用-v标记的时候，Docker不会提示警告。没有使用-v标记删除容器，会让残留的volumns变得“无家可归”（就是没有容器再引用这个数据卷）。这样的卷很难删除而且会占用很多空间，我们正在努力改善数据卷的管理，你可以通过pull request #8484来跟进我们的进程。

Backup, restore, or migrate data volumes

我们可以利用数据卷来有效的备份、恢复和迁移数据

languagedocker run --volumes-from dbdata -v $(pwd):/backup ubuntu tar cvf /backup/backup.tar /dbdata

命令中我们启动了一个新的容器，它共享了来自dbdata容器的数据卷。然后我们挂在了一个本地主机的目录/backup。最后我们使用tar命令把/dbdata中的数据压缩成dbdata.jar放到/backup中。执行结束我们就完成了数据卷的数据备份工作。

数据恢复

languagedocker run -v /dbdata --name dbdata2 ubuntu /bin/bash
docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xvf /backup/backup.tar

创建一个新的容器dbdata2，解压文件到新的容器的数据卷。

Linking Containers Together

2015-05-14T22:21:30+08:00

Docker container中services/applications与主机或者其它containers之间通信的两种方式

port mapping(端口映射)
container linking(容器连接)

Connect using Network port mapping

使用端口映射来连接

常用的命令(以training/webapp为例)：

docker run -d -P traning/webapp ...
docker run -d -p traning/webapp ...

`-P`flag

当container被创建并且运行时，-P标记立刻生效
它container内部的任意端口映射到docker host的port
- Docker host的port是随机的
- 它的生命力是短暂的（容器停止后端口映射就会失效）

e.g.

adolph@geek:~$ docker run -d -P training/webapp python app.py
3f30e81a01cdf9895a70828beebea32910f848ac00f92303e6af77faeee1db0a
adolph@geek:~$ docker ps
CONTAINER ID        IMAGE                    COMMAND             CREATED             STATUS              PORTS                     NAMES
3f30e81a01cd        training/webapp:latest   "python app.py"     8 seconds ago       Up 8 seconds        0.0.0.0:32769->5000/tcp   agitated_hawking

内部的5000端口映射到外部的主机的32769端口

`-p`flag

可以指定container内外的端口
内外的5000端口映射

docker run -d -p 5000:5000 training/webapp python app.py
adolph@geek:~$ docker ps
CONTAINER ID        IMAGE                    COMMAND             CREATED             STATUS              PORTS                    NAMES
cf6bd021034d        training/webapp:latest   "python app.py"     4 seconds ago       Up 2 seconds        0.0.0.0:5000->5000/tcp   compassionate_lalande

这样做的不好的地方在于你只把congtainer内外的5000端口映射在一起，container内的其它端口被抛弃了

映射到主机的××端口

docker run -d -p 127.0.0.1:5000:5000 training/webapp python app.py

映射到主机的某个随机端口

docker run -d -p 127.0.0.1::5000 training/webapp python app.py

注意127.0.0.1:有个冒号

-p参数使用的次数很多，主要用来配置多个端口

Connect with the linking system

Docker有自带的linking system用来连接多个container，并且允许从一个container发送信息到另一个。发送信息的称为source container，接收信息的称为recipient container，recipient container智能看到一些经过筛选的关于source container的某些信息

The importance of naming

Docker依赖于容器的名字来建立连接，Docker启动容器时会自动给它起个名字，当然你也可以自己命名

命名有两个非常棒的好处：

告知container的作用或者属于哪种类型，如traning/webapp可以看出是webapp的container
方便Docker通过name指定container

在运行container时通过--name标记来命名新的container

adolph@geek:~$ docker run -d -P --name web training/webapp python app.py
1be7fc1ca8f9b683a8c309a1f6315c65819db15e8105ddd1b198e50c4082842f
adolph@geek:~$ docker ps
CONTAINER ID        IMAGE                    COMMAND             CREATED             STATUS              PORTS                     NAMES
1be7fc1ca8f9        training/webapp:latest   "python app.py"     4 seconds ago       Up 3 seconds        0.0.0.0:32770->5000/tcp   web
adolph@geek:~$ docker inspect -f "{{.Name}}" 1be7f
/web

<span style="color:red;">注意：</span>container的name必须是唯一的，比如说刚才的web，如果你想给另一个容器起名为web，那只能把原来的webcontainer删除（docker rm [-f]）。另外，docker run --rm --name..会在容器停止运行后立即删除

Communication across links

通过连接通信

links允许容器发现对方并且建立安全的信息传输通道，link创建好后容器间通信的通道就建立好了。

注意事项:

需要运行的两个容器不能重名
不能和其它已经存在的（不管有没有运行）容器重名
docker ps -a查看所有容器的信息
docker rm [container name]删除容器

link代码

--link <name or id>:alias

name or id指我们要连接的container的名字

shell1的代码（我在一个shell中运行这些命令总会有1个容器在启动后就EXIT（0））

adolph@geek:~$ docker run -i -t --name db adolph/ubuntu:14.04 
root@a1bb409128b9:/#

shell2

adolph@geek:~$ docker run -d -P --name web --link db:db training/webapp python app.py
09fed08b63e709e61d17f698ccec55a6d04ddb6e33c1aea3879f78d1970451ce
adolph@geek:~$ docker inspect -f "{{.HostConfig.Links}}" web
[/db:/web/db]

we can see that the web container is now linked to the db container web/db. Which allows it to access information about the db container.

recipient container	source container
web	db

为了做到容器间的通信，Docker没有使用端口，而是自己建立了tunnel(隧道),使用link连接容器的好处是我们不需要将source container的端口暴露给网络，Docker的tunnel使用两种方式实现连接：

Environment variables(环境变量)
Updating the /etc/hosts file（更新/etc/hosts文件）

环境变量

当我们连接容器是Docker会创建很多环境变量，并且它会在目标容器自动基于--link后面的参数创建环境变量。Docker会公开来自source container的所有环境变量，这些变量包括：

the ENV commands in the source container's Dockerfile(源容器Dockerfile中的ENV命令)
the -e, --env and --env-file options on the docker run command when the source container is started（容器运行时run后面的-e, --env 和 --env-file参数）

这些环境变量允许我们通过编程从目标容器发现来自源容器的信息

警告：理解docker link连接容器的机制很重要，link允许所有目标容器获得源容器的指定数据和信息，所以从安全性的角度，不建议在源容器中存储敏感的数据

一些环境变量

<alias>_NAME

docker run -d -P --name web --link db:db training/webapp python app.py

这个变量是为目标容器建立的，如上，--link db:db后web容器被链接到db容器，这是Docker会在web容器中创建DB_NAME=/web/db

<name>_PORT_<port>_<protocol>
Docker为每一个源容器暴露的每一个端口。

<name>指--link中指定的目标容器的别名
<port>源容器暴露的端口号
<protocol> TCP或UDP

Docker使用不同的前缀格式来规定3种不同的环境变量：

prefix_ADDR来自URL的ip地址。例如：WEBDB_PORT_8080_TCP_ADDR=172.17.0.82.
prefix_PORT来自URL的端口。例如：WEBDB_PORT_8080_TCP_PORT=8080.
prefix_PROTO来自URL的协议。例如：WEBDB_PORT_8080_TCP_PROTO=tcp.

每一组环境变量对应一个端口，如果容器公开多个端口（比如3个），Docker就会创建9个环境变量，每个端口3个。
此外，Docker还会为源容器第一个公开的端口创建<alias>_PORT，这里的第一个指的是具有lowest port的端口。例如：WEBDB_PORT=tcp://172.17.0.82:8080，如果它吗满足tcp和udp，那指的是tcp

最后，Docker还会创建这样一个变量：<alias>_ENV_<name>，用来连接源容器和目标容器的桥梁。Docker使用这个值来启动源容器。

e.g:

adolph@geek:~$ sudo docker run --rm --name web2 --link db:db training/webapp env
[sudo] password for adolph: 
PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
HOSTNAME=20fb0166d9c6
DB_NAME=/web2/db
HOME=/

我的电脑上并没有看到环境变量！可能因为我的db容器和官网例子上的容器不一直吧，而且我的db容器中并没有安装数据库。
Docker创建的这些变量有助于我们用来连接和配置源容器里的工具，比如连接数据库...

Updating the /etc/hosts file

更新/etc/hosts文件

这部分自己有不懂的地方，以后慢慢看吧。

总结

连接容器的两种方法

`-p`，`-P`标记

link system

容器的命名是唯一的，不能重复。可以更改容器的名字
- docker rename oldname newname
--link <name or id>:alias,name指要连接的容器，alais指目标容器/简称
能够清除代码中那个是目标容器，哪个是源容器，资源开放共享的方向

docker run -d -P --name web --link db:webdb training/webapp python app.py

这条命令中db是要连接的容器，是源容器，web是目标容器，webdb是web的别称

adolph@geek:~$ docker inspect -f "{{.HostConfig.Links}}" web
[/db:/web/webdb]

都是个人理解，可能有错误，还请指正。

Working with Docker Images

2015-05-13T16:59:16+08:00

目标

本地主机管理镜像
创建自己的镜像
上传镜像到Docker Hub registry

Listing images on the host

列出主机的镜像

shelladolph@geek:~$ docker images
REPOSITORY          TAG                 IMAGE ID            CREATED             VIRTUAL SIZE
ubuntu              14.04               07f8e8c5e660        12 days ago         188.3 MB
hello-world         latest              91c95931e552        3 weeks ago         910 B
training/webapp     latest              31fa814ba25a        11 months ago       278.8 MB

镜像来自的仓库，标签和Id这些信息都很重要，来自相同的仓库我们通过标签来指定要运行的镜像

languagedocker run -i -t ubuntu:14.04 /bin/bash
docker run -i -t ubuntu:latest /bin/bash     (不加标签默认是`latest`)

个人觉得标签的好处是对于来自相同的仓库通过标签来告诉docker我要运行的是哪个镜像

Finding images

寻找镜像

languagedocker search [image name]
docker pull [image name]...找到合适的后直接拉下来

Creating our own images

创建和定制自己的镜像

更改现有镜像并提交（保存）
使用Dockerfile来制作镜像

Updating and committing an image

languagedocker run -i -t ubuntu:14.04 /bin/bash
root@5bc673e32e0a:/#apt-get install git
root@5bc673e32e0a:/#exit
sudo docker commit -m "install git" -a "adolph" 0b2616b0e5a8 adolph/ubuntu:14.04

output:4f177bd27a9ff0f6dc2a830403925b5360bfe0b93d476f7fc3231110e7f71b1c

Building an image from a Dockerfile

languagemkdir ubuntu
cd ubuntu
touch Dockerfile
vim Dockerfile
content:

#this is my fiest image created by dockerfile
FROM ubuntu:14.04
MAINTAINER adolph <test@126.com>
RUN apt-get update
#RUN apt-get install git

结果：

languageadolph@geek:~/ubuntu$ sudo docker build -t adolph-dockerfile/ubuntu:14.04 .
Sending build context to Docker daemon 2.048 kB
Sending build context to Docker daemon 
Step 0 : FROM ubuntu:14.04
 ---> 07f8e8c5e660
Step 1 : MAINTAINER adolph <nalan3015@126.com>
 ---> Running in 241ad7c398c3
 ---> 10d866905c1a
Removing intermediate container 241ad7c398c3
Step 2 : RUN apt-get update
 ---> Running in 826db7ff28e6
Ign http://archive.ubuntu.com trusty InRelease
Ign http://archive.ubuntu.com trusty-updates InRelease
。。。。。。。。。

sudo docker build -t adolph-dockerfile/ubuntu:14.04 .

注意上述命令有个.用来指定Dockerfile文件的位置

Setting tags on an image

给镜像添加标签

languagedocker tag [image id] [username]/[repository]:[tag name]

Push an image to Docker Hub

需要登录Docker Hub账号

docker push [image name]

Remove an image from the host

docker rmi [image name]

总结

languagedocker images...查看docker镜像
docker search [images name]...查找镜像

sudo docker commit -m "install git" -a "adolph" 0b2616b0e5a8（old image id） adolph/ubuntu:14.04(new image name with tag 14.04)
这条命令很重要和难记，-m和git commit -m的作用类似，-a指定作者,id指更改过的image的id，adolph/ubuntu是新的image的名字

languagedocker build -t adolph-dockerfile/ubuntu:14.04 .
后面要指定dockerfile的地址
docker tag [image id] [username]/[repository]:[tag name]
docker push [image name]
docker rmi [image name]

Working with Containers

2015-05-13T11:22:27+08:00

先回顾之前学习过的一些命令

shelldocker run -i...交互式运行
docker run -d...background运行`daemon`守护进程
docker ps...Lists containers.(容器列表)
docker logs...Shows us the standard output of a container.（显示容器的标准输出）
docker stop...Stops running containers.

docker命令格式：

shell[sudo] docker [command] [flags] [arguments]...

Seeing what the Docker client can do

docker client能干什么

[sudo] docker...显示docker后能执行的命令

Seeing Docker command usage

docker 命令使用

languagedocker command --help...查看特定命令的使用方式

Running a Web Application in Docker

docker中运行一个web应用

language sudo docker run -d -P training/webapp python app.py

-P参数表示将容器内部要用到的网络端口映射到主机

languagedocker ps -l -a

-l显示容器的详细信息，-a表示显示所有的容器信息（包含以前运行的）

languagedocker run -d -P training/webapp python app.py
docker run -d -p 5000:5000 training/webapp python app.py

-P表示将image镜像的任何端口映射到我们自己的主机
-p自己指定image的网络端口和主机的端口

实战：
命令行输入

languagedocker run -d -P training/webapp python app.py
docker ps -l -a
out:
adolph@geek:~$ docker ps -a -l
CONTAINER ID        IMAGE                    COMMAND             CREATED             STATUS              PORTS                     NAMES
1179c34ac0e0        training/webapp:latest   "python app.py"     2 minutes ago       Up 2 minutes        0.0.0.0:32769->5000/tcp   elegant_curie

这里重要的是port下面的值：0.0.0.0:32769->5000/tcp，我的理解是：这条命令把0.0.0.0:32769这个自己主机的端口映射到容器里的5000端口，所以当你在自己的浏览器输入0.0.0.0:32769是它会映射到images的5000端口从而访问app.py的网页

A Network Port Shortcut

网站端口Shortcut

languagedocker port [container id|container name]

这条命令表示输出容器的端口和映射端口，

language5000/tcp -> 0.0.0.0:32769
adolph@geek:~$ docker port 1179c 5000
0.0.0.0:32769

Viewing the Web Application's Logs

查看web应用的logs

languageadolph@geek:~$ docker logs -f elegant_curie 
 * Running on http://0.0.0.0:5000/
172.17.42.1 - - [12/May/2015 17:49:25] "GET / HTTP/1.1" 200 -
172.17.42.1 - - [12/May/2015 17:49:26] "GET /favicon.ico HTTP/1.1" 404 -

-f功能类似于tail -f而且我们可以看到标准输出的信息

Looking at our Web Application Container's processes

查看web应用容器的进程

使用docker top命令

languageadolph@geek:~$ docker top elegant_curie 
UID                 PID                 PPID                C                   STIME               TTY                 TIME                CMD
root                32280               2150                0                   01:48               ?                   00:00:00            python app.py

Inspecting our Web Application Container

检查web应用容器

languagedocker inspect comtainer name

以Json格式输出信息

Stopping&Start&Remove our Web Application Container

停止和启动我们的web容器

languageadolph@geek:~$ docker ps -l
CONTAINER ID        IMAGE                    COMMAND             CREATED             STATUS              PORTS                     NAMES
1179c34ac0e0        training/webapp:latest   "python app.py"     25 minutes ago      Up 25 minutes       0.0.0.0:32769->5000/tcp   elegant_curie       
adolph@geek:~$ docker stop elegant_curie 
elegant_curie
adolph@geek:~$ docker ps
CONTAINER ID        IMAGE               COMMAND             CREATED             STATUS              PORTS               NAMES                                                 
adolph@geek:~$ docker start elegant_curie 
elegant_curie
adolph@geek:~$ docker ps -l
CONTAINER ID        IMAGE                    COMMAND             CREATED             STATUS              PORTS                     NAMES
1179c34ac0e0        training/webapp:latest   "python app.py"     26 minutes ago      Up 7 seconds        0.0.0.0:32770->5000/tcp   elegant_curie       

adolph@geek:~$ docker stop elegant_curie 
elegant_curie
adolph@geek:~$ docker ps
CONTAINER ID        IMAGE               COMMAND             CREATED             STATUS              PORTS               NAMES
adolph@geek:~$ docker rm elegant_curie 
elegant_curie

命令总结

shelldocker...显示docker的命令
docker command --help...显示某个命令的帮助
docker ps -a -l...显示所有的容器信息
docker run -d -P ...-P映射容器的5000端口到主机的任意端口[32768-61000]
docker run -d -p ...-p自己指定映射端口
docker port [comtainer id|container name]...查看容器的端口情况
docker logs -f [container name|id] ...输出容器标准输出
docker inspect [container name]...输出json格式的容器的详细信息
docker top [container name...查看容器的进程
docker stop|start|rm [container name]...停止|开始|删除容器

Docker学习笔记-Docker化你的应用

2015-05-13T01:18:52+08:00

Docker化你的应用

使用docker run命令在容器中运行应用

如果你使用的是远程Docker 进程（daemon），使用sudo docker run

Hello world

shellsudo docker run ubuntu:14.04 /bin/echo 'Hello world'

执行这条命令Docker首先会在本地的Docker主机上找image：ubuntu：14.04，如果没找到，Docker会到Docker Hub上下载这个镜像
Docker容器仅仅在你指定的命令激活时才运行，在上面的命令中，当输出hello world后，容器就停止。

An Interactive Container（交互式容器）

shell$ sudo docker run -t -i ubuntu:14.04 /bin/bash
root@af8bae53bdd3:/#

docker run启动镜像ubuntu14.04，-t在启动的容器中使用终端，-i表示允许我们建立交互式的连接，通过获取容器的标准输入[stdin]
exit或者ctrl+D退出终端

A Daemonized Hello world（将命令守护进程化）

language$ sudo docker run -d ubuntu:14.04 /bin/sh -c "while true; do echo hello world; sleep 1; done"
eb643329659cb6b6830b70b87ef9576e0da1913682d4972d8ab904fb709072b7

-d表示后台运行容器
/bin/sh -c "while true; do echo hello world; sleep 1; done"无限输出hello world
返回一个a bit long表示container ID

Note: The container ID is a bit long and unwieldy and a bit later on we'll see a shorter ID and some ways to name our containers to make working with them easier.

languageadolph@geek:~$ docker ps
CONTAINER ID        IMAGE               COMMAND                CREATED             STATUS              PORTS               NAMES
eb643329659c        ubuntu:14.04        "/bin/sh -c 'while t   2 minutes ago       Up 2 minutes                            clever_hypatia

docker会自动命名我们启动的container，当然你也可以自己重新命名

查看容器日志并且返回它的输出

languagedocker logs container_name[clever_hypatia]

停止容器

languageadolph@geek:~$ sudo docker stop clever_hypatia 
clever_hypatia
adolph@geek:~$ docker ps
CONTAINER ID        IMAGE               COMMAND             CREATED             STATUS              PORTS               NAMES

总结

docker ps
sudo docker run [image name] [command]
sudo docker run ubuntu:14.04 /bin/echo 'Hello world'
sudo docker -t -i run [image name] [command]...交互式操作（有自己的命令行）
sudo docker run -t -i ubuntu:14.04 /bin/bash
sudo docker run -d [iamge name] [command]
sudo docker run -d ubuntu:14.04 /bin/sh -c "while true; do echo hello world; sleep 1; done"
sudo docker logs [container name]...查看容器日志和输出信息
docker logs clever_hypatia
docker stop [container name] ...停止容器

原文链接

了解什么是 Docker

2015-05-11T13:14:09+08:00

              _ _       _                    _
__      _____| | |   __| | ___  _ __   ___  | |
\ \ /\ / / _ \ | |  / _` |/ _ \| '_ \ / _ \ | |
 \ V  V /  __/ | | | (_| | (_) | | | |  __/ |_|
  \_/\_/ \___|_|_|  \__,_|\___/|_| |_|\___| (_)
                                              
 
 
 
                        ##        .
                  ## ## ##       ==
               ## ## ## ##      ===
           /""""""""""""""""\___/ ===
      ~~~ {~~ ~~~~ ~~~ ~~~~ ~~ ~ /  ===- ~~~
           \______ o          __/
             \    \        __/
              \____\______/
 
              |          |
           __ |  __   __ | _  __   _
          /  \| /  \ /   |/  / _\ |
          \__/| \__/ \__ |\_ \__  |

What is Docker?

Docker是一个为开发者和系统管理员构建，部署，运行分布式应用的开源平台。包括：Docker Engine，可移植的轻量运行环境和包管理工具，及Docker Hub。Docker Hub是为分享应用和自动化工作流服务的云服务。Docker能够做到apps快速从组件装配并且消除开发，质量评估和产品环境间的冲突。因此，它可以在不改变文件的情况下，在电脑上，数据中心虚拟机，任何云上运行同一款app

Why do developers like it?

有了Docker，开发者可以用任何语言，使用任何工具链构建任何应用。Docker化的应用完全可移植，并且到处运行：OS x，windows，云上的ubuntu或者是RED HAT上的产品数据中心虚拟机

Docker Hub上有13000+的apps，帮助开发者快速的开始开发。由Docker来管理，跟踪变化和依赖关系。系统管理员可以很容易地理解由开发者开发的app是如何工作的。有了Docker Hub，开发者可以自动构建他们自己的管道或者和合伙人通过共有或者由repositories来发布他们的产品

Docker帮助开发者开发，部署，快速的高质量应用。

Why do sysadmins like it?

系统管理员为他们（development, QA, and production teams）减少在自己电脑上运行带来的调整时间。通过Docker化app平台和app的依赖环境，系统管理员抽象的剥离了操作系统发行版本和底层的基础设施之间的差异。

此外，Docker Engine模块的标准化并以此作为部署单元使系统管理员更灵活的调整工作量。无论是否是空的物理机，或者data center VMs或者公共云，在基础架构技术的帮助下，workload deployment会更加的灵活。workload deployment会被企业的政策和次序来驱动。另外，Docker Engine的轻量运行环境允许快速的上架和下架以此响应需求的快速变化。

总的来说，Docker帮助系统管理员快速，稳定地在任何基础设施上部署和运行任何应用。

How is this different from Virtual Machines?

Virtual Machines

每个运行在虚拟机里的应用本身大小的数量级在MB，而再加上应用依赖的包和二进制库以及运行应用的虚拟机后，整个系统的大小就会达到惊人的GB级别

Docker

Docker引擎容器仅仅包含一个用和它的依赖项，它作为一个孤立的进程运行在操作系统的用户空间，和其它容器共享内核。因此，它享有特定的资源和虚拟机易部署的优势，但更加便捷和高效。

try it

docker version
docker search imageName
docker pull image(<username>/<repository>)
docker run [image name] [command]
docker run [image name] [apt-get install -y ping]

Save your change for image

保存更改使你下次使用这个镜像时能够从这个点开始运行镜像
docker中用来保存状态的操作叫做commit

docker ps -l    查看要保存的进程ID
docker commit id [new image name]
docker commit 698a learn/ping
docker run learn/ping ping www.baidu.com
docker inspect [image id] 查看image的详细信息

push you images to Docker Hub

docker images....查看当前主机上有多少个镜像
docker push [image name]