清泉月下

清泉月下 查看完整档案

填写现居城市  |  填写毕业院校  |  填写所在公司/组织填写个人主网站
编辑
_ | |__ _ _ __ _ | '_ \| | | |/ _` | | |_) | |_| | (_| | |_.__/ \__,_|\__, | |___/ 个人简介什么都没有

个人动态

清泉月下 关注了专栏 · 2019-08-08

PHPer升级

仰望星空,脚踏实地。不浮躁,不急躁,走在前往目标的路上。

关注 179

清泉月下 赞了文章 · 2019-07-17

Swoole 2019 :化繁为简、破茧成蝶

Swoole开源项目从2012年开始发布第一个版本,到现在已经有近7年的历史。在这七年的时间里:

  • 提交了8821次代码变更
  • 发布了287个版本
  • 收到并解决1161issue反馈
  • 合并了603pull request
  • 共有100位开发者贡献代码
  • GitHub收获了11940颗星

贡献者

协程

2018年我们推出了全新的Swoole4版本,在此之前Swoole主要的编程方式还是同步阻塞模式或异步回调。新的基于协程实现的CSP编程逐渐成为我们唯一推荐使用的编程模式。协程将纷繁复杂异步编程大大简化。使用Swoole4协程,既简单又强大。在未来的Swoole5版本,我们计划删除非协程的相关特性和代码,减少历史包袱,提升稳定性,降低复杂度,减少不必要的选项,纯粹协程化。

过去6年我们的团队主要以兼职开发为主,团队成员大多来自于腾讯、阿里、滴滴、百度、360、小米等国内一线互联网企业,还有一部分是国外的PHP开发者,甚至PHP语言ZendVM内核作者Dmitry Stogov也曾向Swoole贡献了代码。除此之外,我们还招募了一些在校大学生为Swoole编写代码,逐步培养年轻一代开发者。

20187月份我们组建了全职开发团队,专注于Swoole内核以及Swoole Cloud云原生组件和生态链的开发。告别过去的草莽班子,转变为专业化的开源技术研发团队。

我们的目标是让Swoole项目成为Node.jsGo这样的工业级技术,成为PHP编程语言的在异步IO和网络通信方面的基石。

研发管理

成立全职研发团队后,我们逐渐建立了非常完善的研发管理体系,提升Swoole的软件质量。主要包括以下几个方面:

测试驱动(TDD)

现在我们投入大量精力实现单元测试脚本、压测脚本、自动化测试,提升单元测试覆盖率。目前已有680项测试用例,17项压测项目,在Travis-CI平台可以看到每一次CommitPull Request的编译、测试结果。

研发工作也基于TDD进行,在开发新特性、重构、Bug Fix时,会先编写对应的单元测试脚本,测试覆盖到代码变更的所有场景。

单元测试

代码审查(Code Review)

团队成员之间进行代码交叉审查、互相Code Review,对于代码变更的细节进行充分的评估和讨论。

重大变更,会进行团队Review,花费数小时甚至数天讨论每一行代码变更细节。

RFC 机制

对于非Bug Fix、非性能提升、非重构,新特性或有可能改变底层行为的变更,我们会分为4个步骤进行。

  1. 发起RFC的提案,https://github.com/swoole/rfc...,提案内容会详细阐述此项变更的前因后果、相关配置项、影响的范围、使用方法、示例。
  2. 提案讨论,我们会对提案进行充分的讨论,刨根问底,分析优劣,推敲细节。所有问题均讨论清楚后,最终立项,开始实现。
  3. 开发负责人创建git分支,编写单元测试脚本,编写代码,实现提案中的所有内容,最终发起Pull Request
  4. 交叉评审,检查代码,提出改进意见,反馈给开发负责人,继续完善细节。最终合并到主干。

整个过程均是在GitHub平台公开进行的,对Swoole项目感兴趣的PHPer均可参与。

Swoole RFC

灰度测试

为了保证正式版本的稳定性,我们在发布前会在内部项目上进行灰度测试,检验新版本的稳定性。

另外我们与大部分Swoole框架作者建立了联系,新版本会先发给各大框架的作者提前试用。有重大底层变更、或不兼容项会提前与其他Swoole之上的开源项目作者进行沟通。

总结

在过去的几年,Swoole项目做的并不是很专业,存在较多BUG和难用的地方,也让很多使用者踩到了不少坑。最近半年成立全职研发团队后,我们在研发管理方面进步飞快,Swoole的稳定性、成熟度方面已今非昔比。稳定性始终是第一位的,我们在未来将会更加谨慎、严谨,保证质量。

重构

2018年下半年我们对底层的代码进行了多次重构,在代码结构、可读性、复用性、封装度方面进行了很多优化。使得Swoole软件更为简洁、优雅。

编程语言方面,我们现在逐渐使用C++替代C语言。C++提供的面向对象、智能指针、容器、模板等特性能够帮助我们进一步提升团队的开发效率。

在此也欢迎各位PHPer参与Swoole项目,贡献代码。

文档

Swoole的文档也是广为开发者诟病的一个方面。在2018年我们团队在文档方面逐渐加大投入。重新编写梳理文档,加入丰富的例子程序,加入更详细的配图,修复细节问题,删除带有感情色彩的语句,更加客观中立严谨。

2019 未来

新的一年我们主要有3个方向上发力。

做减法

删除非协程的特性,删除不必要的模块,减少历史包袱,提升稳定性、降低复杂度,减少不必要的选项,化繁为简,更简单。

Swoole内核层面仍然会继续不断重构、精简,减少代码行数,清理冗余代码,尽可能地实现代码复用。

深入项目

2018年底,我们已经开始逐渐与在生产环境上大量使用Swoole的企业建立联系,包括腾讯云阅文好未来陌陌优信等企业。了解实际应用场景、业务模式,进行深度交流合作,提供建议,帮助企业技术团队更好的解决业务问题,接受反馈改进底层。

生态链

2019年我们会基于Swoole4协程开发一些配套的工具和组件,弥补PHPCloud Native时代生态链方面的不足。

查看原文

赞 272 收藏 49 评论 80

清泉月下 关注了专栏 · 2019-05-22

Swoole

PHP的协程框架

关注 7101

清泉月下 赞了文章 · 2019-02-14

Swoole 2019 :化繁为简、破茧成蝶

Swoole开源项目从2012年开始发布第一个版本,到现在已经有近7年的历史。在这七年的时间里:

  • 提交了8821次代码变更
  • 发布了287个版本
  • 收到并解决1161issue反馈
  • 合并了603pull request
  • 共有100位开发者贡献代码
  • GitHub收获了11940颗星

贡献者

协程

2018年我们推出了全新的Swoole4版本,在此之前Swoole主要的编程方式还是同步阻塞模式或异步回调。新的基于协程实现的CSP编程逐渐成为我们唯一推荐使用的编程模式。协程将纷繁复杂异步编程大大简化。使用Swoole4协程,既简单又强大。在未来的Swoole5版本,我们计划删除非协程的相关特性和代码,减少历史包袱,提升稳定性,降低复杂度,减少不必要的选项,纯粹协程化。

过去6年我们的团队主要以兼职开发为主,团队成员大多来自于腾讯、阿里、滴滴、百度、360、小米等国内一线互联网企业,还有一部分是国外的PHP开发者,甚至PHP语言ZendVM内核作者Dmitry Stogov也曾向Swoole贡献了代码。除此之外,我们还招募了一些在校大学生为Swoole编写代码,逐步培养年轻一代开发者。

20187月份我们组建了全职开发团队,专注于Swoole内核以及Swoole Cloud云原生组件和生态链的开发。告别过去的草莽班子,转变为专业化的开源技术研发团队。

我们的目标是让Swoole项目成为Node.jsGo这样的工业级技术,成为PHP编程语言的在异步IO和网络通信方面的基石。

研发管理

成立全职研发团队后,我们逐渐建立了非常完善的研发管理体系,提升Swoole的软件质量。主要包括以下几个方面:

测试驱动(TDD)

现在我们投入大量精力实现单元测试脚本、压测脚本、自动化测试,提升单元测试覆盖率。目前已有680项测试用例,17项压测项目,在Travis-CI平台可以看到每一次CommitPull Request的编译、测试结果。

研发工作也基于TDD进行,在开发新特性、重构、Bug Fix时,会先编写对应的单元测试脚本,测试覆盖到代码变更的所有场景。

单元测试

代码审查(Code Review)

团队成员之间进行代码交叉审查、互相Code Review,对于代码变更的细节进行充分的评估和讨论。

重大变更,会进行团队Review,花费数小时甚至数天讨论每一行代码变更细节。

RFC 机制

对于非Bug Fix、非性能提升、非重构,新特性或有可能改变底层行为的变更,我们会分为4个步骤进行。

  1. 发起RFC的提案,https://github.com/swoole/rfc...,提案内容会详细阐述此项变更的前因后果、相关配置项、影响的范围、使用方法、示例。
  2. 提案讨论,我们会对提案进行充分的讨论,刨根问底,分析优劣,推敲细节。所有问题均讨论清楚后,最终立项,开始实现。
  3. 开发负责人创建git分支,编写单元测试脚本,编写代码,实现提案中的所有内容,最终发起Pull Request
  4. 交叉评审,检查代码,提出改进意见,反馈给开发负责人,继续完善细节。最终合并到主干。

整个过程均是在GitHub平台公开进行的,对Swoole项目感兴趣的PHPer均可参与。

Swoole RFC

灰度测试

为了保证正式版本的稳定性,我们在发布前会在内部项目上进行灰度测试,检验新版本的稳定性。

另外我们与大部分Swoole框架作者建立了联系,新版本会先发给各大框架的作者提前试用。有重大底层变更、或不兼容项会提前与其他Swoole之上的开源项目作者进行沟通。

总结

在过去的几年,Swoole项目做的并不是很专业,存在较多BUG和难用的地方,也让很多使用者踩到了不少坑。最近半年成立全职研发团队后,我们在研发管理方面进步飞快,Swoole的稳定性、成熟度方面已今非昔比。稳定性始终是第一位的,我们在未来将会更加谨慎、严谨,保证质量。

重构

2018年下半年我们对底层的代码进行了多次重构,在代码结构、可读性、复用性、封装度方面进行了很多优化。使得Swoole软件更为简洁、优雅。

编程语言方面,我们现在逐渐使用C++替代C语言。C++提供的面向对象、智能指针、容器、模板等特性能够帮助我们进一步提升团队的开发效率。

在此也欢迎各位PHPer参与Swoole项目,贡献代码。

文档

Swoole的文档也是广为开发者诟病的一个方面。在2018年我们团队在文档方面逐渐加大投入。重新编写梳理文档,加入丰富的例子程序,加入更详细的配图,修复细节问题,删除带有感情色彩的语句,更加客观中立严谨。

2019 未来

新的一年我们主要有3个方向上发力。

做减法

删除非协程的特性,删除不必要的模块,减少历史包袱,提升稳定性、降低复杂度,减少不必要的选项,化繁为简,更简单。

Swoole内核层面仍然会继续不断重构、精简,减少代码行数,清理冗余代码,尽可能地实现代码复用。

深入项目

2018年底,我们已经开始逐渐与在生产环境上大量使用Swoole的企业建立联系,包括腾讯云阅文好未来陌陌优信等企业。了解实际应用场景、业务模式,进行深度交流合作,提供建议,帮助企业技术团队更好的解决业务问题,接受反馈改进底层。

生态链

2019年我们会基于Swoole4协程开发一些配套的工具和组件,弥补PHPCloud Native时代生态链方面的不足。

查看原文

赞 272 收藏 49 评论 80

清泉月下 关注了专栏 · 2018-12-24

Tairy's Blog

分享一些自己在学习技术过程中的心得和收获。

关注 151

清泉月下 关注了专栏 · 2018-11-29

云天河

不忘初心,方得始终

关注 10

清泉月下 关注了专栏 · 2018-11-14

前端周刊

薄荷前端周刊,每周至少一篇技术分享

关注 3193

清泉月下 赞了文章 · 2018-11-14

计算机网络 - 网络层(上)

计算机网络 - 网络层(上)

两种服务

在计算机网络领域,网络层应该向运输层提供怎样的服务(“面向连接”还是“无连接”)曾引起了长期的争论。

一种观点认为,应该让计算机网络模仿电信网络,使用面向连接的通信方式。
通信之前先建立虚电路(Virtual Circuit),以保证双方通信所需的一切网络资源。 (这里的虚网络表示这只是一条逻辑上的连接,分组沿着这条逻辑连接按照存储转发方式传送,而并不是真正建立了一条物理连接;与之相对的,电路交换的电话通信是先建立一条真正的连接具体可参见概述部分介绍

另一种观点认为,应该让网络层向上只提供简单灵活的、无连接的、尽最大努力交付的数据报服务
采用这种设计思路,则网络的造价大大降低,运行方式灵活,能够适应多种应用。且每个分组独立选择路由进行转发。

网际协议 IP

网际协议 IP 是 TCP/IP 体系中两个最主要的协议之一。
与 IP 协议配套使用的还有三个协议:

  • 地址解析协议 ARP(Address Resolution Protocol)
  • 网际控制报文协议 ICMP(Internet Control Message Protocol)
  • 网际组管理协议 IGMP(Internet Group Management Protocol)

各层协议

虚拟互联网络

所谓虚拟互连网络也就是逻辑互连网络,它的意思就是互连起来的各种物理网络的异构性本来是客观存在的,但是我们利用 IP 协议就可以使这些性能各异的网络从用户看起来好像是一个统一的网络

如果在这种覆盖全球的 IP 网的上层使用 TCP 协议,那么就是现在的互联网 (Internet)。

分类的IP地址

IP 地址就是给每个连接在互联网上的主机(或路由器)分配一个在全世界范围是唯一的 32 位的标识符

IP地址的编址方法

  • 分类IP地址。这是最基本的编址方法,在 1981 年就通过了相应的标准协议。
  • 划分子网。这是对最基本的编址方法的改进,其标准 [RFC 950] 在 1985 年通过。
  • 构成超网。这是比较新的无分类编址方法。 1993 年提出后很快就得到推广应用。

分类IP地址

IP 地址 ::= { <网络号>, <主机号>}

一般表示IP地址采用点分十进制记法,将每个八位二进制数(1 byte)转换为十进制数

分类IP地址

其中D类地址多播地址
E类地址保留为今后使用。

一般不可用的特殊IP地址

网络号主机号作为源地址作为目的地址代表含义
00可以不可在本网络上的本主机
0host-id可以不可在本网络上的某台主机 host-id
全 1全 1不可可以只在本网络上进行广播(各路由器均不转发)
net-id全 1不可可以对 net-id 上的所有主机进行广播
127非全 0 或全 1 的任何数可以可以用作本地软件环回测试之用

IP地址的一些特点

1、IP地址实际上是标志一个主机(或路由器)和一条链路的接口

  • 当一个主机同时连接到两个网络上时,该主机就必须同时具有两个相应的 IP 地址;
  • 由于一个路由器至少应当连接到两个网络,故一个路由器至少应当有两个不同的 IP 地址。

2、用转发器网桥连接起来的若干个局域网仍为一个网络,因此这些局域网都具有同样的网络号

3、所有分配到网络号的网络,无论是范围很小的局域网,还是可能覆盖很大地理范围的广域网,都是平等的

IP地址硬件地址

各层使用的地址

网络数据的传输流

路由转发过程中,路由器仅根据目的站的IP地址进行路由选择,IP数据报首部的内容不变
MAC帧每经过一个路由,都将首部的目的地址和源地址更新为下一个路由(主机)硬件地址和这个路由(主机)硬件地址

IP层屏蔽了传输中的细节。

地址解析协议(ARP)

每一个主机都设有一个 ARP 高速缓存 (ARP cache),里面有所在的局域网上的各主机和路由器的 IP 地址到硬件地址的映射表

< IP address;MAC address;TTL >
(TTL:地址映射有效时间)

当主机 A 欲向本局域网上的某个主机 B 发送 IP 数据报时,就先在其 ARP 高速缓存中查看有无主机 B 的 IP 地址。

  • 如有,就可查出其对应的硬件地址,再将此硬件地址写入 MAC 帧,然后通过局域网将该 MAC 帧发往此硬件地址。
  • 如没有, ARP 进程在本局域网上广播发送一个 ARP 请求分组。收到 ARP 响应分组后,将得到的 IP 地址到硬件地址的映射写入 ARP 高速缓存
ARP 是解决同一个局域网上的主机或路由器的 IP 地址和硬件地址的映射问题。
如果所要找的主机和源主机不在同一个局域网上,那么就要通过 ARP 找到一个位于本局域网上的某个路由器的硬件地址,然后把分组发送给这个路由器,让这个路由器把分组转发给下一个网络。剩下的工作就由下一个网络来做。

IP数据报的格式

IP数据报

首部前部分(20字节)是固定长度,是所有IP数据报共有的;
后面是一些可选字段,其长度可变
  • 总长度:指首部和数据之和的长度。
  • 标志:最低位MF=1 表示还有分片;中间位DF=0允许分片
  • 片偏移:表示较长的分组在分片后,某片在原分组中的相对位置片偏移以8个字节为单位
  • 生存时间:记为TTL(Time To Live),指示数据报在网络中可通过的路由器数的最大值。
  • 协议:指出此数据报携带的数据使用何种协议,以便目的主机的 IP 层将数据部分上交给那个处理过程。
  • 首部检验和:只检验数据报的首部,不检验数据部分。(采用 16 位二进制反码求和算法)

IP层分组转发的流程

路由表中,对每一条路由,最主要的是(目的网络地址,下一跳地址

根据目的网络地址就能确定下一跳路由器,这样做的结果是:

  • IP 数据报最终一定可以找到目的主机所在目的网络上的路由器(可能要通过多次的间接交付)。
  • 只有到达最后一个路由器时,才试图向目的主机进行直接交付。

特定主机路由

虽然互联网所有的分组转发都是基于目的主机所在的网络,但在大多数情况下都允许有这样的特例,即为特定的目的主机指明一个路由。

默认路由 (default route)

路由器还可采用默认路由以减少路由表所占用的空间和搜索路由表所用的时间。
如果一个主机连接在一个小网络上,而这个网络只用一个路由器和互联网连接,那么在这种情况下使用默认路由是非常合适的。

“下一跳”是在下层实现的
当路由器收到待转发的数据报,不是将下一跳路由器的 IP 地址填入 IP 数据报,而是送交下层的网络接口软件。
网络接口软件使用 ARP 负责将下一跳路由器的 IP 地址转换成硬件地址,并将此硬件地址放在链路层的 MAC 帧的首部,然后根据这个硬件地址找到下一跳路由器。

划分子网和构造超网

划分子网

从 1985 年起在 IP 地址中又增加了一个“子网号字段”(Subnet-ID),使两级的 IP 地址变成为三级的 IP 地址。
这种做法叫做划分子网 (subnetting) 。

优点

  • 减少了 IP 地址的浪费
  • 使网络的组织更加灵活
  • 更便于维护和管理

子网掩码

子网掩码 (subnet mask)用于找出 IP 地址中的子网部分。
子网掩码长度为32位(IP地址的长度):

  • 某位 = 1:IP地址中的对应位为网络号和子网号
  • 某位 = 0:IP地址中的对应位为主机号

通过子网掩码得到子网网络地址

路由器在和相邻路由器交换路由信息时,必须把自己所在网络(或子网)的子网掩码告诉相邻路由器。
路由器的路由表中的每一个项目,除了要给出目的网络地址外,还必须同时给出该网络的子网掩码

目的网络地址,子网掩码,下一跳地址

划分子网情况下的分组转发
(1) 从收到的分组的首部提取目的 IP 地址 D
(2) 先用(本网络内部)各网络的子网掩码和 D 逐位相“与”,看是否和相应的网络地址匹配。若匹配,则将分组直接交付。否则就是间接交付,执行 (3)。
(3) 若路由表中有目的地址为 D 的特定主机路由,则将分组传送给指明的下一跳路由器;否则,执行 (4)。
(4) 对路由表中的每一行,将子网掩码和 D 逐位相“与”。若结果与该行的目的网络地址匹配,则将分组传送给该行指明的下一跳路由器;否则,执行 (5)。
(5) 若路由表中有一个默认路由,则将分组传送给路由表中所指明的默认路由器;否则,执行 (6)。
(6) 报告转发分组出错。

无分类编制CIDR(Classless Inter-Domain Routing)

CIDR使用各种长度的“网络前缀”(network-prefix)来代替分类地址中的网络号和子网号。
IP 地址从三级编址(使用子网掩码)又回到了两级编址

IP地址 ::= {<网络前缀>, <主机号>}

CIDR 使用“斜线记法”(slash notation)即在 IP 地址面加上一个斜线“/”,然后写上网络前缀所占的位数(这个数值对应于三级编址中子网掩码中 1 的个数)。例如: 220.78.168.0/24。

CIDR 地址块

CIDR 把网络前缀都相同的连续的 IP 地址组成“CIDR 地址块”。

路由聚合 (route aggregation) 或构成超网 (supernetting)

一个 CIDR 地址块可以表示很多地址,这种地址的聚合常称为路由聚合,它使得路由表中的一个项目可以表示很多个(例如上千个)原来传统分类地址的路由。
可以更加有效地分配 IPv4 的地址空间,可根据客户的需要分配适当大小的 CIDR 地址块

最长前缀匹配

使用 CIDR 时,路由表中的每个项目由“网络前缀”和“下一跳地址”组成。在查找路由表时可能会得到不止一个匹配结果。
应当从匹配结果中选择具有最长网络前缀的路由最长前缀匹配 (longest-prefix matching)。

使用二叉线索查找路由表

为了进行更加有效的查找,通常是将无分类编址的路由表存放在一种层次的数据结构中,然后自上而下地按层次进行查找。这里最常用的就是二叉线索 (binary trie)。
IP 地址中从左到右的比特值决定了从根结点逐层向下层延伸的路径,而二叉线索中的各个路径就代表路由表中存放的各个地址。

查看原文

赞 9 收藏 6 评论 0

清泉月下 赞了文章 · 2018-11-14

计算机网络 - 物理层

物理层考虑的是怎样才能在连接各种计算机的传输媒体(介)上传输数据比特流,而不是指具体的传输媒体(介)。
物理层的作用是要尽可能地屏蔽掉不同传输媒体和通信手段的差异
用于物理层的协议也常称为物理层规程 (procedure)。

数据通信基础知识

数据通信系统模型

调制

基带信号:来自信源的信号。像计算机输出的代表各种文字或图像文件的数据信号都属于基带信号。
基带信号往往包含有较多的低频成分,甚至有直流成分,而许多信道并不能传输这种低频分量或直流分量。因此必须对基带信号进行调制 (modulation)。

下图为带通调制,使用载波 (carrier)进行调制,把基带信号的频率范围搬移到较高的频段,并转换为模拟信号
带通调制过程

除了带通调制,还有一种调至类型为基带调制,它仅对基带信号的波形进行变换,使它能够与信道特性相适应。变换后的信号仍然是基带信号。把这种过程称为编码 (coding)。

信道

信道能够通过的频率范围

在任何信道中,码元传输的速率是有上限的,否则就会出现码间串扰的问题,使接收端对码元的判决(即识别)成为不可能。
1924年,奈奎斯特 (Nyquist) 就推导出了著名的奈氏准则。他给出了在假定的理想条件下,为了避免码间串扰,码元的传输速率上限值

信噪比

信噪比就是信号的平均功率噪声的平均功率之比。常记为 S/N,并用分贝 (dB) 作为度量单位。
1984年,香农 (Shannon) 用信息论的理论推导出了带宽受限有高斯白噪声干扰的信道的极限、无差错的信息传输速率(香农公式)。
shannon-hartley-theorem

由香农公式可知,信道的带宽或信道中的信噪比越大,则信息的极限传输速率就越高。
只要信息传输速率低于信道的极限信息传输速率,就一定可以找到某种办法来实现无差错的传输。

信道复用技术

复用 (multiplexing) 是通信技术中的基本概念。
它允许用户使用一个共享信道进行通信,降低成本,提高利用率。

频分复用(FDM)

FDM

频分复用的所有用户在同样的时间占用不同的带宽资源(请注意,这里的“带宽”是频率带宽而不是数据的发送速率)。

时分复用(TDM)

TDM

时分复用则是将时间划分为一段段等长的时分复用帧(TDM 帧)。每一个时分复用的用户在每一个 TDM 帧中占用固定序号的时隙
每一个用户所占用的时隙是周期性地出现(其周期就是 TDM 帧的长度)。
TDM 信号也称为等时(isochronous)信号。
时分复用的所有用户是在不同的时间占用同样的频带宽度

统计时分复用(Statistic TDM)

STDM

STDM 帧不是固定分配时隙,而是按需动态地分配时隙。因此统计时分复用可以提高线路的利用率。

波分复用(WDM)

波分复用就是光的频分复用。使用一根光纤来同时传输多个光载波信号。

码分复用(CDM)亦称为码分多址(CDMA)

每一个比特时间划分为m个短的间隔,称为码片(chip)。
每个站被指派一个唯一的 m bit 码片序列。

如发送比特 1,则发送自己的 m bit 码片序列
如发送比特 0,则发送该码片序列的二进制反码

每个站分配的码片序列不仅必须各不相同,并且还必须互相正交 (orthogonal)。

因此,站点接收信号时有三种情况:
1、发送端与接收端为两个不同站点
由于两个不同站的码片序列正交,就是向量S和T的规格化内积 (inner product) 等于 0:
规格化内积=0

2、接收端接收到比特“1”
码片向量和该码片向量自己规格化内积都是 1:
规格化内积=1

3、接收端接收到比特“0”
码片向量和该码片反码的向量的规格化内积是 –1:
规格化内积=-1

查看原文

赞 2 收藏 0 评论 0

清泉月下 赞了文章 · 2018-11-14

计算机网络 - 数据链路层

数据链路层使用的信道主要有以下两种类型:

  • 点对点信道:这种信道使用一对一的点对点通信方式。
  • 广播信道:这种信道使用一对多的广播通信方式。广播信道上连接的主机很多,因此必须使用专用的共享信道协议来协调这些主机的数据发送。

链路(link) 是一条无源的点到点的物理线路段,中间没有任何其他的交换结点。
数据链路 (data link) 除了物理线路外,还必须有通信协议来控制这些数据的传输。若把实现这些协议的硬件和软件加到链路上,就构成了数据链路。

现在最常用的方法是使用适配器(即网卡)来实现这些协议的硬件和软件。
计算机通过适配器局域网进行通信。

adapter

三个基本问题

封装成帧

封装成帧 (framing) 就是在一段数据的前后分别添加首部尾部,然后就构成了一个帧。确定帧的界限。
封装成帧

透明传输

如果数据中的某个字节的二进制代码恰好和 SOH 或 EOT 一样,数据链路层就会错误地“找到帧的边界”。
解决方法字节填充 (byte stuffing) 或比特填充 (bit stuffing)。
字节填充:
byte_stuffing

比特填充:
bit_stuffing

差错检测

在传输过程中可能会产生比特差错:1 可能会变成 0 而 0 也可能变成 1。
在一段时间内,传输错误的比特占所传输比特总数的比率称为误码率 BER (Bit Error Rate)。

在数据链路层传送的帧中,广泛使用了循环冗余检验 CRC 的检错技术。

冗余码的计算

假设待传送的一组数据 M = 101001(现在 k = 6)。我们在 M 的后面再添加供差错检测用的 n 位冗余码一起发送。
用二进制的模 2 运算进行 2^n 乘 M 的运算,这相当于在 M 后面添加 n 个 0
得到的 (k + n) 位的数除以事先选定好的长度为 (n + 1) 位的除数 P,得出商是 Q 而余数是 R,余数 R 比除数 P 少 1 位,即 R 是 n 位。
余数 R 作为冗余码拼接在数据 M 后面发送出去。

在数据后面添加上的冗余码称为帧检验序列 FCS (Frame Check Sequence)。
FCS 可以用 CRC 这种方法得出,但 CRC 并非用来获得 FCS 的唯一方法。

接收端对每一帧进行CRC检验

若得出的余数 R = 0,则判定这个帧没有差错,就接受 (accept)。
若余数 R != 0,则判定这个帧有差错,就丢弃

仅用循环冗余检验 CRC 差错检测技术只能做到无差错接受 (accept)。
要做到“可靠传输”(即发送什么就收到什么)就必须再加上确认和重传机制
在数据链路层使用 CRC 检验,能够实现无比特差错的传输,但这还不是可靠传输。这里介绍的数据链路层协议不是可靠传输的协议

点对点协议PPP

对于点对点的链路,目前使用得最广泛的数据链路层协议是点对点协议 PPP (Point-to-Point Protocol)。
用户使用拨号电话线接入互联网时, 用户计算机ISP 进行通信时所使用的数据链路层协议就是 PPP 协议

PPP帧格式

ppp帧格式

PPP 是面向字节的,所有的 PPP 帧的长度都是整数字节。
标志字段 F = 0x7E;地址字段 A 只置为 0xFF;控制字段 C 通常置为 0x03。
PPP 有一个 2 个字节的协议字段。其值

  • 若为 0x0021,则信息字段就是 IP 数据报。
  • 若为 0x8021,则信息字段是网络控制数据。
  • 若为 0xC021,则信息字段是 PPP 链路控制数据。
  • 若为 0xC023,则信息字段是鉴别数据。

透明传输问题

异步传输 - 字符填充

将信息字段中出现的每一个 0x7E 字节转变成为 2 字节序列 (0x7D, 0x5E)。
若信息字段中出现一个 0x7D 的字节, 则将其转变成为 2 字节序列 (0x7D, 0x5D)。
若信息字段中出现 ASCII 码的控制字符(即数值小于 0x20 的字符),则在该字符前面要加入一个 0x7D 字节,同时将该字符的编码加以改变。

同步传输 - 零比特填充

在发送端,只要发现有 5 个连续 1,则立即填入一个 0
接收端对帧中的比特流进行扫描。每当发现 5 个连续1时,就把这 5 个连续 1 后的一个 0 删除

使用广播信道的数据链路层

以太网
DIX Ethernet V2 是世界上第一个局域网产品(以太网)的规约
IEEE 802.3 是第一个 IEEE 的以太网标准
DIX Ethernet V2 标准与 IEEE 的 802.3 标准只有很小的差别,因此
可以将 802.3 局域网简称为“以太网”(Ethernet)。

数据链路层的两个子层
IEEE 802 委员会就将局域网的数据链路层拆成两个子层:
逻辑链路控制 LLC (Logical Link Control)子层;
媒体接入控制 MAC (Medium Access Control)子层。

由于 TCP/IP 体系经常使用的局域网是 DIX Ethernet V2 而不是 802.3 标准中的几种局域网,因此现在 802 委员会制定的逻辑链路控制子层 LLC(即 802.2 标准)的作用已经不大了。故我们一般不考虑 LLC 子层,仅考虑 MAC层

CSMA/CD协议

为了通信的简便,以太网采取了两种重要的措施:
(1) 采用较为灵活的无连接的工作方式
不必先建立连接就可以直接发送数据
对发送的数据帧不进行编号,也不要求对方发回确认

这样做的理由是局域网信道的质量很好,因信道质量产生差错的概率是很小的。
以太网提供的服务是不可靠的交付,即尽最大努力的交付。
当目的站收到有差错的数据帧时就丢弃此帧,其他什么也不做。差错的纠正由高层来决定。

(2) 以太网发送的数据都使用曼彻斯特 (Manchester)编码

CSMA/CD协议的含义

CSMA/CD即载波监听多点接入 / 碰撞检测 (Carrier Sense Multiple Access with Collision Detection)。
载波监听”:用电子技术检测总线上有没有其他计算机发送的数据信号。

多点接入”:表示许多计算机以多点接入的方式连接在一根总线上。

碰撞检测”:就是计算机边发送数据边检测信道上的信号电压大小。
当一个站检测到的信号电压摆动值超过一定的门限值时,就认为总线上至少有两个站同时在发送数据,表明产生了碰撞。
所谓“碰撞”就是发生了冲突。因此“碰撞检测”也称为“冲突检测”。

每一个正在发送数据的站,一旦发现总线上出现了碰撞,就要立即停止发送,免得继续浪费网络资源,然后等待一段随机时间后再次发送。

为什么要碰撞检测
由于电磁波在总线上的传播速率是有限的
B 若在 A 发送的信息到达 B 之前发送自己的帧 (因为这时 B 的载波监听检测不到 A 所发送的信息),则必然要在某个时间和 A 发送的帧发生碰撞。

CSMA/CD 重要特性

使用 CSMA/CD 协议的以太网不能进行全双工通信而只能进行双向交替通信(半双工通信)
每个站在发送数据之后的一小段时间内,存在着遭遇碰撞的可能性。
这种发送的不确定性使整个以太网的平均通信量远小于以太网的最高数据率。

争用期

最先发送数据帧的站,在发送数据帧后至多经过时间 2τ (两倍的端到端往返时延)就可知道发送的数据帧是否遭受了碰撞。
以太网的端到端往返时延 2τ 称为争用期,或碰撞窗口

10 Mbit/s 以太网取 51.2 μs 为争用期的长度。
对于 10 Mbit/s 以太网,在争用期内可发送 512 bit,即 64 字节。
由此,以太网规定了最短有效帧长为 64 字节,凡长度小于 64 字节的帧都是由于冲突而异常中止的无效帧

二进制指数类型退避算法

k = min[重传次数, 10]
r = random[0,1,...,(2^k-1)]
时延 = r*2τ(基本退避时间)

强化碰撞

当发送数据的站一旦发现发生了碰撞时,便立即停止发送数据
继续发送若干比特的人为干扰信号(jamming signal),以便让所有用户都知道现在已经发生了碰撞。

CSMA/CD协议的要点

(1)检测信道:在发送前,必须先检测信道。
若检测到信道忙,则应不停地检测,一直等待信道转为空闲。若检测到信道空闲,并在 96 比特时间内信道保持空闲(保证了帧间最小间隔),就发送这个帧。
(2)检测碰撞
在发送过程中仍不停地检测信道,即网络适配器要边发送边监听
①发送成功:在争用期内一直未检测到碰撞。这个帧肯定能够发送成功。
②发送失败:在争用期内检测到碰撞。这时立即停止发送数据,并按规定发送人为干扰信号。适配器接着就执行指数退避算法,等待 r 倍 512 比特时间后,返回到步骤 (1),继续检测信道。但若重传达 16 次仍不能成功,则停止重传而向上报错。

帧间最小间隔
帧间最小间隔为 9.6 μs,相当于 96 bit 的发送时间。
一个站在检测到总线开始空闲后,还要等待 9.6 μs 才能再次发送数据。
这样做是为了使刚刚收到数据帧的站的接收缓存来得及清理,做好接收下一帧的准备。

以太网的物理层基础 -- 使用集线器星形拓扑

采用双绞线的以太网采用星形拓扑,在星形的中心则增加了一种可靠性非常高的设备,叫做集线器 (hub)。集线器很像一个多接口的转发器,工作在物理层
使用集线器的以太网在逻辑上仍是一个总线网,各工作站使用的还是 CSMA/CD 协议,并共享逻辑上的总线。

以太网的信道利用率 -- 以α参数表示

在以太网中定义了参数 α,它是以太网单程端到端时延τ帧的发送时间 T0 之比:
α = τ/T0
为提高利用率,以太网的参数a的值应当尽可能小些。

  • 当数据率一定时,以太网的连线的长度受到限制,否则  的数值会太大。
  • 以太网的帧长不能太短,否则 T0 的值会太小,使 α 值太大。

以太网的MAC层

MAC地址

生产适配器时,6 字节的 MAC 地址已被固化在适配器的 ROM,因此,MAC 地址也叫做硬件地址 (hardware address)或物理地址
“MAC地址”实际上就是适配器地址适配器标识符 EUI-48

48位(6字节)的MAC地址称为 MAC-48,它的通用名称是 EUI-48。
前三个字节由IEEE 的注册管理机构 RA 负责向厂家分配,称为组织唯一标识符
后三个字节由厂家自行指派,称为扩展唯一标识符,必须保证生产出的适配器没有重复地址

适配器从网络上每收到一个 MAC 帧就首先用硬件检查 MAC 帧中的 MAC 地址
如果是发往本站的帧收下,然后再进行其他的处理。
否则就将此帧丢弃,不再进行其他的处理。

MAC帧格式:

常用的以太网 MAC 帧格式有两种标准,最常用的 MAC 帧是以太网 V2(DIX Ethernet V2) 的格式。
mac帧格式

类型字段用来标志上一层使用的是什么协议,以便把收到的 MAC 帧的数据上交给上一层的这个协议。
数据字段的正式名称是 MAC 客户数据字段
数据字段的最小长度(46字节)= 最短有效帧长(64字节) - 首部和尾部(18字节)。

当数据字段的长度小于 46 字节时,应在数据字段的后面加入整数字节的填充字段。

在帧的前面插入(硬件生成)的 8 字节中,第一个字段共 7 个字节,是前同步码,用来迅速实现 MAC 帧的比特同步。第二个字段 1 个字节是帧开始定界符,表示后面的信息就是 MAC 帧。

扩展的以太网

物理层扩展以太网 --- 使用集线器扩展

集线器工作在物理层,每个端口相当于一个中继器,用于扩展终端数量。
集线器共享带宽,带宽为多个端口所瓜分。碰撞域增大了,但总的吞吐量并未提高
如果不同的碰撞域使用不同的数据率,那么就不能用集线器将它们互连起来。

数据链路层扩展以太网 --- 使用交换机扩展

交换机工作在数据链路层,每个端口相当于一个集线器(即每个端口是一个独立的冲突域),原理是根据数据帧头的MAC地址转发帧到合适的端口。(即相当于,大家不是都在一个大广场上喊人,而是可以根据门牌号找到要找的人)

能同时连通多对接口,使多对主机能同时通信
交换机每个端口独享带宽,无碰撞地传输数据。

现在,采用以太网交换机星形结构成为以太网的首选拓扑。
以太网交换机不使用共享总线,没有碰撞问题,因此不使用 CSMA/CD 协议,而是以全双工方式工作。但仍然采用以太网的帧结构

交换机通过自学习算法处理收到的帧和建立交换表

  • A 先向 B 发送一帧,从接口1 进入到交换机。
  • 交换机收到帧后,先查找交换表,没有查到应从哪个接口转发这个帧。
  • 交换机把这个帧的源地址 A 和接口 1 写入交换表中,并向除接口1以外的所有的接口广播这个帧
  • C 和 D 将丢弃这个帧,因为目的地址不对。只 B 才收下这个目的地址正确的帧。这也称为过滤
  • B 通过接口3A 发送一帧。
  • 交换机查找交换表,发现交换表中的 MAC 地址有 A。表明要发送给A的帧(即目的地址为 A 的帧)应从接口1转发。于是就把这个帧传送到接口 1 转发给 A。显然,现在已经没有必要再广播收到的帧。
  • 交换表这时新增加的项目 (B, 3),表明今后如有发送给 B 的帧,就应当从接口 3 转发出去。

高速以太网

100BASE-T以太网

可在全双工方式下工作而无冲突发生。在全双工方式下工作时,不使用 CSMA/CD 协议
MAC 帧格式仍然是 802.3 标准规定的
保持最短帧长不变,但将一个网段的最大电缆长度减小到 100 m。
帧间时间间隔从原来的 9.6 μs 改为现在的 0.96 μs。

吉比特以太网

在半双工方式下使用 CSMA/CD 协议,全双工方式不使用 CSMA/CD 协议。

查看原文

赞 2 收藏 0 评论 0

认证与成就

  • 获得 11 次点赞
  • 获得 5 枚徽章 获得 0 枚金徽章, 获得 0 枚银徽章, 获得 5 枚铜徽章

擅长技能
编辑

(゚∀゚ )
暂时没有

开源项目 & 著作
编辑

(゚∀゚ )
暂时没有

注册于 2016-10-05
个人主页被 308 人浏览