同源策略限制了一个源(origin)中加载文本或脚本与来自其它源(origin)中资源的交互方式。

同源定义

如果两个页面拥有 相同协议(protocol)端口(如果指定),和 主机,那么这两个页面就属于同一个源(origin)。

下表给出了相对 http://store.company.com/dir/page.html 同源检测的示例:

URL 结果 原因
http://store.company.com/dir2/other.html 成功
http://store.company.com/dir/inner/another.html 成功
https://store.company.com/secure.html 失败 协议不同
http://store.company.com:81/dir/etc.html 失败 端口不同
http://news.company.com/dir/other.html 失败 主机名不同

参见origin definition for file: URLs.

源继承

来自about:blankjavascript:data:URLs中的内容,继承了将其载入的文档所指定的源,因为它们的URL本身未指定任何关于自身源的信息。

IE 特例

在处理同源策略的问题上,IE存在两个主要的不同之处。

  • 授信范围(Trust Zones):两个相互之间高度互信的域名,如公司域名(corporate domains),不遵守同源策略的限制。

  • 端口:IE未将端口号加入到同源策略的组成部分之中,因此 http://company.com:81/index.html 和http://company.com/index.html 属于同源并且不受任何限制。

这些例外是非标准的,其它浏览器也未做出支持,但会助于开发基于window RT IE的应用程序。

变更源

页面可以改变本身的源,但会受到一些限制。脚本可以设置 document.domain 的值为当前域的一个后缀。

在同源策略中有一个例外,脚本可以设置 document.domain 的值为当前域的一个后缀,如果这样做的话,短的域将作为后续同源检测的依据。例如,假设在 http://store.company.com/dir/other.html 中的一个脚本执行了下列语句:

document.domain = "company.com";

这条语句执行之后,页面将会成功地通过对 http://company.com/dir/page.html 的同源检测。而同理,company.com 不能设置 document.domain 为 othercompany.com.

浏览器单独保存端口号。任何的赋值操作,包括document.domain = document.domain都会以 null 值覆盖掉原来的端口号。因此 company.com:8080 页面的脚本不能仅通过设置document.domain = "company.com"就能与 company.com 通信。赋值时必须带上端口号,以确保端口号不会为 null 。

附注:使用 document.domain 来安全是让子域访问其父域,需要同时将子域和父域的 document.domain 设置为相同的值。必须要这么做,即使是简单的将父域设置为其原来的值。没有这么做的话可能导致授权错误。

跨域网络访问

同源策略控制了不同源之间的交互,例如在使用 XMLHttpRequest 或 <img> 标签时则会受到同源策略的约束。交互通常分为三类:

  • 通常允许进行跨域写操作(Cross-origin writes)。例如链接(links),重定向以及表单提交。特定少数的HTTP请求需要添加 preflight。

  • 通常允许跨域资源嵌入(Cross-origin embedding)。之后下面会举例说明。

  • 通常不允许跨域读操作(Cross-origin reads)。但常可以通过内嵌资源来巧妙的进行读取访问。例如可以读取嵌入图片的高度和宽度,调用内嵌脚本的方法,或 availability of an embedded resource.

以下是一些可以跨域内嵌的资源示例:

  • <script src="..."></script> 标签嵌入跨域脚本。语法错误信息只能在同源脚本中捕捉到。

  • <link rel="stylesheet" href="..."> 标签嵌入CSS。由于CSS的松散的语法规则,CSS的跨域需要一个设置正确的 Content-Type 消息头。不同浏览器有不同的限制: IE, Firefox, Chrome, Safari (跳至CVE-2010-0051)部分和 Opera。

  • <img> 嵌入图片。支持的图片格式包括 PNG, JPEG, GIF, BMP, SVG, ...

  • <video> 和 <audio> 嵌入多媒体资源。

  • <object>, <embed> 和 <applet> 的插件。

  • @font-face 引入的字体。一些浏览器允许跨域字体(cross-origin fonts),一些需要同源字体(same-origin fonts)。

  • <frame> 和 <iframe> 载入的任何资源。站点可以使用X-Frame-Options消息头来阻止这种形式的跨域交互。

实现跨域访问

使用 CORS 来实现跨域访问。

阻止跨域访问

  • 阻止跨域写操作,只要检测请求中的一个不可测的标记 (CSRF token)即可,这个标记被称为 Cross-Site Request Forgery (CSRF) 标记。必须使用这个标记来阻止页面的跨站读操作。

  • 阻止资源的跨站读取,需要保证该资源是不可嵌入的。阻止嵌入行为是必须的,因为嵌入资源通常向其暴露信息。

  • 阻止跨站嵌入,确保你得资源不能是以上列出的可嵌入资源格式。多数情况下浏览器都不会遵守 Conten-Type 消息头。例如,如果你在 <script> 标签中嵌入 HTML 文档,浏览器仍将 HTML 解析为Javascript. When your resource is not an entry point to your site, you can also use a CSRF token to prevent embedding.

跨域脚本API访问

Javascript 的 APIs 中,如 iframe.contentWindow, window.parent, window.open 和 window.opener 允许文档间直接相互引用。当两个文档的源不同时,这些引用方式将对 Window 和 Location 对象的访问添加限制。可以使用 window.postMessage 作为替代方案,提供跨域文档间的通讯。

跨域数据存储访问

存储在浏览器中的数据,如 localStorage 和 IndexedDB,以源进行分割。每个源都拥有自己单独的存储空间,一个源中的 Javascript 脚本不能对属于其它源的数据进行读写操作。

window.name 属性可以用来临时存储数据,可以跨域访问。

Cookies 使用不同的源定义方式。一个页面可以为本域和任何父域设置 cookie,只要是父域不是公共后缀(public suffix)即可。Firefox 和 Chrome 使用 Public Suffix List 决定一个域是否是一个公共后缀(public suffix)。不管使用哪个协议(HTTP/HTTPS)或端口号,浏览器都允许给定的域以及其任何子域名 (sub-domains) 来访问 cookie。设置 cookie 时,你可以使用 Domain,Path,Secure,和 Http-Only 标记来限定其访问性。读取 cookie 时,不会知晓它的出处。尽管使用安全的 https 连接,任何可见的 cookie 都是使用不安全的连接设置的。


ChanceWong
1.4k 声望49 粉丝

More than front-end :p


引用和评论

0 条评论