题目:
如何实现多台服务器共用SESSION?
回答:
方案将SESSION保存到数据库,不同主机可以去读SESSION数据库来判断是否登录在线
反问:
如果并发访问很大的情况下,如何保证SESSION正常读取?
这是一个面试题,回答了使用数据库来保存SESSION的时候,面试官不满意,我自己的思路是将这个题目思考为多个分站如何公用SESSION,比如顶级域和多子域。所以为了同步方便,想到的是数据库存放,但是如何处理并发量很高的情况?(弃用DB存放SESSION换其他方案?)
题目:
如何实现多台服务器共用SESSION?
回答:
方案将SESSION保存到数据库,不同主机可以去读SESSION数据库来判断是否登录在线
反问:
如果并发访问很大的情况下,如何保证SESSION正常读取?
这是一个面试题,回答了使用数据库来保存SESSION的时候,面试官不满意,我自己的思路是将这个题目思考为多个分站如何公用SESSION,比如顶级域和多子域。所以为了同步方便,想到的是数据库存放,但是如何处理并发量很高的情况?(弃用DB存放SESSION换其他方案?)
用MySQL存储用户会话信息
基于数据库实现会话:
登录用户:
online1(sessid,session,time,version); $_COOKIE['myid']内容为:用户ID(作为sessid)+密码哈希(验证身份)
普通访客:
online2(sessid,session,time,version); $_COOKIE['myid']内容为:用户ID(为0)+会话ID(sessid)
sessid是用户ID,访客则为普通访客则为online_id()生成的ID.
session存储用户会话,内容是会话数组serialize序列化后的串.
time是记录的更新时间.
version是版本号,用于实现CAS(Check And Set)乐观锁,保证session字段数据的一致性.
访客唯一ID生成函数:
function online_id(){
$time = !empty($_SERVER['REQUEST_TIME_FLOAT']) ? $_SERVER['REQUEST_TIME_FLOAT'] : mt_rand();
$addr = !empty($_SERVER['REMOTE_ADDR']) ? $_SERVER['REMOTE_ADDR'] : mt_rand();
$port = !empty($_SERVER['REMOTE_PORT']) ? $_SERVER['REMOTE_PORT'] : mt_rand();
$ua = !empty($_SERVER['HTTP_USER_AGENT']) ? $_SERVER['HTTP_USER_AGENT'] : mt_rand();
return md5(uniqid(mt_rand(), true).$time.$addr.$port.$ua.mt_rand());
}
表结构:
CREATE TABLE `online1` (
`sessid` int(10) unsigned NOT NULL DEFAULT '0',
`session` varchar(20000) NOT NULL DEFAULT '',
`time` int(10) unsigned NOT NULL DEFAULT '0',
`version` int(10) unsigned NOT NULL DEFAULT '0',
PRIMARY KEY (`sessid`),
KEY (`time`),
KEY (`version`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_general_ci;
CREATE TABLE `online2` (
`sessid` char(32) NOT NULL DEFAULT '',
`session` varchar(20000) NOT NULL DEFAULT '',
`time` int(10) unsigned NOT NULL DEFAULT '0',
`version` int(10) unsigned NOT NULL DEFAULT '0',
PRIMARY KEY (`sessid`),
KEY (`time`),
KEY (`version`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_general_ci;
读写函数:
function cn_session_get($sessid) { CRUD($_COOKIE['myid'],online1,online2) + return unserialize($session); }
function cn_session_set($sessid,$session) { serialize($session) + CURD_CAS_UPDATE }
函数调用:
$session = cn_session_get($sessid);
print_r($session['cart']);
$session['cart'] = array();
cn_session_set($sessid,$session); 或者 register_shutdown_function(cn_session_set,$sessid,$session);
cnsessionset()时用版本号version进行冲突检测,保证session字段数据的一致性:
cn_session_get: SELECT * FROM online WHERE sessid=1;
cn_session_set: UPDATE online SET session=$session,version=last_version+1 WHERE id=1 AND version=last_version;
如果没有更新记录,则返回AJAX操作失败的提示.
对比:PHP内置的会话机制使用的是排它锁(悲观锁).
sessionstart()开启的是一个对sessID会话文件的写保护锁,
其他页面操作同一个sessID会话文件的sessionstart()将会被阻塞,
直到请求完成或者用sessionwriteclose()显式关闭.
这样的SESSION锁机制就避免了下面的情况:
A页面和B页面读取了相同的一份会话信息.
A页面修改并写入了会话变量a.
B页面随后也修改并写入了会话变量b.
这时B页面会覆盖了之前A页面写入的会话变量a.
注意:这种并发一般很少发生,所以基于数据库实现的会话机制使用乐观锁,也是合理的,并不会频繁遇到操作失败的情况.
会话应用场景:记录登录后的用户信息,购物车(读取/添加/删除),观看记录,验证码,csrf_token.
把购物车数据存以序列化或JSON串形式存到数据库字段中,也就丧失了SQL查询功能.
如果是以数据库记录的形式来存储购物车,则方便进行SQL查询分析.
既然,已经放弃使用SQL,自然可以上NoSQL,比如Memcached/Redis,设计类似于上述MySQL的方案.
@eechen 给出的是单节点或者同一主域名下的多节点之间使用自定义存储session的步骤,其实php本身就有使用外置存储保存的功能,可以看这一篇教程:http://www.sitepoint.com/saving-php-sessions-in-redis/ 。由于对于所有web站点来说,session的后台存储都是同一个redis,所以即使web站点被调度到任何一个节点,读取的session数据还是不变的。
不知道面试官问的是不是不同主域共享session,如果是这种情况是不能用这种方案的。
的确,redis,memcache是不二的选择,原因是他们是内存数据库,硬盘数据库的瓶颈就是硬盘Io。两者之间我比较推荐redis,因为它支持的数据格式多,而且扩展强大,比如持久化。
用memcached。
session不是持久化存储,跟rdbs的差异还是挺大的,但跟memcached很像。
至于sessionid,可以用应用里的uid来代替,需要手动管理。
2 回答3.1k 阅读✓ 已解决
1 回答1.4k 阅读✓ 已解决
1 回答1k 阅读✓ 已解决
1 回答1.3k 阅读✓ 已解决
3 回答1.2k 阅读
2 回答1.2k 阅读
1 回答1.2k 阅读
你说存 MySQL,然后面试官问并发很大怎么办,其实说明他不推荐存 MySQL。这种情况你得回答:存 Redis 或者 Memcached。
如果我是面试官,我会再问,用户量很大,单台 Redis 根本就放不下怎么办?这里也表明,把所有的 Session 全量存放单台机器上是不可行的。有2种方式:方法一,服务器端不保存 Session 了,将用户的 Session(注意:不仅是 SessionID) 存在用户本地(用 Cookie 或者 LocalData),但是明显有几个严重的问题:安全性、http传输的数据量、本地存储的上限等。还有,这就不是 Session 了,完全就是 Cookie 的方案。
方法二,那就是服务器端分布式存储了(Redis 集群、 Memcached 集群),既然是分布式,那么就必须保证用户每次请求都得到达指定的服务器,因为他的 Session 在那台指定分片上,标记的方式可以是在存在用户的 Cookie 里面,用户请求时,服务器根据 Cookie 里面的内容将请求 Route 到指定的分片上。
如果你这样回答了,我再问,如果某个分片挂了怎么办,那这所有用户的 Session 就丢了。这是就高可用了,对每个分片建多个复制集(从节点),主分片挂了,从节点就继续提供访问。
恩,分布式基本都是这个理。