45

UX Planet论坛上有过这么一篇热门文章: Infinite Scrolling Best Practices,它从UX角度分析了无限滚动加载的设计实践。

无限滚动加载在互联网上到处都有应用:
豆瓣首页是一个,Facebook的Timeline是一个,Tweeter的话题列表也是一个。当你向下滚动,新的内容就神奇的“无中生有”了。这是一个得到广泛赞扬的用户体验。

无限滚动加载背后的技术挑战其实比想象中要多不少。尤其是要考虑页面性能,需要做到极致。
本文通过代码实例,来实现一个无限滚动加载效果。更重要的是,在实现过程中,对于页面性能的分析和处理力图做到最大化,希望对读者有所启发,同时也欢迎与我讨论。

性能测量

在开启我们的代码之前,有必要先了解一下常用的性能测量手段:

1)使用window.performance

HTML5带来的performance API功能强大。我们可以使用其performance.now()精确计算程序执行时间。performance.now()与Date.now()不同的是,返回了以微秒(百万分之一秒)为单位的时间,更加精准。并且与 Date.now() 会受系统程序执行阻塞的影响不同,performance.now() 的时间是以恒定速率递增的,不受系统时间的影响(系统时间可被人为或软件调整)。
同时,也可以使用performance.mark()标记各种时间戳(就像在地图上打点),保存为各种测量值(测量地图上的点之间的距离),便可以批量地分析这些数据了。

2)使用console.time方法与console.timeEnd方法

其中console.time方法用于标记开始时间,console.timeEnd方法用于标记结束时间,并且将结束时间与开始时间之间经过的毫秒数在控制台中输出。

3)使用专业的测量工具/平台:jsPerf

这次实现中,我们使用第二种方法,因为它已经完全可以满足我们的需求,且兼容性更加全面。

整体思路和方案设计

我们要实现的页面样例如图,

ye mian

它能够做到无限下拉加载内容。我把红线标出的部分叫做一个block-item,后续也都用这种命名。

1)关于设计方案,肯定第一个最基本、最朴素的思想是下拉到底部之后发送ajax异步请求,成功之后的回调里进行页面拼接。

2)但是观察页面布局,很明显图片较多,每一个block-item区块都有一张配图。当加载后的内容插入到页面中时,浏览器就开始获取图片。这意味着所有的图像同时下载,浏览器中的下载通道将被占满。同时,由于内容优先于用户浏览而加载,所以可能被迫下载底部那些永远也不会被用户浏览到的图像。
所以,我们需要设计一个懒加载效果,使得页面速度更快,并且节省用户的流量费用和延长电池寿命。

3)上一条提到的懒加载实现上,为了避免到真正的页面底部时才进行加载和渲染,而造成用户较长时间等待。我们可以设置一个合理阈值,在用户滚动到页面底部之前,先进行提前加载。

4)另外,页面滚动的事件肯定是需要监听的。同时,页面滚动问题也比较棘手,后面将专为滚动进行分析。

5)DOM操作我们知道是及其缓慢而低效的,有兴趣的同学可以研究一下jsPerf上一些经典的benchmark,比如这篇。关于造成这种缓慢的原因,社区上同样有很多文章有过分析,这里就不再深入。但我想总结并补充的是:DOM操作,光是为了找一个节点,就从本质上比简单的检索内存中的值要慢。一些DOM操作还需要重新计算样式来读取或检索一个值。更突出的问题在于:DOM操作是阻塞的,所以当有一个DOM操作在进行时,其他的什么都不能做,包括用户与页面的交互(除了滚动)。这是一个极度伤害用户体验的事实。

所以,在下面的效果实现中,我采用了大量“不可思议”的DOM缓存,甚至极端的缓存everything。当然,这样做的收益也在最后部分有所展现。

滚动问题

滚动问题不难想象在于高频率的触发滚动事件处理上。具我亲测,在极端case下,滚动及其卡顿。即使滚动不卡顿,你可以打开Chrome控制台发现,帧速率也非常慢。关于帧速率的问题,我们有著名的16.7毫秒理论。关于这个时间分析,社区上也有不少文章阐述,这里不再展开。

针对于此,有很多读者会立刻想到“截流和防抖动函数”(Throttle和Debounce)。
简单总结一下:

1)Throttle允许我们限制激活响应的数量。我们可以限制每秒回调的数量。反过来,也就是说在激活下一个回调之前要等待多少时间;

2)Debounce意味着当事件发生时,我们不会立即激活回调。相反,我们等待一定的时间并检查相同的事件是否再次触发。如果是,我们重置定时器,并再次等待。如果在等待期间没有发生相同的事件,我们就立即激活回调。

具体这里就不代码实现了。原理明白之后,应该不难写出。

但是我这里想从移动端主要浏览器处理滚动的方式入手,来思考这个问题:

1)在Android机器上,用户滚动屏幕时,滚动事件高频率发生——在Galaxy-SIII手机上,大约频率是一秒一百次。这意味着,滚动处理函数也被调用了数百次,而这些又都是成本较大的函数。

2)在Safari浏览器上,我们遇到的问题恰恰是相反的:用户每次滚动屏幕时,滚动事件只在滚动动画停止时才触发。当用户在iPhone上滚动屏幕时,不会运行更新界面的代码(滚动停止时才会运行一次)。

另外,我想也许会有读者想到rAf(requestAnimationFrame),但是据我观察,很多前端其实并不明白requestAnimationFrame技术的原理和解决的问题。只是机械地把动画性能、掉帧问题甩到这么一个名词上。在真实项目中,也没有亲自实现过,更不要说考虑requestAnimationFrame的兼容性情况了。这里场景我并不会使用rAf,因为。setTimeout的定时器值推荐最小使用16.7ms(原因请去社区上找答案,不再细讲),我们这里并不会超过这个限制,并且考虑兼容性。关于这项技术的使用,如果有问题,欢迎留言讨论。

基于以上,我的解决方案是既不同于Throttle,也不同于Debounce,但是和这两个思想,尤其是Throttle又比较类似:把滚动事件替换为一个带有计时器的滚动处理程序,每100毫秒进行简单检查,看这段时间内用户是否滚动过。如果没有,则什么都不做;如果有,就进行处理。

用户体验优化小窍门

在图像加载完成时,使用淡入(fade in)效果出现。这在实际情况上会稍微慢一下,应该慢一个过渡执行时间。但用户体验上感觉会更快。这是已经被证实且普遍应用的小“trick”。但是据我感觉,它确实有效。我们的代码实现也采用了这个小窍门。不过类似这种“社会心理学”范畴的东西,显然不是本文研究的重点。

总结一下

代码上将会采用:超前阈值的懒加载+DOM Cache和图片Cache+滚动throttle模拟+CSS fadeIn动画。
具体功能封装上和一些实现层面的东西,请您继续阅读。

代码实现

DOM结构

整体结构如下:

    <div class="exp-list-box" id="expListBox">
        <ul class="exp-list" id="expList">
        </ul>
        <div class="ui-refresh-down"></div>
    </div>

主体内容放在id为“expListBox”的container里面,id为“expList”的ul是页面加载内容的容器。
因为每次加载并append进入HTML的内容相对较多。我使用了模版来取代传统的字符串拼接。前端模版这次选用了我的同事颜海镜大神的开源作品,模版结构为:

     <#dataList.forEach(function (v) {#>
        <div id="s-<#=v.eid#>" class="slide">
            <li>
                <a href="<#=v.href#>">
                    <img class="img" src="data:image/gif;base64,R0lGODdhAQABAPAAAP%2F%2F%2FwAAACwAAAAAAQABAEACAkQBADs%3D" 
                    data-src="<#=v.src#>">
                    </img>
                    <strong><#=v.title#></strong>
                    <span class="writer"><#=v.writer#></span>
                    <span class="good-num"><#=v.succNum#></span>
                </a>
            </li>
        </div>
    <#})#>

以上模版内容由每次ajax请求到的数据填充,并添加进入页面,构成每个block-item。
这里需要注意观察,有助于对后面逻辑的理解。页面中一个block-item下div属性存有该block-item的eid值,对应class叫做"slide",子孙节点包含有一个image标签,src初始赋值为1px的空白图进行占位。真实图片资源位置存储在"data-src"中。
另外,请求返回的数据dataList可以理解为由9个对象构成的数组,也就是说,每次请求加载9个block-item。

样式亮点

样式方面不是这篇文章的重点,挑选最核心的一行来说明一下:

    .slide .img{
        display: inline-block;
        width: 90px;
        height: 90px;
        margin: 0 auto;
        opacity: 0;
        -webkit-transition: opacity 0.25s ease-in-out;
        -moz-transition: opacity 0.25s ease-in-out;
        -o-transition: opacity 0.25s ease-in-out;
        transition: opacity 0.25s ease-in-out;
    }

唯一需要注意的是image的opacity设置为0,图片将会在成功请求并渲染后调整为1,辅助transition属性实现一个fade in效果。
对应我们上面所提到的那个“trick”

逻辑部分

我是完全按照业务需求来设计,并没有做抽象。其实这样的一个下拉加载功能完全可以抽象出来。有兴趣的读者可以下去自己进行封装和抽象。
我们先把精力集中在逻辑处理上。
下面进入我们最核心的逻辑部分,为了防止全局污染,我把它放入了一个立即执行函数中:

    (function() {
        var fetching = false; 
        var page = 1;
        var slideCache = [];
        var itemMap = {};
        var lastScrollY = window.pageYOffset;
        var scrollY = window.pageYOffset;
        var innerHeight;
        var topViewPort;
        var bottomViewPort;
        
        function isVisible (id) {
            // ...判断元素是否在可见区域
        }
        
        function updateItemCache (node) {
            // ....更新DOM缓存
        }
        
        function fetchContent () {
            // ...ajax请求数据
        }
        

        function handleDefer () {
            // ...懒加载实现
        }

        function handleScroll (e, force) {
            // ...滚动处理程序
        } 
        
        window.setTimeout(handleScroll, 100);
        fetchContent();
    }());

我认为好的编程习惯是在程序开头部分便声明所有的变量,防止“变量提升”带来的潜在困扰,并且也有利于程序的整体把控。
我们来看一下变量设置:

    // 加载中状态锁
    1)var fetching = false;
    // 用于加载时发送请求参数,表示第几屏内容,初始为1,以后每请求一次,递增1
    2)var page = 1; 
    // 只缓存最新一次下拉数据生成的DOM节点,即需要插入的dom缓存数组
    3)var slideCache = []; 
    // 用于已经生成的DOM节点储存,存有item的offsetTop,offsetHeight
    4) var slideMap = {}; 
    // pageYOffset设置或返回当前页面相对于窗口显示区左上角的Y位置。
    5)var lastScrollY = window.pageYOffset; var scrollY = window.pageYOffset;
    // 浏览器窗口的视口(viewport)高度
    6)var innerHeight;
    // isVisible的上下阈值边界
    7) var topViewPort; 
    8) var bottomViewPort; 

关于DOM cache的变量详细说明,在后文有提供。

同样,我们有5个函数。在上面的代码中,注释已经写明白了每个方法的具体作用。接下来,我们逐个分析。

滚动处理程序handleScroll

它接受两个变量,第二个是一个布尔值force,表示是否强制触发滚动程序执行。

核心思路是:如果时间间隔100毫秒内,没有发生滚动,且并未强制触发,则do nothing,间隔100毫秒之后再次查询,然后直接return。
其中,是否发生滚动由lastScrollY === window.scrollY来判断。
在100毫秒之内发生滚动或者强制触发时,需要判断是否滚动已接近页面底部。如果是,则拉取数据,调用fetchContent方法,并调用懒加载方法handleDefer。
并且在这个处理程序中,我们计算出来了isVisible区域的上下阈值。我们使用600作为浮动区间,这么做的目的是在一定范围内提前加载图片,节省用户等待时间。当然,如果我们进行抽象时,可以把这个值进行参数化。

    function handleScroll (e, force) {
        // 如果时间间隔内,没有发生滚动,且并未强制触发加载,则do nothing,再次间隔100毫秒之后查询
        if (!force && lastScrollY === window.scrollY) {
            window.setTimeout(handleScroll, 100);
            return;
        }
        else {
            // 更新文档滚动位置
            lastScrollY = window.scrollY;
        }
        scrollY = window.scrollY;
        // 浏览器窗口的视口(viewport)高度赋值
        innerHeight = window.innerHeight;
        // 计算isVisible上下阈值
        topViewPort = scrollY - 1000;
        bottomViewPort = scrollY + innerHeight + 600;

        // 判断是否需要加载
        // document.body.offsetHeight;返回当前网页高度 
        if (window.scrollY + innerHeight + 200 > document.body.offsetHeight) {
            fetchContent();
        }
        // 实现懒加载
        handleDefer();
        window.setTimeout(handleScroll, 100);
    } 

拉取数据

这里我用到了自己封装的ajax接口方法,它基于zepto的ajax方法,只不过又手动采用了promise包装一层。实现比较简单,当然有兴趣可以找我要一下代码,这里不再详细说了。
我们使用前端模版进行HTML渲染,同时调用updateItemCache,将此次数据拉取生成的DOM节点缓存。之后手动触发handleScroll,更新文档滚动位置和懒加载处理。

    function fetchContent () {
        // 设置加载状态锁
        if (fetching) {
            return;
        }
        else {
            fetching = true;
        }
        ajax({
            url: (!location.pathname.indexOf('/m/') ? '/m' : '')
                + '/list/asyn?page=' + page + (+new Date),
            timeout: 300000,
            dataType: 'json'
        }).then(function (data) {
            if (data.errno) {
                return;
            }
            console.time('render');

            var dataList = data.data.list;
            var len = dataList.length;
            var ulContainer = document.getElementById('expList');
            var str = '';
            var frag = document.createElement('div');

            var tpl = __inline('content.tmpl');
            for (var i = 0; i < len; i++) {
                str = tpl({dataList: dataList});
            }
            frag.innerHTML = str;
            ulContainer.appendChild(frag);
            // 更新缓存
            updateItemCache(frag);
            // 已经拉去完毕,设置标识为true
            fetching = false;
            // 强制触发
            handleScroll(null, true);
            page++;
            console.timeEnd('render');
        }, function (xhr, type) {
            console.log('Refresh:Ajax Error!');
        });
    }

缓存对象

之前参数里提到过,一共有两个用于缓存的对象/数组:

1)slideCache:缓存最近一次加载过的数据生成的DOM内容,缓存方式为数组储存:

    slideCache = [
        {
            id: "s-97r45",
            img: img DOM节点,
            node: 父容器DOM node,类似<div id="s-<#=v.eid#>" class="slide"></div>,
            src: 图片资源地址
        },
        ...
    ]

slideCache由updateItemCache函数更新,主要用于懒加载时的赋值src。这样我们做到“只写入DOM”原则,不需要再从DOM读取。

2)slideMap:缓存DOM节点的高度和offsetTop,以DOM节点的id为索引。存储方式:

    slideMap = {
        s-97r45: {
            node: DOM node,类似<div id="s-<#=v.eid#>" class="slide"></div>,
            offTop: 300,
            offsetHeight: 90
        }
    }

slideMap根据isVisible方法的参数进行更新和读取。使得我们在判断是否isVisible时,大量减少读取DOM的操作。

懒加载程序

在上面的滚动处理程序中,我们调用了handleDefer函数。我们看一下这个函数的实现:

    function handleDefer () {
        // 时间记录
        console.time('defer');

        // 获取dom缓存
        var list = slideCache;
        // 对于遍历list里的每一项,都使用一个变量,而不是在循环内部声明。节省内存,把性能高效,做到极致。
        var thisImg;

        for (var i = 0, len = list.length; i < len; i++) {
            thisImg = list[i].img; // 这里我们都是从内存中读取,而不用读取DOM节点
            var deferSrc = list[i].src; // 这里我们都是从内存中读取,而不用读取DOM节点
            // 判断元素是否可见
            if (isVisible(list[i].id)) {
                // 这个函数是图片onload逻辑
                var handler = function () {
                    var node = thisImg;
                    var src = deferSrc;
                    // 创建一个闭包
                    return function () {
                        node.src = src;
                        node.style.opacity = 1;
                    }
                }
                var img = new Image();
                img.onload = handler();
                img.src = list[i].src;
            }
        }
        console.timeEnd('defer');
    }

主要思路就是对DOM缓存中的每一项进行循环遍历。在循环中,判断每一项是否已经进入isVisible区域。如果进入isVisible区域,则对当前项进行真实src赋值,并设置opacity为1。

更新拉取数据生成的DOM缓存

针对每一个slide类,我们缓存对应DOM节、id、子元素img DOM节点:

    function updateItemCache (node) {
        var list = node.querySelectorAll('.slide');
        var len = list.length;
        slideCache = [];
        var obj;

        for (var i=0; i < len; i++) {
            obj = {
                node: list[i],
                id: list[i].getAttribute('id'),
                img: list[i].querySelector('.img')
            }
            obj.src = obj.img.getAttribute('data-src');
            slideCache.push(obj);
        };
    }

是否在isVisible区域判断

该函数接受相应DOM id,并进行判断。
如果判断条件晦涩难懂的话,你一定要手动画画图理解一下。如果你就是懒得画图,那么也没关系,我帮你画好了,只是丑一些。。。

    function isVisible (id) {
        var offTop;
        var offsetHeight;
        var data;
        var node;

        // 判断此元素是否已经懒加载正确渲染,分为在屏幕之上(已经懒加载完毕)和屏幕外,已经添加到dom中,但是还未请求图片(懒加载之前)
        if (itemMap[id]) {
            // 直接获取offTop,offsetHeight值
            offTop = itemMap[id].offTop;
            offsetHeight = itemMap[id].offsetHeight;
        }
        else {
            // 设置该节点,并且设置节点属性:node,offTop,offsetHeight
            node = document.getElementById(id);
            // offsetHeight是自身元素的高度
            offsetHeight = parseInt(node.offsetHeight);
            // 元素的上外缘距离最近采用定位父元素内壁的距离
            offTop = parseInt(node.offsetTop);
        }

        if (offTop + offsetHeight > topViewPort && offTop < bottomViewPort) {
            return true;
        }
        else {
            return false;
        }
    }

手绘图示

性能收益

如上代码,我们主要进行了两方面的性能考量:

1)延迟加载时间

2)渲染DOM时间

整体收益如下:

优化前延迟平均值:49.2ms 中间值:43ms;

优化后延迟平均值:17.1ms 中间值:11ms;

优化前渲染平均值:2129.6ms 中间值:2153.5ms;

优化后渲染平均值:120.5ms 中间值:86ms;

继续思考

做完这些,其实也远远没有达到所谓的“极致化”性能体验。我们无非就做了各种DOM缓存、映射、懒加载。如果继续分析edge case,我们还能做的更多,比如:DOM回收、墓碑和滚动锚定。这些其实很多都是借鉴客户端开发理念,但是超前的谷歌开发者团队也都有了自己的实现。比如在去年7月份的
一篇文章:Complexities of an Infinite Scroller就都有所提及。这里从原理(非代码)层面,也给大家做个介绍。

DOM回收

它的原理是,对于需要产生的大量DOM节点(比如我们下拉加载的信息内容)不是主动用createElement的方式创建,而是回收利用那些已经移出视窗,暂时不会被需要的DOM节点。如图:

动图(盗图)

虽然DOM节点本身并非耗能大户,但是也不是一点都不消耗性能,每一个节点都会增加一些额外的内存、布局、样式和绘制。同样需要注意的一点是,在一个较大的DOM中每一次重新布局或重新应用样式(在节点上增加或删除样式所触发的过程)的系统开销都会比较昂贵。所以进行DOM回收意味着我们会保持DOM节点在一个比较低的数量上,进而加快上面提到的这些处理过程。

据我观察,在真正产品线上使用这项技术的还比较少。可能是因为实现复杂度和收益比并不很高。但是,淘宝移动端检索页面实现了类似的思想。如下图,

淘宝做法

每加载一次数据,就生成“.page-container .J-PageContainer_页数”的div,在滚动多屏之后,早已移除视窗的div的子节点进行了remove(),并且为了保证滚动条的正确比例和防止高度塌陷,显示声明了2956px的高度。

墓碑(Tombstones)

如之前所说,如果网络延迟较大,用户又飞快地滚动,很容易就把我们渲染的DOM节点都甩在千里之外。这样就会出现极差的用户体验。针对这种情况,我们就需要一个墓碑条目占位在对应位置。等到数据取到之后,再代替墓碑。墓碑也可以有一个独立的DOM元素池。并且也可以设计出一些漂亮的过渡。这种技术在国外的一些“引领技术潮流”的网站上,早已经有了应有。比如下图取自Facebook:

Facebook墓碑

我在“简书”APP客户端上,也见过类似的方案。当然,人家是native...

简书客户端

滚动锚定

滚动锚定的触发时机有两个:一个是墓碑被替换时,另一个是窗口大小发生改变时(在设备发生翻转时也会发生)。这两种情况,都需要调整对应的滚动位置。

总结

当你想提供一个高性能的有良好用户体验的功能时,可能技术上一个简单的问题,就会演变成复杂问题的。这篇文章便是一个例证。
随着 “Progressive Web Apps” 逐渐成为移动设备的一等公民(会吗?),高性能的良好体验会变得越来越重要。
开发者也必须持续的研究使用一些模式来应对性能约束。这些设计的基础当然都是成熟的技术为根本。

这篇文章参考了Flicker工程师,前YAHOO工程师Stephen Woods的《Building Touch Interfaces with HTML5》一书。以及王芃前辈对于《Complexities of an Infinite Scroller》一文的部分翻译。


lucas_580e331d326b4
1.5k 声望207 粉丝

《React 状态管理与同构实战》作者