Node+H5实现大文件分片上传(有源码)

26

话前

上传大文件上传的教程网上很多, 但是大部分没给出一个比较完整的出来, 这个博客给出的是前后端一套完整的解决方案, 其中前端没有使用第三方上传库, 希望能帮到有同样需求的朋友们.

大文件分片上传的好处在这里就不用多说了, 之前不管是上传单文件还是分片文件上传都是依靠Flash来实现, 现在H5能原生支持, 而且性能要比Flash高很多, 所以正好公司的一个需求就是要分片上传, 借机分享给大家

分片上传的思路如下:

  • 第一步:先对文件进行MD5的加密, 这样有两个好处, 即可以对文件进行唯一的标识, 为秒传做准备, 也可以为后台进行文件完整性的校验进行比对

  • 第二步:拿到MD5值以后, 要查询一下, 这个文件是否已经上传过了, 如果上传过了, 就不用再次重复上传, 也就是能够秒传, 网盘里的秒传, 原理也是一样的

  • 第三步:对文件进行切片, 假如文件是500M, 一个切片大小我们定义为50M, 那么整个文件就为分为100次上传

  • 第四步:向后台请求一个接口, 接口里面的数据是该文件已经上传过的文件块, 为什么要有这个请求呢? 我们经常用网盘, 网盘里面有续传的功能, 一个文件传到一半, 由于各种原因, 不想再传了, 那么再次上传的时候, 服务器应该保留我之前上传过的文件块, 跳过这些已经上传过的块, 再次上传其他文件块, 当然续传方案有很多, 目前来看, 单独发一次请求, 这样效率最高

  • 第五步:开始对未上传过的块进行POST上传

  • 第六步:当上传成功后, 通知服务器进行文件的合并, 至此, 上传完成!

为了直观起见, 我画了一个流程图

图片描述

最终前端的效果图

图片描述

后端的最终文件目录结构

clipboard.png

下面我们说下主要的代码

  • GIF图里的校验文件就是对文件进行MD5+拿这个MD5值, 看下文件是否已经上传

    • 对文件的MD5小文件还好, 大文件的话会比较慢, 经我测试, 4G的文件, MD5的时间大约在2分钟

    • 对文件进行MD5, 我们使用的是spark-md5, 因为这步是浏览器来做, 所以需要引入这个js

    • 因为MD5的大文件时间比较长, 所以要和GIF图一样, 做成带进度的, 这样就需要把文件进行分片的MD5, spark也支持这种方式, 最终的MD5值为spark.end()

    • 和服务器校验文件的ajax请求, 需要传递文件名称和文件的MD5值

    • clipboard.png

    • Node端会处理两件事件, 1.看文件是否存在 2.文件不存在, 返回已上传文件块的list, 文件没上传过, 则list为空

    • clipboard.png

    • 下面我们会对文件进行切片处理(File的API提供slice操作), 序号0-n, (服务器存储的文件形式也是MD5作为文件夹名, 0-n为文件名, 如上面那张服务器结果所示), 然后循环每个分片, 和上面的服务器返回的List做比对, 未在List上的文件进行上传

    • 前端代码:
      clipboard.png

    • node端代码
      clipboard.pngclipboard.png

    • 最后一步, 当所有文件都上传完成, 告知Node端合并文件

    • 前端代码
      clipboard.png

    • Node端代码
      clipboard.png

最后上源码: 点击跳转GitHUb

你可能感兴趣的

18 条评论
猪猪 · 2018-01-02

您好,您的源码demo我有试过,但是会发现,我上传的是图片,最后合并后的在uploads文件夹下,合并后的文件是空白的,而且格式变成了txt文本格式,请问这是为什么呢?谢谢。

回复

0

已看到issues, 忙完这阵子再处理你提出的问题

会说话的鱼 作者 · 2018-01-03
0

修复了没有 老板

原乡 · 2018-01-09
0

各位老板, 车已修好, 记得star

会说话的鱼 作者 · 2018-01-09
Small_pure · 2018-09-23

放到服务器上面上面上传很慢啊,切片已经小到1M了,

回复

0

这个要根据你服务器的带宽和io读写能力的大小

彭小呆 · 7月19日
Small_pure · 2018-10-01

兄弟,为毛上传的视频,,文件会有损坏,播放到一半就卡住了,,

回复

0

我解决了这个损坏的问题

彭小呆 · 7月19日
panda1992 · 2018-10-15

+1有些视频有损坏

回复

0

我解决了视频损坏的问题

彭小呆 · 7月19日
0

原因是因为切完片上传的时候,在服务器合并文件操作的时候,读取的分片顺序乱了,比如正确顺序是0-9,但是变成了 0 2 1 3 4 5 6 7 8 9 这样 组装的文件大小是没变的,但是数据结构发生了变化,所以需要调整好这个分片list的顺序,然后组装文件,这样文件就没问题了。在合并文件的函数里,在
let fileArr = await listDir(srcDir)这句下面加一句

fileArr.sort((x,y) => {
    return x-y;
})

这样就ok了。

彭小呆 · 7月19日
海龍 · 2018-12-18

是不是应该多个对每个文件进行md5检测的过程

回复

中过 · 5月24日

楼主,如果用axios需要注意什么

回复

饭等米 · 6月3日

貌似zip格式的上传之后打不开

回复

0

要关闭服务,不然显示文件被占用,是因为进程还在

彭小呆 · 7月19日
彭小呆 · 7月19日

1.合并文件函数需要修改如下
let fileArr = await listDir(srcDir)这句下面加一句

fileArr.sort((x,y) => {
    return x-y;
})

2.需要在组装完文件后,对新的文件进行md5加密去验证文件的完整性,防止文件损坏。在前端和后端用同样的加密算法去验证。

回复

sharpor · 9月23日

这个方案,比对过直接上传么?速度会更快么?

回复

0

会,多块同时上传,还能断点续传

会说话的鱼 作者 · 9月29日
载入中...