在一个多人共享的文件夹内, 创建文件夹/文件, 名字重复加数字后缀有没有好的算法

比如: 已经有了一个文件夹叫"照片"

那么在多人共同操作的时候, 同时建立 文件夹也叫"照片", 如何兼顾并发与性能, 让不同人建立的照片文件夹变为 照片(1) 照片(2), 按照并发顺序累加

同时最重要的一点是

当存在照片(1), 照片(2),照片(3), 照片(4), 照片(5) , 当我删除了照片(3), 那么再建立"照片"的时候, 应该还叫 照片(3), 而不应该叫 照片(6), 即永远要保持一条龙的状态

我看了百度网盘就是这个逻辑, 有没有好的思路, 已有的文件夹信息都是存在mysql中的, 如果一次一次差效率太低了, 虽说这个功能不是很常见, 不过也希望有个较为合理的方案

阅读 5k
4 个回答

使用Redis的Bitmap很适合解决这个问题,以“照片”为例

  1. "照片"为key建立bitmap,值为1的bit代表已经使用(也不用建立,直接查询就可以)

  2. 查找最左为0的bit的索引:bitpos "照片" 0

  3. 找到的索引就是最小的数字空位

注意:如果多服务器、多线程并发,则可以考虑使用Redis实现的分布式锁,又或者使用watch命令
伪代码如下

if ('OK'.equals(redis.setnx("照片.lock")) {
    pos = redis.bitpos("照片", 0);
    redis.setbit("照片", pos, 1);
    return pos;
}

hash表以文件名做key,自从生成一个[1..MaxNum]的有序List,MaxNum取一个你认为合理的数字。同步hash表。
每次创建文件时查询hash表有没有该key,有就list.pop第一值。
每次删文件时,把文件()里的数字push回list
hash表控制大小,超的数据可以存储在文件系统【数据库等】,每次查询hash找不到数据时,需要去文件系统查找调用。类似内存分页缓存机制。

import os

def make_dir(filename,i=1):
    fullname = '%s (%s)' % (filename,i)

    if not os.path.exists(filename):
        os.mkdir(filename)
        return filename

    if os.path.exists(fullname):
        i += 1
        return make_dir(filename,i)
    else:
        os.mkdir(fullname)
        return fullname

for i in range(3):
    print(make_dir('照片'))

最简单的一种想法就是维护两组数据
伪代码

removeNameArray = {};
NameArrayLen = 0;
if(removeNameArray.length>0){
    name = removeNameArray.pop();
}else{
    name = name+(NameArrayLen++);
}
推荐问题