尽可能短的生成的唯一 ID

新手上路,请多包涵

所以我们可以 str(uuid.uuid4()) 生成一个唯一的 id ,它有 36 个字符长。

是否有另一种方法可以生成字符数更短的唯一 ID?

编辑:

  • 如果 ID 可以用作主键,那就更好了
  • 粒度应优于1ms
  • 此代码可以分发,因此我们不能假设时间独立。

原文由 Roman 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 1.9k
2 个回答

如果这是用作数据库中的主键字段,请考虑只使用自动递增整数。

str(uuid.uuid4()) 是 36 个字符,但其中有四个无用的破折号( - ),并且仅限于 0-9 af。

更好的 uuid4 32 个字符:

 >>> uuid.uuid4().hex
'b327fc1b6a2343e48af311343fc3f5a8'

或者只是 b64 编码和切片一些 urandom 字节(由你来保证唯一性):

 >>> base64.b64encode(os.urandom(32))[:8]
b'iR4hZqs9'

原文由 wim 发布,翻译遵循 CC BY-SA 4.0 许可协议

TLDR

大多数情况下,最好在内部处理数字并在外部将它们编码为短 ID。所以这是一个用于 Python3、PowerShell 和 VBA 的函数,它将 int32 转换为字母数字 ID。像这样使用它:

 int32_to_id(225204568)
'F2AXP8'

对于分布式代码使用 ULID: https ://github.com/mdipierro/ulid

它们更长,但在不同的机器上是独一无二的。

ID有多短?

它将用 6 个字符对大约 50 亿个 ID 进行编码,因此它尽可能紧凑,同时仍然只使用 无歧义的数字和字母

如何获得更短的 ID?

如果您想要更紧凑的 ID/代码/序列号,只需更改 chars="..." 定义即可轻松扩展字符集。例如,如果您允许所有大小写字母,您可以在相同的 6 个字符中拥有 560 亿个 ID。添加一些符号(例如 ~!@#$%^&*()_+-= )可以得到 2080 亿个 ID。

那么你为什么不选择尽可能短的 ID 呢?

我在我的代码中使用的字符集有一个优势:它生成的 ID 易于复制粘贴(没有符号,因此双击选择整个 ID),易于阅读而不会出错(没有相似的字符,如 2Z )并且很容易口头交流(只有大写字母)。只使用数字是口头交流的最佳选择,但它们并不紧凑。

我确信:给我看代码

蟒蛇3

 def int32_to_id(n):
  if n==0: return "0"
  chars="0123456789ACEFHJKLMNPRTUVWXY"
  length=len(chars)
  result=""
  remain=n
  while remain>0:
    pos = remain % length
    remain = remain // length
    result = chars[pos] + result
  return result


电源外壳

function int32_to_id($n){
   $chars="0123456789ACEFHJKLMNPRTUVWXY"
   $length=$chars.length
   $result=""; $remain=[int]$n
   do {
      $pos = $remain % $length
      $remain = [int][Math]::Floor($remain / $length)
      $result = $chars[$pos] + $result
   } while ($remain -gt 0)
   $result
}

VBA

 Function int32_to_id(n)
    Dim chars$, length, result$, remain, pos
    If n = 0 Then int32_to_id = "0": Exit Function
    chars$ = "0123456789ACEFHJKLMNPRTUVWXY"
    length = Len(chars$)
    result$ = ""
    remain = n
    Do While (remain > 0)
        pos = remain Mod length
        remain = Int(remain / length)
        result$ = Mid(chars$, pos + 1, 1) + result$
    Loop
    int32_to_id = result
End Function

Function id_to_int32(id$)
    Dim chars$, length, result, remain, pos, value, power
    chars$ = "0123456789ACEFHJKLMNPRTUVWXY"
    length = Len(chars$)
    result = 0
    power = 1
    For pos = Len(id$) To 1 Step -1
        result = result + (InStr(chars$, Mid(id$, pos, 1)) - 1) * power
        power = power * length
    Next
    id_to_int32 = result
End Function

Public Sub test_id_to_int32()
    Dim i
    For i = 0 To 28 ^ 3
        If id_to_int32(int32_to_id(i)) <> i Then Debug.Print "Error, i=", i, "int32_to_id(i)", int32_to_id(i), "id_to_int32('" & int32_to_id(i) & "')", id_to_int32(int32_to_id(i))
    Next
    Debug.Print "Done testing"
End Sub


原文由 ndemou 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题