Snowflake演算法

Snowflake演算法是Twitter發明的一種演算法,用於在分散式的高並發環境中,生成64位自增ID。這種演算法產生的背景是,Twitter每秒鐘能產生上萬條信息,對演算法的要求是:

  1. 長度固定,不能太長。
  2. id要能遞增(方便客戶端排序)
  3. 在分散式環境中不能重複。

41位時間戳(精確到毫秒),可以用到2082年。

1位機器id可以表示1024台機器。機器級的話你可以使用MAC地址來唯一標示工作機器,工作進程級可以使用IP+Path來區分工作進程。也可以用oracle的sequence或者Mysql的auto_increment。

12位序列號表示每毫秒能產生4096個ID,如果超過此範圍,需要等到下一個毫秒。

現在對比一下其他演算法:

1)資料庫自增ID

大表不能做水平分表

2)時間戳+隨機數

這種演算法不能遞增,可能重複問題,需要查詢是否有過相同ID。

3)時間戳 + 用戶ID

這種演算法會透露用戶信息

4)GUID/UUID

太長,且無序。

參考資料:

Twitter-Snowflake,64位自增ID演算法詳解 - 漫漫路

高並發環境下生成訂單唯一流水號方法:SnowFlake |

推薦閱讀:

九章演算法 | Snapchat 面試題 : Palindrome Data Stream
從上到下列印二叉樹
七本書籍帶你打下機器學習和數據科學的數學基礎
Leetcodes Solutions 6 ZigZag Conversion
Leetcodes Solutions 17 Letter Combinations of a Phone Number

TAG:演算法 | 分散式系統 |