Snowflake演算法
05-13
Snowflake演算法是Twitter發明的一種演算法,用於在分散式的高並發環境中,生成64位自增ID。這種演算法產生的背景是,Twitter每秒鐘能產生上萬條信息,對演算法的要求是:
- 長度固定,不能太長。
- id要能遞增(方便客戶端排序)
- 在分散式環境中不能重複。
41位時間戳(精確到毫秒),可以用到2082年。
1位機器id可以表示1024台機器。機器級的話你可以使用MAC地址來唯一標示工作機器,工作進程級可以使用IP+Path來區分工作進程。也可以用oracle的sequence或者Mysql的auto_increment。
12位序列號表示每毫秒能產生4096個ID,如果超過此範圍,需要等到下一個毫秒。
現在對比一下其他演算法:
1)資料庫自增ID
大表不能做水平分表
2)時間戳+隨機數
這種演算法不能遞增,可能重複問題,需要查詢是否有過相同ID。
3)時間戳 + 用戶ID
這種演算法會透露用戶信息
4)GUID/UUID
太長,且無序。
參考資料:
Twitter-Snowflake,64位自增ID演算法詳解 - 漫漫路
高並發環境下生成訂單唯一流水號方法:SnowFlake |
推薦閱讀:
※九章演算法 | Snapchat 面試題 : Palindrome Data Stream
※從上到下列印二叉樹
※七本書籍帶你打下機器學習和數據科學的數學基礎
※Leetcodes Solutions 6 ZigZag Conversion
※Leetcodes Solutions 17 Letter Combinations of a Phone Number