自己常用的C/C++小技巧[3]

01-10

自己常用的小技巧

本文github備份地址

這裡列出了自己常用的一些c/c++小技巧, 有些會有不足, 可以簡單探討一下.

顏色混合

分類: 小技巧

有一個可能很常用的操作, 或者說函數: 平均數. 通過基礎數學我們可以知道(a+b)/2, 如果用c中無符號整型表示:

uint32_t avg(uint32_t a, uint32_t b) { return (a+b)/2; }

一般情況下沒問題, 但是在兩個數足夠大時可能會產生溢出, 由於乘法分配律可知, 我們可以實現為:

uint32_t avg(uint32_t a, uint32_t b) { return a/2 + b/2; }

但是我們操作的是無符號整型, 兩個奇數一操作最低位就被忽略了, 所以我們可以利用位操作, 再加上除以2可以化作右移一位, 我們可以實現為:

uint32_t avg(uint32_t a, uint32_t b) { return (a>>1) + (b>>1) + (a&b&1); }

現在我們可以推廣至顏色上, 我們現在常用的是R8G8B8X8格式, X表示忽略或者表示不透明度. 如果現在我們規定低到高位分別是RGB, 最高8位忽略, 並假設為0:

#define R8G8B8_MASK_HI ((uint32_t)0x00FEFEFE) #define R8G8B8_MASK_LO ((uint32_t)0x00010101)

uint32_t avg_r8g8b8(uint32_t a, uint32_t b) { return ((a&R8G8B8_MASK_HI)>>1) + ((b&R8G8B8_MASK_HI)>>1) + (a&b&R8G8B8_MASK_LO); }

再推廣一下, 以後我們可能覺得24bit顏色太辣雞, 推廣到30bit. 我們現在使用R10G10B10X2格式, 這個就可以修改為:

#define R10G10B10_MASK_HI ((uint32_t)0x3FEFFBFE) #define R10G10B10_MASK_LO ((uint32_t)0x00100401)

uint32_t avg_r10g10b10(uint32_t a, uint32_t b) { return ((a&R10G10B10_MASK_HI) >> 1) + ((b&R8G8B8_MASK_HI) >> 1) + (a&b&R8G8B8_MASK_LO); }

不過實際上主要是不透明度的原因, 這個方法在用於包含Alpha信息的顏色時, 會由於Alpha權重問題出現問題. 這個問題引申出一個"預乘Alpha"的概念, 自己被這個東西坑過, 真是記憶猶新。

合併申請

分類: 優化技巧

這個技巧很簡單, 將多次內存申請合併到一次, 優點為:

提高效率, 內存申請一般來說是比較耗時的操作, 合併後效率提升是很自然的
減少邏輯分支, 如果需要申請兩塊內存, 錯誤路徑會有三個, 其中兩個特殊路徑還要去釋放已經申請的內存. 合併後錯誤路徑就只有一個.

void fx0(void) { void* a = malloc(100); void* b = malloc(200); if (a && b) { // XXXXX } // 雖然free接受空指針, 實際上可能會有類似析構的操作, 還是需要判斷 if (a) free(a); if (b) free(b); } void fx1(void) { void* a = malloc(100); if (a) { void* b = malloc(200); if (b) { // XXXXXXXXXXXXXX free(b); } free(a); } } void gx(void) { void* a = malloc(300); if (a) { void* b = (char*)a + 100; // XXXXXXXXXXXXXX free(a); } }

缺點, 不適合處理大空間申請, 比如申請兩個250MB的內存最好分別申請, 不然地址空間上可能找不到500MB連續空間, 但是能找到兩個250MB的連續空間.

還有一個小缺點就是, 現在的運行庫配合IDE能夠在越界後進行報錯. 假如合併, 前者越界會寫入下一段空間, 這個非常危險, 並且比較難調試(所以越界檢測是非常重要的, 建議使用大量的斷言進行處理).

雖然這個技巧很簡單, 但是實際上需要直接申請兩個獨立部分可能比較少見, 常見是"隱式"地多次申請:

struct A { B* b = new(std::nothrow) B; C* c = new(std::nothrow) C; };


struct D {

    B*  b = new(std::nothrow) B;

};

int main() { A a; delete(new(std::nothrow) D); }

這裡列舉兩種情況, A情況就是上述比較明顯的, 擁有兩次顯式的new, 而D的情況則是隱式的兩次. 有一點就是我們可以通過replacement new和直接調用析構函數進行內存的再利用, 但是非常注意的是內存對齊的情況, c++目前並沒有將c11的aligned_alloc納入標準(即便納入按照微軟的脾氣還是不可能在VS上實現, 主要是允許free掉aligned_alloc的), 申請對齊的內存需要自己處理又無形地增加了複雜度(好在一般按照8位元組對齊就行, 除了特殊要求).

有時會我們會經常的使用"懸浮"狀態的對象, 就像D這種, 完全手動控制生命周期的, 其中隱含的多次申請依然可以合併, 只需要找准偏移量即可.

柔性數組, 或者說零長數組(Zero-Length Array) 其實就是這個的一個體現:

struct array_t { size_t length; char data[0]; };

其中類c++擴展是[0], c99標準是[]. c++中, 有時候為了避免兼容問題, 會不寫成員變數, 取而代之的是成員函數:

struct array_t { size_t length; char* data() { return reinterpret_cast<char*>(this+1) } };

數組多態

分類: 內部優化

數組一般來說就是儲存同一類型的數據, 如果需要多態, 又要保持隨機訪問可能的就是儲存指針數組. 不過內部使用或者強制規定的話, 我們可以規定一個上限, 各個類型的較大值.

enum : size_t { THIS_MAX_SIZE = 256, THIS_MAX_COUNT = 16 };

class Factory { template<typename T> T* get_at(size_t i) { assert(i < m_count && "out of range"); return reinterpret_cast<T*>(m_buffer + THIS_MAX_SIZE * i); } size_t m_count; uint8_t m_buffer[THIS_MAX_SIZE*THIS_MAX_COUNT]; };

類似這樣, 其實就是上一條: 合併申請. 然後手動控制對象構造(replacement new)與析構(調用析構函數), 對於"內部優化"來說, 是允許的.