標籤:

Linux 中的「大內存頁」(hugepage)是個什麼?

學習 Linux 中的 大內存頁(hugepage)。理解什麼是「大內存頁」,如何進行配置,如何查看當前狀態以及如何禁用它。

本文中我們會詳細介紹 大內存頁(huge page),讓你能夠回答:Linux 中的「大內存頁」是什麼?在 RHEL6、RHEL7、Ubuntu 等 Linux 中,如何啟用/禁用「大內存頁」?如何查看「大內存頁」的當前值?

首先讓我們從「大內存頁」的基礎知識開始講起。

Linux 中的「大內存頁」是個什麼玩意?

「大內存頁」有助於 Linux 系統進行虛擬內存管理。顧名思義,除了標準的 4KB 大小的頁面外,它們還能幫助管理內存中的巨大的頁面。使用「大內存頁」,你最大可以定義 1GB 的頁面大小。

在系統啟動期間,你能用「大內存頁」為應用程序預留一部分內存。這部分內存,即被「大內存頁」佔用的這些存儲器永遠不會被交換出內存。它會一直保留其中,除非你修改了配置。這會極大地提高像 Oracle 資料庫這樣的需要海量內存的應用程序的性能。

為什麼使用「大內存頁」?

在虛擬內存管理中,內核維護一個將虛擬內存地址映射到物理地址的表,對於每個頁面操作,內核都需要載入相關的映射。如果你的內存頁很小,那麼你需要載入的頁就會很多,導致內核會載入更多的映射表。而這會降低性能。

使用「大內存頁」,意味著所需要的頁變少了。從而大大減少由內核載入的映射表的數量。這提高了內核級別的性能最終有利於應用程序的性能。

簡而言之,通過啟用「大內存頁」,系統具只需要處理較少的頁面映射表,從而減少訪問/維護它們的開銷!

如何配置「大內存頁」?

運行下面命令來查看當前「大內存頁」的詳細內容。

root@kerneltalks # grep Huge /proc/meminfoAnonHugePages: 0 kBHugePages_Total: 0HugePages_Free: 0HugePages_Rsvd: 0HugePages_Surp: 0Hugepagesize: 2048 kB

從上面輸出可以看到,每個頁的大小為 2MB(Hugepagesize),並且系統中目前有 0 個「大內存頁」(HugePages_Total)。這裡「大內存頁」的大小可以從 2MB 增加到 1GB

運行下面的腳本可以知道系統當前需要多少個巨大頁。該腳本取之於 Oracle。

#!/bin/bash## hugepages_settings.sh## Linux bash script to compute values for the# recommended HugePages/HugeTLB configuration## Note: This script does calculation for all shared memory# segments available when the script is run, no matter it# is an Oracle RDBMS shared memory segment or not.# Check for the kernel versionKERN=`uname -r | awk -F. { printf("%d.%d
",$1,$2); }`# Find out the HugePage sizeHPG_SZ=`grep Hugepagesize /proc/meminfo | awk {print $2}`# Start from 1 pages to be on the safe side and guarantee 1 free HugePageNUM_PG=1# Cumulative number of pages required to handle the running shared memory segmentsfor SEG_BYTES in `ipcs -m | awk {print $5} | grep "[0-9][0-9]*"`do MIN_PG=`echo "$SEG_BYTES/($HPG_SZ*1024)" | bc -q` if [ $MIN_PG -gt 0 ]; then NUM_PG=`echo "$NUM_PG+$MIN_PG+1" | bc -q` fidone# Finish with resultscase $KERN in 2.4) HUGETLB_POOL=`echo "$NUM_PG*$HPG_SZ/1024" | bc -q`; echo "Recommended setting: vm.hugetlb_pool = $HUGETLB_POOL" ;; 2.6 | 3.8 | 3.10 | 4.1 ) echo "Recommended setting: vm.nr_hugepages = $NUM_PG" ;; *) echo "Unrecognized kernel version $KERN. Exiting." ;;esac# End

將它以 hugepages_settings.sh 為名保存到 /tmp 中,然後運行之:

root@kerneltalks # sh /tmp/hugepages_settings.shRecommended setting: vm.nr_hugepages = 124

你的輸出類似如上結果,只是數字會有一些出入。

這意味著,你系統需要 124 個每個 2MB 的「大內存頁」!若你設置頁面大小為 4MB,則結果就變成了 62。你明白了吧?

配置內核中的「大內存頁」

本文最後一部分內容是配置上面提到的 內核參數 ,然後重新載入。將下面內容添加到 /etc/sysctl.conf 中,然後輸入 sysctl -p 命令重新載入配置。

vm.nr_hugepages=126

注意我們這裡多加了兩個額外的頁,因為我們希望在實際需要的頁面數量之外多一些額外的空閑頁。

現在,內核已經配置好了,但是要讓應用能夠使用這些「大內存頁」還需要提高內存的使用閥值。新的內存閥值應該為 126 個頁 x 每個頁 2 MB = 252 MB,也就是 258048 KB。

你需要編輯 /etc/security/limits.conf 中的如下配置:

soft memlock 258048hard memlock 258048

某些情況下,這些設置是在指定應用的文件中配置的,比如 Oracle DB 就是在 /etc/security/limits.d/99-grid-oracle-limits.conf 中配置的。

這就完成了!你可能還需要重啟應用來讓應用來使用這些新的巨大頁。

(LCTT 譯註:此外原文有誤,「透明大內存頁」和「大內存頁」不同,而且,在 Redhat 系統中,「大內存頁」 不是默認啟用的,而「透明大內存頁」是啟用的。因此這個段落刪除了。)


via: kerneltalks.com/service

作者:Shrikant Lavhate 譯者:lujun9972 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


推薦閱讀:

從C++的RAII理解智能指針的思路(一)
Windows內存管理分析(一)
九. 內核的內存分配
從C++的RAII理解智能指針的思路(二)

TAG:內存管理 |