1 .. include:: ../disclaimer-zh_CN.rst 1 .. include:: ../disclaimer-zh_CN.rst 2 2 3 :Original: Documentation/mm/ksm.rst 3 :Original: Documentation/mm/ksm.rst 4 4 5 :翻译: 5 :翻译: 6 6 7 徐鑫 xu xin <xu.xin16@zte.com.cn> 7 徐鑫 xu xin <xu.xin16@zte.com.cn> 8 8 9 ============ 9 ============ 10 内核同页合并 10 内核同页合并 11 ============ 11 ============ 12 12 13 KSM 是一种节省内存的数据去重功能 13 KSM 是一种节省内存的数据去重功能,由CONFIG_KSM=y启用,并在2.6.32版本时被添加 14 到Linux内核。详见 ``mm/ksm.c`` 的实现 14 到Linux内核。详见 ``mm/ksm.c`` 的实现,以及http://lwn.net/Articles/306704和 15 https://lwn.net/Articles/330589 15 https://lwn.net/Articles/330589 16 16 17 KSM的用户空间的接口在Documentation/tr 17 KSM的用户空间的接口在Documentation/translations/zh_CN/admin-guide/mm/ksm.rst 18 文档中有描述。 18 文档中有描述。 19 19 20 设计 20 设计 21 ==== 21 ==== 22 22 23 概述 23 概述 24 ---- 24 ---- 25 25 26 概述内容请见mm/ksm.c文档中的“DOC: 26 概述内容请见mm/ksm.c文档中的“DOC: Overview” 27 27 28 逆映射 28 逆映射 29 ------ 29 ------ 30 KSM维护着稳定树中的KSM页的逆映射 30 KSM维护着稳定树中的KSM页的逆映射信息。 31 31 32 当KSM页面的共享数小于 ``max_page_shar 32 当KSM页面的共享数小于 ``max_page_sharing`` 的虚拟内存区域(VMAs)时,则代表了 33 KSM页的稳定树其中的节点指向了一 33 KSM页的稳定树其中的节点指向了一个ksm_rmap_item结构体类型的列表。同时,这个KSM页 34 的 ``page->mapping`` 指向了该稳定树节 34 的 ``page->mapping`` 指向了该稳定树节点。 35 35 36 如果共享数超过了阈值,KSM将给稳 36 如果共享数超过了阈值,KSM将给稳定树添加第二个维度。稳定树就变成链接一个或多 37 个稳定树"副本"的"链"。每个副本都 37 个稳定树"副本"的"链"。每个副本都保留KSM页的逆映射信息,其中 ``page->mapping`` 38 指向该"副本"。 38 指向该"副本"。 39 39 40 每个链以及链接到该链中的所有"副 40 每个链以及链接到该链中的所有"副本"强制不变的是,它们代表了相同的写保护内存 41 内容,尽管任中一个"副本"是由同 41 内容,尽管任中一个"副本"是由同一片内存区的不同的KSM复制页所指向的。 42 42 43 这样一来,相比与无限的逆映射链 43 这样一来,相比与无限的逆映射链表,稳定树的查找计算复杂性不受影响。但在稳定树 44 本身中不能有重复的KSM页面内容仍 44 本身中不能有重复的KSM页面内容仍然是强制要求。 45 45 46 由 ``max_page_sharing`` 强制决定的数据 46 由 ``max_page_sharing`` 强制决定的数据去重限制是必要的,以此来避免虚拟内存 47 rmap链表变得过大。rmap的遍历具有O( 47 rmap链表变得过大。rmap的遍历具有O(N)的复杂度,其中N是共享页面的rmap_项(即 48 虚拟映射)的数量,而这个共享页 48 虚拟映射)的数量,而这个共享页面的节点数量又被 ``max_page_sharing`` 所限制。 49 因此,这有效地将线性O(N)计算复杂 49 因此,这有效地将线性O(N)计算复杂度从rmap遍历中分散到不同的KSM页面上。ksmd进 50 程在稳定节点"链"上的遍历也是O(N) 50 程在稳定节点"链"上的遍历也是O(N),但这个N是稳定树"副本"的数量,而不是rmap项 51 的数量,因此它对ksmd性能没有显著 51 的数量,因此它对ksmd性能没有显著影响。实际上,最佳稳定树"副本"的候选节点将 52 保留在"副本"列表的开头。 52 保留在"副本"列表的开头。 53 53 54 ``max_page_sharing`` 的值设置得高了会 54 ``max_page_sharing`` 的值设置得高了会促使更快的内存合并(因为将有更少的稳定 55 树副本排队进入稳定节点chain->hlist 55 树副本排队进入稳定节点chain->hlist)和更高的数据去重系数,但代价是在交换、压 56 缩、NUMA平衡和页面迁移过程中可能 56 缩、NUMA平衡和页面迁移过程中可能导致KSM页的最大rmap遍历速度较慢。 57 57 58 ``stable_node_dups/stable_node_chains`` 的比 58 ``stable_node_dups/stable_node_chains`` 的比值还受 ``max_page_sharing`` 调控 59 的影响,高比值可能意味着稳定节 59 的影响,高比值可能意味着稳定节点dup中存在碎片,这可以通过在ksmd中引入碎片算 60 法来解决,该算法将rmap项从一个稳 60 法来解决,该算法将rmap项从一个稳定节点dup重定位到另一个稳定节点dup,以便释放 61 那些仅包含极少rmap项的稳定节点"du 61 那些仅包含极少rmap项的稳定节点"dup",但这可能会增加ksmd进程的CPU使用率,并可 62 能会减慢应用程序在KSM页面上的只 62 能会减慢应用程序在KSM页面上的只读计算。 63 63 64 KSM会定期扫描稳定节点"链"中链接 64 KSM会定期扫描稳定节点"链"中链接的所有稳定树"副本",以便删减过时了的稳定节点。 65 这种扫描的频率由 ``stable_node_chains_ 65 这种扫描的频率由 ``stable_node_chains_prune_millisecs`` 这个sysfs 接口定义。 66 66 67 参考 67 参考 68 ==== 68 ==== 69 内核代码请见mm/ksm.c。 69 内核代码请见mm/ksm.c。 70 涉及的函数(mm_slot ksm_scan stable_node 70 涉及的函数(mm_slot ksm_scan stable_node rmap_item)。
Linux® is a registered trademark of Linus Torvalds in the United States and other countries.
TOMOYO® is a registered trademark of NTT DATA CORPORATION.