作者簡(jiǎn)介
于浩進(jìn),linux內(nèi)核愛(ài)好者,現(xiàn)就職于北京靈汐科技有限公司,任職BSP工程師,主要負(fù)責(zé)IP驗(yàn)證、多媒體驅(qū)動(dòng)開(kāi)發(fā)及一些bring up等工作。
文章大綱
1.背景介紹
2.環(huán)境說(shuō)明
2.1 硬件環(huán)境
2.2 Kernel 版本
2.3 kernel 相關(guān)配置介紹
3.fixmap 機(jī)制介紹
3.1 虛擬空間拓?fù)?/p>
3.1.1 VA=39bit 下 kernel 虛擬地址空間拓?fù)?br /> 3.1.2 FIXMAP 地址空間拓?fù)?br /> 3.1.3 FIXMAP 初始化
3.2 fixmap 在 early ioremap 應(yīng)用介紹
3.2.1 early_ioremap_setup()
3.2.2 __early_ioremap()
3.3 fixmap 在 early console 應(yīng)用介紹
3.4 fixmap 在 device-tree 應(yīng)用介紹
3.4.1 映射過(guò)程分析
3.5 fixmap 在 paging_init 中頁(yè)表切換介紹
3.5.1 paging_init 函數(shù)簡(jiǎn)單分析
3.5.2 paging_init 中的 fixmap
4.小結(jié)
5.參考文章
01、背景介紹
Fixmap機(jī)制是kernel在啟動(dòng)過(guò)程中(start_kernel)臨時(shí)的映射機(jī)制,目的是在真正頁(yè)表建立之前用于完成對(duì)io設(shè)備的訪問(wèn)、device-tree的解析以及paging_init中的頁(yè)表切換等。本文將對(duì)該機(jī)制做一個(gè)深入的分析。
02、環(huán)境說(shuō)明
2.1硬件環(huán)境
某SOC芯片,CPU為8核cortex-A53,其DDR物理地址為0x800000000,device-tree存放的物理地址為0x843000000。
2.2kernel版本
4.19.83版本。
2.3kernel相關(guān)配置介紹
相關(guān)Config配置
相關(guān)宏配置
以下宏的值,只給出結(jié)果了:
03、虛擬空間拓?fù)?nbsp;
3.1虛擬空間拓?fù)?/strong>
3.1.1 VA=39bit下kernel虛擬地址空間拓?fù)?/strong>
圖1詳細(xì)展示了VA=39bit下kernel虛擬地址空間拓?fù)?,里面展示了FIXMAP區(qū)域在整個(gè)虛擬地址空間所處的位置。
3.1.2 FIXMAP地址空間拓?fù)?/strong>
Kernel對(duì)Fixmap區(qū)域做了進(jìn)一步的劃分,各區(qū)間是在enum fixed_addresses 枚舉類型定義的(/arch/arm64/include/asm/fixmap.h)。
其各個(gè)區(qū)間的virtual address通過(guò)fix_to_virt(const unsigned int idx)函數(shù)獲得,其定義是在/include/asm-generic/fixmap.h里面,這個(gè)函數(shù)后面會(huì)用到。
下圖2詳細(xì)展示了各個(gè)區(qū)間的base address。
Fix_to_virt的定義如下:
3.1.3 FIXMAP初始化
Bm_pte、bm_pmd、Bm_pte為三個(gè)全局?jǐn)?shù)組,用于暫存pud、pmd、
pte的頁(yè)表。
early_fixmap_init()函數(shù)完成了fixmap映射的基礎(chǔ)框架,如下圖3所示,bm_pte數(shù)組并沒(méi)有填值,因?yàn)楫?dāng)前還不知道哪些物理地址需要映射,等需要映射時(shí)候再去填寫(xiě)bm_pte的entry。
經(jīng)過(guò)分析代碼,整理了fixmap各段虛擬地址與bm_pmd entry的關(guān)系,如下圖4所示:
需要說(shuō)明的是FIX_PGD~FIX_FDT在bm_pmd是屬于同一個(gè)entry,即可以用bm_pte做pte映射。
FIX_FDT~FIX_HOLE不屬于該entry,即不可以用bm_pte做pte映射,也為后面device-tree的映射做了一個(gè)鋪墊。
3.2fixmap在early ioremap應(yīng)用介紹
3.2.1 early_ioremap_setup()
該函數(shù)的比較簡(jiǎn)單,主要是依靠__fix_to_virt()給slot_virt[i]填入虛擬地址,其布局如下圖5所示。
slot[i]是fix_map區(qū)域已經(jīng)規(guī)劃好的虛擬地址范圍,任何I/O地址空間都可以向這7個(gè)slot空間做映射。
其中:slot_virt[i] = __fix_to_virt(FIX_BTMAP_BEGIN - NR_FIX_BTMAPS*i),__fix_to_virt()在之前已經(jīng)介紹過(guò)。Slot_virt每個(gè)區(qū)間size為256K。
3.2.2 __early_ioremap()
有三個(gè)數(shù)組需要說(shuō)明:
slot_virt[slot]:BTMAP區(qū)域各個(gè)區(qū)間虛擬地址;
prev_map[slot]:__early_ioremap()映射后的虛擬地址;
prev_size[slot]:__early_ioremap()要映射的size;
映射流程如下圖6所示:
Figure 6 early ioremap映射流程圖
圖7展示了early ioremap頁(yè)表轉(zhuǎn)換過(guò)程,還是比較簡(jiǎn)單的。
3.3fixmap在early console應(yīng)用介紹
Early console的映射與early ioremap的映射類似,通過(guò)__fix_to_vit(FIX_EARLYCON_MEM_BASE)獲取虛擬地址,物理地址為UART在SOC的實(shí)際分配的地址(該物理地址來(lái)自于command line的earlycon=XXX),然后通過(guò)向bm_pte寫(xiě)入頁(yè)表,即可以完成映射。
圖8是函數(shù)調(diào)用關(guān)系。圖9是頁(yè)表的建立和轉(zhuǎn)換過(guò)程。
3.4 fixmap在device-tree應(yīng)用介紹
3.4.1 映射過(guò)程分析
Device-tree的映射和early-console、early-ioremap的映射原理有所不同,主要區(qū)別在于FIX_FDT空間對(duì)應(yīng)的虛擬地址的pmd entry與FIXADDR_START對(duì)應(yīng)的pmd entry是不同的。
通過(guò)分析kernel代碼可知對(duì)于device-tree的映射需要建立一個(gè)2M的block entry即可,即在bm_pmd建立一個(gè)block entry。
如下圖10所示,只需要找到pmdp,寫(xiě)入block entry的頁(yè)表項(xiàng)即可。
那問(wèn)題來(lái)了,pmdp的虛擬地址我們是知道的,對(duì)應(yīng)的bm_pmd的entry的物理地址也能知道,但是兩者之間的頁(yè)表還未建立。
因此在用pmdp指針向bm_pmd寫(xiě)入block entry之前,必須要先建立pmdp的頁(yè)表,這個(gè)頁(yè)表建立過(guò)程就與early console的頁(yè)表建立過(guò)程相同了。見(jiàn)下圖11所示。
設(shè)備樹(shù)頁(yè)表的建立會(huì)調(diào)用到init_pmd()建立block entry,也就是下圖12圈2對(duì)應(yīng)的代碼,圈1的代碼就是對(duì)應(yīng)上圖11給pmdp建立頁(yè)表的過(guò)程。
在寫(xiě)入block entry之后,pmdp也就無(wú)用了,圈3代碼把剛才的pmdp的頁(yè)表清除了,即把bm_pte對(duì)應(yīng)的表項(xiàng)清除了。
最后再簡(jiǎn)單展示一下fixmap為設(shè)備樹(shù)建立頁(yè)表的函數(shù)調(diào)用關(guān)系,如下圖13所示。
3.5fixmap在paging_init中頁(yè)表切換介紹
3.5.1 paging_init函數(shù)簡(jiǎn)單分析
下圖14是paging_init的代碼分析。
圈1代碼通過(guò)memblock分配器分配了一個(gè)物理頁(yè)面,該頁(yè)面暫存后面代碼建立的頁(yè)表;
圈2代碼是通過(guò)fixmp機(jī)制把這個(gè)物理頁(yè)面映射為虛擬地址;
圈3代碼把kernel的鏡像的一些代碼段、數(shù)據(jù)做等做映射,在圖1有說(shuō)明;
圈4代碼把memblock.memory類型的region區(qū)域做線性映射,比如設(shè)備樹(shù)的memory節(jié)點(diǎn)的內(nèi)存,會(huì)在此做線性映射,但是會(huì)排除代碼段和只讀數(shù)據(jù)段,具體細(xì)節(jié),還請(qǐng)看源碼;
圈5~圈7代碼將暫存頁(yè)表內(nèi)容拷貝到swapper_pg_dir,同時(shí)切換ttbr寄存器,此后CPU發(fā)出的虛擬地址就可以通過(guò)這套新建的頁(yè)表進(jìn)行虛實(shí)轉(zhuǎn)換了;
圈8清除pgdp的映射;
圈9代碼釋放剛才申請(qǐng)的物理頁(yè);
3.5.2 paging_init中的fixmap
上圖 圈6代碼是把臨時(shí)頁(yè)表拷貝到swapper_pg_dir,臨時(shí)頁(yè)表的物理頁(yè)是memblock分配器獲得的物理地址。
由于mmu已經(jīng)開(kāi)啟,memcpy無(wú)法使用物理地址,所以必須要先用fixmap機(jī)制做該物理頁(yè)面的映射,得到其虛擬地址,即pgd_set_fixmap(addr),其定義如下:
其是借助于fixmp的“FIX_PGD”區(qū)域做的映射,頁(yè)表映射及轉(zhuǎn)換過(guò)程如下圖15所示。
04、小結(jié)
在進(jìn)入start_kernel之前,head.S的“__primary_switch”已經(jīng)開(kāi)啟mmu了,使能mmu之后CPU發(fā)出的ldr、str指令都為虛擬地址了,因此必須要提前建立好頁(yè)表,mmu才能把虛擬地址轉(zhuǎn)為物理地址,以訪問(wèn)真正的物理內(nèi)存;
Fixmap用于在” earlyconsole”、” device-tree的解析”、” earlyioremap”、” paging_init的頁(yè)表切換”等過(guò)程建立臨時(shí)頁(yè)表。
Fixmap機(jī)制實(shí)際就是為mmu做了相關(guān)的虛擬和物理地址的映射;
Bm_pmd、bm_pte是兩個(gè)全局?jǐn)?shù)組,用于存放pmd、pte的頁(yè)表項(xiàng);
05、參考文獻(xiàn)
https://www.cnblogs.com/LoyenWang/p/11483948.html
https://www.cnblogs.com/LoyenWang/p/11440957.html
https://www.cnblogs.com/pengdonglin137/p/9157639.html