加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專(zhuān)業(yè)用戶(hù)
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 一、全局變量反匯編
    • 二、結(jié)構(gòu)體反匯編
    • 三、繼續(xù)優(yōu)化
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

為什么使用結(jié)構(gòu)體效率會(huì)高?通過(guò)匯編代碼給你講透!

03/25 10:30
2417
閱讀需 14 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作為一個(gè)有著十幾年研發(fā)經(jīng)驗(yàn)的嵌入式老桿子,一口君發(fā)現(xiàn)很多程序猿新手,在編寫(xiě)代碼的時(shí)候,特別喜歡定義很多全局變量,寫(xiě)個(gè)模塊,能定義幾百個(gè)全局變量,函數(shù)里面也是各種全局變量,這種屎山代碼效率低,難維護(hù),幾乎無(wú)法移植,但是防御性極高?。ǚ彩露加袃擅嫘裕?/p>

很多新手之所以把這些變量封裝到一個(gè)結(jié)構(gòu)體中,主要原因是圖方便,但是要知道,這其實(shí)是一個(gè)不好的習(xí)慣,而且會(huì)降低整體代碼的性能。

最近有幸與大神【公眾號(hào):裸機(jī)思維】的傻孩子交流的時(shí)候,他聊到:“其實(shí)Cortex在架構(gòu)層面就是更偏好面向?qū)ο蟮模呐履阒皇鞘褂昧私Y(jié)構(gòu)體),其表現(xiàn)形式就是:Cortex所有的尋址模式都是間接尋址——換句話(huà)說(shuō)一定依賴(lài)一個(gè)寄存器作為基地址。

舉例來(lái)說(shuō),同樣是訪(fǎng)問(wèn)外設(shè)寄存器,過(guò)去在8位和16位機(jī)時(shí)代,人們喜歡給每一個(gè)寄存器都單獨(dú)綁定地址——當(dāng)作全局變量來(lái)訪(fǎng)問(wèn),而現(xiàn)在Cortex在架構(gòu)上更鼓勵(lì)底層驅(qū)動(dòng)以寄存器頁(yè)(也就是結(jié)構(gòu)體)為單位來(lái)定義寄存器,這也就是說(shuō),同一個(gè)外設(shè)的寄存器是借助擁有同一個(gè)基地址的結(jié)構(gòu)體來(lái)訪(fǎng)問(wèn)的。”

以Cortex A9架構(gòu)為前提,下面一口君詳細(xì)給你解釋為什么使用結(jié)構(gòu)體效率會(huì)更高一些。

一、全局變量反匯編

1. 源文件

gcd.s

.text
.global?_start
_start:
??ldr??sp,=0x70000000?????????/*get?stack?top?pointer*/
??b??main

main.c

/*
?*?main.c
?*
?*??Created?on:?2020-12-12
?*??????Author:?pengdan
?*/
int?xx=0;
int?yy=0;
int?zz=0;

int?main(void)
{
?xx=0x11;
?yy=0x22;
?zz=0x33;

?while(1);
????return?0;
}

map.lds

OUTPUT_FORMAT("elf32-littlearm",?"elf32-littlearm",?"elf32-littlearm")
/*OUTPUT_FORMAT("elf32-arm",?"elf32-arm",?"elf32-arm")*/
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS
{
?.?=?0x40008000;
?.?=?ALIGN(4);
?.text??????:
?{
??gcd.o(.text)
??*(.text)
?}
?.?=?ALIGN(4);
????.rodata?:?
?{?*(.rodata)?}
????.?=?ALIGN(4);
????.data?:?
?{?*(.data)?}
????.?=?ALIGN(4);
????.bss?:
?????{?*(.bss)?}
}

Makefile

TARGET=gcd
TARGETC=main
all:
?arm-none-linux-gnueabi-gcc?-O1?-g?-c?-o?$(TARGETC).o??$(TARGETC).c
?arm-none-linux-gnueabi-gcc?-O1?-g?-c?-o?$(TARGET).o?$(TARGET).s
?arm-none-linux-gnueabi-gcc?-O1?-g?-S?-o?$(TARGETC).s??$(TARGETC).c
?arm-none-linux-gnueabi-ld?$(TARGETC).o?$(TARGET).o?-Tmap.lds??-o??$(TARGET).elf?
?arm-none-linux-gnueabi-objcopy?-O?binary?-S?$(TARGET).elf?$(TARGET).bin
?arm-none-linux-gnueabi-objdump?-D?$(TARGET).elf?>?$(TARGET).dis

clean:
?rm?-rf?*.o?*.elf?*.dis?*.bin

【交叉編譯工具,自行搜索安裝,或者后臺(tái)回復(fù)arm

2. 反匯編結(jié)果:

由上圖可知,每存儲(chǔ)1個(gè)int型全局變量需要8個(gè)字節(jié)

literal pool (文字池)占用4個(gè)字節(jié)

literal pool的本質(zhì)就是ARM匯編語(yǔ)言代碼節(jié)中的一塊用來(lái)存放常量數(shù)據(jù)而非可執(zhí)行代碼的內(nèi)存塊。

使用literal?pool?(文字池)的原因

當(dāng)想要在一條指令中使用一個(gè)?4字節(jié)長(zhǎng)度的常量數(shù)據(jù)(這個(gè)數(shù)據(jù)可以是內(nèi)存地址,也可以是數(shù)字常量)的時(shí)候,由于ARM指令集是定長(zhǎng)的(ARM指令4字節(jié)或Thumb指令2字節(jié)),所以就無(wú)法把這個(gè)4字節(jié)的常量數(shù)據(jù)編碼在一條編譯后的指令中。此時(shí),ARM編譯器(編譯C源程序)/匯編器(編譯匯編程序)?就會(huì)在代碼節(jié)中分配一塊內(nèi)存,并把這個(gè)4字節(jié)的數(shù)據(jù)常量保存于此,之后,再使用一條指令把這個(gè)4?字節(jié)的數(shù)字常量加載到寄存器中參與運(yùn)算。

在C源代碼中,文字池的分配是由編譯器在編譯時(shí)自行安排的,在進(jìn)行匯編程序設(shè)計(jì)時(shí),開(kāi)發(fā)者可以自己進(jìn)行文字池的分配,如果開(kāi)發(fā)者沒(méi)有進(jìn)行文字池的安排,那么匯編器就會(huì)代勞。

bss段占用4個(gè)字節(jié)

每訪(fǎng)問(wèn)1次全局變量,總共需要3條指令,訪(fǎng)問(wèn)3次全局變量用了12條指令

14.?通過(guò)當(dāng)前pc值40008018偏移32個(gè)字節(jié),找到xx變量的鏈接地址40008038,然后取出其內(nèi)容40008044存放在r3中,該值就是xx在bss段的地址
15.?通過(guò)將立即數(shù)0x11即#17賦值給r2
16.?將r2的內(nèi)讓那個(gè)寫(xiě)入到r3對(duì)應(yīng)的指向的內(nèi)存,即xx標(biāo)號(hào)對(duì)應(yīng)的內(nèi)存中

二、結(jié)構(gòu)體反匯編

1. 修改main.c如下:

?/*
??2??*?main.c???????????????????????????????????????????????????????????
??3??*
??4??*??Created?on:?2020-12-12
??5??*??????Author:?一口Linux
??6??*/
??7?struct
??8?{
??9?????int?xx;
?10?????int?yy;
?11?????int?zz;
?12?}peng;
?13?int?main(void)
?14?{
?15?????peng.xx=0x11;
?16?????peng.yy=0x22;
?17?????peng.zz=0x33;
?18?
?19?????while(1);
?20?????return?0;
?21?}

2. 反匯編代碼如下:

由上圖可知:

    結(jié)構(gòu)體變量peng位于bss段,地址是4000802c訪(fǎng)問(wèn)結(jié)構(gòu)體成員也需要利用pc找到結(jié)構(gòu)體變量peng對(duì)應(yīng)的文字池中地址40008028,然后間接找到結(jié)構(gòu)體變量peng地址4000802c

與定義成3個(gè)全局變量相比,優(yōu)點(diǎn):結(jié)構(gòu)體的所有成員在literal pool 中共用同一個(gè)地址;而每一個(gè)全局變量在literal pool 中都有一個(gè)地址,節(jié)省了8個(gè)字節(jié)。訪(fǎng)問(wèn)結(jié)構(gòu)體其他成員的時(shí)候,不需要再次裝載基地址,只需要2條指令即可實(shí)現(xiàn)賦值;訪(fǎng)問(wèn)3個(gè)成員,總共需要7條指令,節(jié)省了5條指令彩!

所以對(duì)于需要大量訪(fǎng)問(wèn)結(jié)構(gòu)體成員的功能函數(shù),所有訪(fǎng)問(wèn)結(jié)構(gòu)體成員的操作只需要加載一次基地址即可。

使用結(jié)構(gòu)體就可以大大的節(jié)省指令周期,而節(jié)省指令周期對(duì)于提高cpu的運(yùn)行效率自然不言而喻。

所以,重要問(wèn)題說(shuō)3遍,盡量使用結(jié)構(gòu)體盡量使用結(jié)構(gòu)體盡量使用結(jié)構(gòu)體

三、繼續(xù)優(yōu)化

那么指令還能不能更少一點(diǎn)呢?答案是可以的,
修改Makefile如下:

TARGET=gcd????????????????????????????????????????????????????????????????????????????????
TARGETC=main
all:
?????arm-none-linux-gnueabi-gcc?-Os???-lto?-g?-c?-o?$(TARGETC).o??$(TARGETC).c
?????arm-none-linux-gnueabi-gcc?-Os??-lto?-g?-c?-o?$(TARGET).o?$(TARGET).s
?????arm-none-linux-gnueabi-gcc?-Os??-lto?-g?-S?-o?$(TARGETC).s??$(TARGETC).c
?????arm-none-linux-gnueabi-ld???$(TARGETC).o????$(TARGET).o?-Tmap.lds??-o??$(TARGET).elf
?????arm-none-linux-gnueabi-objcopy?-O?binary?-S?$(TARGET).elf?$(TARGET).bin
?????arm-none-linux-gnueabi-objdump?-D?$(TARGET).elf?>?$(TARGET).dis
clean:
?????rm?-rf?*.o?*.elf?*.dis?*.bin

仍然用第二章的main.c文件

執(zhí)行結(jié)果

可以看到代碼已經(jīng)被優(yōu)化到5條。

14.?把peng的地址40008024裝載到r3中
15.?r0寫(xiě)入立即數(shù)0x11
16.?r1寫(xiě)入立即數(shù)0x22
17.?r0寫(xiě)入立即數(shù)0x33
18.?通過(guò)stm指令將r0、r1、r2的值順序?qū)懭氲?0008024內(nèi)存中

彩!彩!彩!彩!

要想成為一名真正的底層大師,就一定要學(xué)習(xí)匯編代碼,我們學(xué)習(xí)的不僅僅是一門(mén)語(yǔ)言,更是一個(gè)計(jì)算機(jī)設(shè)計(jì)的哲學(xué)!

一口君從多年嵌入式研發(fā)項(xiàng)目提煉出關(guān)于arm的文章,并匯集成書(shū)從零開(kāi)始學(xué)ARM其中本篇文章也收錄在這本書(shū)中。

目前已經(jīng)被全國(guó)上百家省、市、各大學(xué)圖書(shū)館收錄,很多粉絲都在當(dāng)?shù)氐膱D書(shū)館發(fā)來(lái)了

還有很多其他截圖就不分享了。

第一版的幾千本已經(jīng)全部發(fā)售,

第二版后續(xù)會(huì)陸續(xù)印刷,

當(dāng)當(dāng)、淘寶、京東均可購(gòu)買(mǎi),

誰(shuí)便宜買(mǎi)誰(shuí)的!

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠(chǎng)商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
KSZ8863FLL 1 Microchip Technology Inc DATACOM, LAN SWITCHING CIRCUIT, PQFP48
$5.57 查看
SN74LVC2G74DCURE4 1 Texas Instruments Single Positive-Edge-Triggered D-Type Flip-Flop with Clear and Preset 8-VSSOP -40 to 125

ECAD模型

下載ECAD模型
$0.62 查看
XLH536100.000000I 1 Integrated Device Technology Inc CLCC-6, VARR
$2.1 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

公眾號(hào)『一口Linux』號(hào)主彭老師,擁有15年嵌入式開(kāi)發(fā)經(jīng)驗(yàn)和培訓(xùn)經(jīng)驗(yàn)。曾任職ZTE,某研究所,華清遠(yuǎn)見(jiàn)教學(xué)總監(jiān)。擁有多篇網(wǎng)絡(luò)協(xié)議相關(guān)專(zhuān)利和軟件著作。精通計(jì)算機(jī)網(wǎng)絡(luò)、Linux系統(tǒng)編程、ARM、Linux驅(qū)動(dòng)、龍芯、物聯(lián)網(wǎng)。原創(chuàng)內(nèi)容基本從實(shí)際項(xiàng)目出發(fā),保持原理+實(shí)踐風(fēng)格,適合Linux驅(qū)動(dòng)新手入門(mén)和技術(shù)進(jìn)階。