侵权投诉
订阅
纠错
加入自媒体

Cortex A9架构下,为什么使用结构体效率会更高一些?

2020-12-15 09:13
一口Linux
关注

2. 反汇编代码如下:

由上图可知:

结构体变量peng位于bss段,地址是4000802c访问结构体成员也需要利用pc找到结构体变量peng对应的文字池中地址40008028,然后间接找到结构体变量peng地址4000802c

与定义成3个全局变量相比,优点:

结构体的所有成员在literal pool 中共用同一个地址;而每一个全局变量在literal pool 中都有一个地址,「节省了8个字节」。访问结构体其他成员的时候,不需要再次装载基地址,只需要2条指令即可实现赋值;访问3个成员,总共需要「7条指令」,「节省了5条指令」

「彩!」

所以对于需要大量访问结构体成员的功能函数,所有访问结构体成员的操作只需要加载一次基地址即可。

使用结构体就可以大大的节省指令周期,而节省指令周期对于提高cpu的运行效率自然不言而喻。

「所以,重要问题说3遍」

「尽量使用结构体」「尽量使用结构体」「尽量使用结构体」

三、继续优化

那么指令还能不能更少一点呢?答案是可以的,修改Makefile如下:

TARGET=gcd                                                                                
TARGETC=main
all:
    arm-none-linux-gnueabi-gcc -Os   -lto -g -c -o $(TARGETC).o  $(TARGETC).c
    arm-none-linux-gnueabi-gcc -Os  -lto -g -c -o $(TARGET).o $(TARGET).s
    arm-none-linux-gnueabi-gcc -Os  -lto -g -S -o $(TARGETC).s  $(TARGETC).c
    arm-none-linux-gnueabi-ld   $(TARGETC).o    $(TARGET).o -Tmap.lds  -o  $(TARGET).elf
    arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin
    arm-none-linux-gnueabi-objdump -D $(TARGET).elf > $(TARGET).dis
clean:
    rm -rf *.o *.elf *.dis *.bin

仍然用第二章的main.c文件

执行结果

可以看到代码已经被优化到5条。

14. 把peng的地址40008024装载到r3中

15. r0写入立即数0x11

16. r1写入立即数0x22

17. r0写入立即数0x33

18. 通过stm指令将r0、r1、r2的值顺序写入到40008024内存中

「彩!彩!彩!彩!」

文中用到的汇编知识可以参考ARM系列文章

《从0学arm合集》


<上一页  1  2  3  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

电子工程 猎头职位 更多
扫码关注公众号
OFweek电子工程网
获取更多精彩内容
文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号