技术文章：从0学ARM-汇编伪指令、lds详解

4日10日 OFweek 2025（第十四届）中国机器人产业大会
立即报名 >>>
7.30-8.1 全数会2025（第六届）机器人及智能工厂展
火热报名中>>

2020-12-10 15:06

一口Linux

关注

ARM邪猎文章，请点击以下汇总链接：

《从0学arm合集》

一、MDK和GNU伪指令区别

我们在学习汇编代码的时候经过会看到以下两种风格的代码：

gnu代码开头是：

．global ＿start
＿start：＠汇编入口
ldr sp，＝0x41000000
．end ＠汇编程序结束

MDK代码开头是：

AREA Example，CODE，READONLY ；声明代码段Example
ENTRY ；程序入口
Start
MOV R0，＃0
OVER
END

这两种风格的代码是要使用不同的编译器，我们之前的实例代码都是MDK风格的。

那么多对于我们初学者来说要学习哪种风格呢？答案是肯定的，学习GNU风格的汇编代码，因为做Linux驱动开发必须掌握的linux内核、uboot，而这两个软件就是GNU风格的。

为了大家不要把过多精力浪费在暂时没用的知识上，下面我们只讲GNU风格汇编。

二、GNU汇编书写格式：1．代码行中的注释符号：

‘＠’ 整行注释符号：‘＃’ 语句分离符号：
直接操作数前缀： ‘＃’ 或 ‘＄’

2．全局标号：

标号只能由a～z，A～Z，0～9，“．”，＿等（由点、字母、数字、下划线等组成，除局部标号外，不能以数字开头）字符组成，标号的后面加“：”。

段内标号的地址值在汇编时确定；
段外标号的地址值在连接时确定。
3．局部标号：

局部标号主要在局部范围内使用而且局部标号可以重复出现。它由两部组成开头是一个0－99直接的数字局部标号后面加“：”

F：指示编译器只向前搜索，代码行数增加的方向／代码的下一句
B：指示编译器只向后搜索，代码行数减小的方向

注意局部标号的跳转，就近原则「举例：」

文件位置
arch／arm／kernel／entry－armv．S

三、伪操作

1．符号定义伪指令标号含义．global使得符号对连接器可见，变为对整个工程可用的全局变量＿start汇编程序的缺省入口是＿ start标号，用户也可以在连接脚本文件中用ENTRY标志指明其它入口点．．local表示符号对外部不可见，只对本文件可见2．数据定义（Data Definition）伪操作

数据定义伪操作一般用于为特定的数据分配存储单元，同时可完成已分配存储单元的初始化。常见的数据定义伪操作有如下几种：

标号含义．byte单字节定义 0x12，‘a’，23 【必须偶数个】．short定义2字节数据 0x1234，65535．long ／．word定义4字节数据 0x12345678．quad定义8字节．quad 0x1234567812345678．float定义浮点数．float 0f3．2．string／．asciz／．ascii定义字符串．ascii “abcd”，注意：．ascii 伪操作定义的字符串需要每行添加结尾字符＇＇，其他不需要．space／．skip用于分配一块连续的存储区域并初始化为指定的值，如果后面的填充值省略不写则在后面填充为0；．rept重复执行接下来的指令，以．rept开始，以．endr结束

【举例】

．word

val：．word 0x11223344
mov r1，＃val ；将值0x11223344设置到寄存器r1中

．space

label：．space size，expr ；expr可以是4字节以内的浮点数
a： space 8， 0x1

．rept

．rept cnt ；cnt是重复次数
．endr

注意：

变量的定义放在，stop后，．end前标号是地址的助记符，标号不占存储空间。位置在end前就可以，相对随意。3． if选择

语法结构

．if logical－expressing
……
．else
……
．endif

类似c语言里的条件编译。

【举例】

．if val2＝＝1
mov r1，＃val2
．endif
4． macro宏定义

．macro，．endm 宏定义类似c语言里的宏函数。

macro伪操作可以将一段代码定义为一个整体，称为宏指令。然后就可以在程序中通过宏指令多次调用该段代码。

语法格式：

．macro ｛＄label｝名字｛＄parameter｛，＄parameter｝…｝
……．．code
．endm

其中，＄标号在宏指令被展开时，标号会被替换为用户定义的符号。

宏操作可以使用一个或多个参数，当宏操作被展开时，这些参数被相应的值替换。

「注意」：先定义后使用

举例：

「【例1】：没有参数的宏实现子函数返回」

．macro MOV＿PC＿LR
MOV PC，LR
．endm
调用方式如下：
MOV＿PC＿LR

「【例2】：带参数宏实现子函数返回」

．macro MOV＿PC＿LR ，param
mov r1，param
MOV PC，LR
．endm

调用方法如下：

MOV＿PC＿LR ＃12

四、杂项伪操作

标号含义．global／用来声明一个全局的符号．arm定义一下代码使用ARM指令集编译．thumb定义一下代码使用Thumb指令集编译．section．section expr 定义一个段。expr可以使．text ．data．．bss．text．text ｛subsection｝将定义符开始的代码编译到代码段．data．data ｛subsection｝将定义符开始的代码编译到数据段，初始化数据段．bss．bss ｛subsection｝将变量存放到．bss段，未初始化数据段．align．align｛alignment｝｛，fill｝｛，max｝通过用零或指定的数据进行填充来使当前位置与指定边界对齐
．align 4 －－－ 16字节对齐 2的4次方
．align （4）－－－ 4字节对齐．org．org offset｛，expr｝指定从当前地址加上offset开始存放代码，并且从当前地址到当前地址加上offset之间的内存单元，用零或指定的数据进行填充．extern用于声明一个外部符号，用于兼容性其他汇编．code 32同．arm．code 16同．thumb．weak用于声明一个弱符号，如果这个符号没有定义，编译就忽略，而不会报错．end文件结束．include．include “filename” 包含指定的头文件，可以把一个汇编常量定义放在头文件中．equ格式：．equ symbol， expression把某一个符号（symbol）定义成某一个值（expression）．该指令并不分配空间，类似于c语言的＃define．set给一个全局变量或局部变量赋值，和．equ的功能一样

举例：．set

．set start， 0x40
mov r1，＃start ；r1里面是0x40

举例．equ

．equ start， 0x40
mov r1，＃start ；r1里面是0x40
＃define PI 3．1415

等价于

．equ PI， 31415

五、GNU伪指令

关键点：伪指令在编译时会转化为对应的ARM指令

ADR伪指令：该指令把标签所在的地址加载到寄存器中。ADR伪指令为小范围地址读取伪指令，使用的相对偏移范围：当地址值是字节对齐（8位）时，取值范围为－255～255，当地址值是字对齐（32位）时，取值范围为－1020～1020。语法格式： ADR｛cond｝ register，label
ADR R0， lable
ADRL伪指令：将中等范围地址读取到寄存器中

ADRL伪指令为中等范围地址读取伪指令。使用相对偏移范围：当地址值是字节对齐时，取值范围为－64～64KB；当地址值是字对齐时，取值范围为－256～256KB

语法格式：

ADRL｛cond｝ register，label
ADRL R0，lable
LDR伪指令：LDR伪指令装载一个32位的常数和一个地址到寄存器。语法格式：LDR｛cond｝ register，＝［expr｜label－expr］
LDR R0，＝0XFFFF0000 ；mov r1，＃0x12 对比一下

注意：（1）ldr伪指令和ldr指令区分下面是ldr伪指令：

ldr r1，＝val ＠ r1 ＝ val 是伪指令，将val标号地址赋给r1
【与MDK不一样，MDK只支持ldr r1，＝val】

下面是ldr指令：

ldr r2，val ＠ r1 ＝＊val 是arm指令，将标号val地址里的内容给r2
val：．word 0x11223344

（2）如何利用ldr伪指令实现长跳转

ldr pc，＝32位地址

（3）编码中解决非立即数的问题用arm伪指令ldr

ldr r0，＝0x999 ；0x999 不是立即数，

六、GNU汇编的编译

1．不含lds文件的编译

假设我们有以下代码，包括1个main．c文件，1个start．s文件：start．s

．global ＿start
＿start：＠汇编入口
ldr sp，＝0x41000000
b main
．global mystrcopy
．text
mystrcopy：／／参数dest－＞r0，src－＞r2
LDRB r2，［r1］，＃1
STRB r2，［r0］，＃1
CMP r2，＃0 ／／判断是不是字符串尾
BNE mystrcopy
MOV pc， lr
stop：
b stop ＠死循环，防止跑飞等价于while（1）
．end ＠汇编程序结束

main．c

extern void mystrcopy（char ＊d，const char ＊s）；
int main（void）
｛
const char ＊src ＝＂yikoulinux＂；
char dest［20］＝｛｝；
mystrcopy（dest，src）；／／调用汇编实现的mystrcopy函数
while（1）；
return 0；
｝

Makefile编写方法如下：

1． TARGET＝start
2． TARGETC＝main
3． all：
4． arm－none－linux－gnueabi－gcc －O0 －g －c －o ＄（TARGETC）．o ＄（TARGETC）．c
5． arm－none－linux－gnueabi－gcc －O0 －g －c －o ＄（TARGET）．o ＄（TARGET）．s
6．＃arm－none－linux－gnueabi－gcc －O0 －g －S －o ＄（TARGETC）．s ＄（TARGETC）．c
7． arm－none－linux－gnueabi－ld ＄（TARGETC）．o ＄（TARGET）．o －Ttext 0x40008000 －o ＄（TARGET）．elf
8． arm－none－linux－gnueabi－objcopy －O binary －S ＄（TARGET）．elf ＄（TARGET）．bin
9． clean：
10． rm －rf ＊．o ＊．elf ＊．dis ＊．bin

Makefile含义如下：

定义环境变量TARGET＝start，start为汇编文件的文件名定义环境变量TARGETC＝main，main为c语言文件目标：all，4～8行是该指令的指令语句将main．c编译生成main．o，＄（TARGETC）会被替换成main将start．s编译生成start．o，＄（TARGET）会被替换成start4－5也可以用该行1条指令实现通过ld命令将main．o、start．o链接生成start．elf，－Ttext 0x40008000表示设置代码段起始地址为0x40008000通过objcopy将start．elf转换成start．bin文件，－O binary （或－－out－target＝binary）输出为原始的二进制文件，－S （或－－strip－all）输出文件中不要重定位信息和符号信息，缩小了文件尺寸，clean目标clean目标的执行语句，删除编译产生的临时文件

【补充】

gcc的代码优化级别，在 makefile 文件中的编译命令4级 O0 －－ O3 数字越大，优化程度越高。O3最大优化volatile作用volatile修饰的变量，编译器不再进行优化，每次都真正访问内存地址空间。2．依赖lds文件编译

实际的工程文件，段复杂程度远比我们这个要复杂的多，尤其Linux内核有几万个文件，段的分布及其复杂，所以这就需要我们借助lds文件来定义内存的分布。

文件列表

main．c和start．s和上一节一致。

map．lds

OUTPUT＿FORMAT（＂elf32－littlearm＂，＂elf32－littlearm＂，＂elf32－littlearm＂）
OUTPUT＿FORMAT（＂elf32－arm＂，＂elf32－arm＂，＂elf32－arm＂）
OUTPUT＿ARCH（arm）
ENTRY（＿start）
SECTIONS
｛
．＝ 0x40008000；
．＝ ALIGN（4）；
．text ：
｛
．start．o（．text）
＊（．text）
｝
．＝ ALIGN（4）；
．rodata ：
｛＊（．rodata）｝
．＝ ALIGN（4）；
．data ：
｛＊（．data）｝
．＝ ALIGN（4）；
．bss ：
｛＊（．bss）｝
｝

解释一下上述的例子：

OUTPUT＿FORMAT（＂elf32－littlearm＂，＂elf32－littlearm＂，＂elf32－littlearm＂）指定输出object档案预设的binary 文件格式。可以使用objdump －i列出支持的binary 文件格式；OUTPUT＿ARCH（arm）指定输出的平台为arm，可以透过objdump －i查询支持平台；ENTRY（＿start）：将符号＿start的值设置成入口地址；．＝ 0x40008000：把定位器符号置为0x40008000（若不指定，则该符号的初始值为0）；．text ：｛．start．o（．text）＊（．text）｝：前者表示将start．o放到text段的第一个位置，后者表示将所有（＊符号代表任意输入文件）输入文件的．text section合并成一个．text section；．rodata ：｛＊（．data）｝：将所有输入文件的．rodata section合并成一个．rodata section；．data ：｛＊（．data）｝：将所有输入文件的．data section合并成一个．data section；．bss ：｛＊（．bss）｝：将所有输入文件的．bss section合并成一个．bss section；该段通常存放全局未初始化变量．＝ ALIGN（4）；表示下面的段4字节对齐

连接器每读完一个section描述后，将定位器符号的值增加该section的大小。

来看下，Makefile应该如何写：

＃ CORTEX－A9 PERI DRIVER CODE
＃ VERSION 1．0
＃ ATHUOR 一口Linux
＃ MODIFY DATE
＃ 2020．11．17 Makefile
＃＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＃
CROSS＿COMPILE ＝ arm－none－linux－gnueabi－
NAME ＝start
CFLAGS＝－mfloat－abi＝softfp －mfpu＝vfpv3 －mabi＝apcs－gnu －fno－builtin －fno－builtin－function －g －O0 －c
LD ＝＄（CROSS＿COMPILE）ld
CC ＝＄（CROSS＿COMPILE）gcc
OBJCOPY ＝＄（CROSS＿COMPILE）objcopy
OBJDUMP ＝＄（CROSS＿COMPILE）objdump
OBJS＝start．o main．o
＃＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＃
all：＄（OBJS）
＄（LD）＄（OBJS）－T map．lds －o ＄（NAME）．elf
＄（OBJCOPY）－O binary ＄（NAME）．elf ＄（NAME）．bin
＄（OBJDUMP）－D ＄（NAME）．elf ＞＄（NAME）．dis
％．o：％．S
＄（CC）＄（CFLAGS）－c －o ＄＠＄＜
％．o：％．s
＄（CC）＄（CFLAGS）－c －o ＄＠＄＜
％．o：％．c
＄（CC）＄（CFLAGS）－c －o ＄＠＄＜
clean：
rm －rf ＄（OBJS）＊．elf ＊．bin ＊．dis ＊．o