Ayy3

时间停止吧,你是多么的美丽

一些ACM计数问题——球盒模型等

1. 前置知识1

1.1 组合数

组合数的意义是从 个不同的球中取出 个球的方案数 ()。

它的公式是:.

一般很少用它的递推形式:.

1.2 隔板法

在一系列的球之间选几个缝隙,插入板,就是隔板问题。

例如 个球之间插入 块板,可以将其分成 组球(每组至少有一个球)。

由于 个球之间有 个缝隙,从中选出 个缝隙,所对应的方案数是

1.3 生成函数

没学过生成函数的推荐 https://www.bilibili.com/video/BV1E24y1171z?vd_source=a18dbba15826659c13a0c2fac0a3673c

笼统来讲,对于一个有限or无限的数列 ,它对应的生成函数为 .

生成函数主要解决以下问题:

种不同的物品,其中第 种物品可以取出 个,问总共取出 个物品的方案数。

对于第 种物品的生成函数为:.

我们将 个生成函数进行相乘,得到的多项式中项 所对应的系数就是要求的答案。

具体实现复杂度为 ,可以使用 FFT 进行进一步优化。(但是我不会FFT

1.4 五边形数

五边形数就是如上图所示的点的个数。第 个五边形数相比于第 个五边形数,多出了红色的点,它的个数为 。因此有 .

可通过差分前缀和求得通项公式:.

如果将 的定义域扩展到负数,则有广义五边形数

关于五边形数,有五边形数定理

欧拉函数

这个定理在后续正文讨论中会使用。

2. 正文1

球盒模型,是指将 个球放到 个盒中的方案计数问题。但是根据以下三项不同的要求,有8种变形:

  • 球是否相同
  • 盒子是否相同
  • 盒子是否可以为空

接下来让我们一一进行解决。

1. 球相同,盒子不同,盒子不可以为空

等价于将球分为 组。根据前置知识的隔板法,相当于在 个缝隙中插入 个板,对应的方案数为

2. 球相同,盒子不同,盒子可以为空

上个问题对于盒子的要求是:至少有一个球。

而本问题对于盒子的要求是:至少有零个球。

我们可以考虑将总球数增加 ,然后进行上个问题的求解。

这样所对应的问题是: 个相同球与 个不同的盒子,每个盒子至少有一个球。

然后我们可以把每个盒子中的每个球都删去一个,这样每个盒子都至少有零个球。此时总球数减少了 ,为 个。

因此问题转化为: 个相同球与 个不同的盒子,每个盒子至少有零个球。

可以发现和本问题是一模一样的。答案为

3. 球相同,盒子相同,盒子可以为空

可以使用动态规划解决,个人感觉这个dp的转移算是比较难想的啦。

表示将 个球分到 个盒子里的方案数。

关于状态转移,可以分为以下两中情况:

1、 个盒子内,至少有一个盒子为空。由于盒子相同,所以我们可以将这个盒子去掉,方案数为

2、 个盒子内,每个盒子都至少有一个球。这种情况等价于把所有盒子内部去掉一个球的情况,方案数为

因此可得转移方程:.

显然复杂度是 的。

事实上,这个问题的特殊情况等价于整数划分问题,这里我们讨论一下:

一个整数 可以用多少种方式划分为其他整数的和?例如

5=1+1+1+1+1

5=1+1+1+2

5=1+2+2

5=1+1+3

5=2+3

5=1+4

5=5

这里我们把每个整数都看作一个物品,盒子有 个。朴素dp做法复杂度为

我们这样考虑,一个整数 能够表示 ,其对应的生成函数为:.

我们要求的,是将所有的生成函数进行累乘后得到的多项式中 所对应的系数 .

在前置知识中,我们提到欧拉函数

因此,,即 .

将这个庞大的式子转化成多项式,根据多项式乘法,项 所对应的系数为:.

这里的 要满足 .

然而,除了常数项为 ,其余带 项的系数都应该为

因此令上式子为 ,得到 .

可以发现这是一个递推的形式。由于广义五边形数的量级为 ,因此这里递推一次的复杂度为 ,总复杂度为 .

4. 球相同,盒子相同,盒子不可以为空

和第一二种情况类似,该问题对盒子的要求是:至少一个球

而上个问题的要求是:至少零个球

因此我们把每个盒子都减去一个球,事实上求的就是上述dp解法的 .

当然,我们可以对这道题单独定义一个dp状态

然后根据上问题的转移,我们将状态分为“至少有一个盒子只有一个球”和“所有盒子都至少有大于一个球”的情况,得到转移式子:

.

原题链接:https://www.luogu.com.cn/problem/P1025


到目前为止,我们将所有球相同的情况都逐一进行了解读。事实上,正是球相同的这个性质,让我们可以在两种盒子是否为空的情况(如情况一二和情况三四)之间直接通过加球、删球来进行转换。

对于球不同的情况,我们还需要一点前置知识。

3. 前置知识2

3.1 第二类斯特林数

第二类斯特林数的定义和球盒模型相似:把 个不同的数划分为 个集合的方案数,要求不能有空集。

设第二类斯特林数为 。对于 ,可以通过以下两种情况来递推:

1、前 个数划分为 个集合,剩下第 个数单独为一个集合,方案数为

2、前 个数划分为 个集合,剩下第 个数放到这 个集合之中,方案数为

因此递推式为

递推是 的。然而,关于第二类斯特林数,有单独的公式:.

时间复杂度瓶颈为快速幂的复杂度

说来惭愧,作为一名ICPC银牌选手,我却从来没有了解过斯特林数。我记得不知道哪里的比赛考的裸的第二类斯特林数,当时我对着这个自己推出来的 的递推式想了半天怎么优化,想了一个小时想不出来,只能眼睁睁看着一堆人把这题过了,然后怀疑人生。赛后才知道有斯特林数这个东西。

4. 正文1

5. 球不同,盒子相同,盒子不可以为空

这个问题与第二类斯特林数一致。直接根据公式求即可。

6. 球不同,盒子相同,盒子可以为空

一种显然的想法:枚举不空盒子的个数,将对应的答案累加即可。

答案为

特殊地,若 ,那么问题等价于将大小为 集合进行划分的所有方案数。

7. 球不同,盒子不同,盒子可以为空

这个问题就非常简单了。对于每一个数,你都可以有 个盒子选择,答案显然为

8. 球不同,盒子不同,盒子不可以为空

由于球不同,所以没办法通过将每个盒子进行减球来将问题转化为上一个情况。

考虑和第二类斯特林数(第五个情况)之间的差异,可以发现控制变量为:盒子不同了。

也就是说每个盒子都有了标号。所以很简单,我们只需要将第二类斯特林数乘上全排列个数 就可以了,答案为

csapp shell lab

该lab对应于原书第八章异常控制流部分。

链接:http://csapp.cs.cmu.edu/3e/labs.html 文档:http://csapp.cs.cmu.edu/3e/shlab.pdf

1. 总体介绍

实验要求你补充 tsh.c 内的相关函数,以实现自己的 shell:tsh

关于 tsh ,需要实现以下功能

1、实现 tsh 内置命令。内置命令立即执行。lab要求我们实现以下四条命令:

  • quit 。顾名思义,退出 tsh
  • jobs 。了解shell的都知道,我们可以指定一个可执行文件的地址来在shell里面执行该文件。在 tsh 里也一样,一般使用作业(job)这个概念来表示为对一条命令行求值而创建的进程。内置命令不创建进程。作业分为前台作业和后台作业,前台作业只能存在一个,且只能等作业完毕后才能恢复shell的功能。后台作业可以存在任意多个,且在后台执行,不影响 tsh 自身的工作。jobs 的功能就是列出 tsh 创建的所有存在的作业,这个其实 lab 自己已经实现了,后续会提到。
  • bg <job> 。将某个中止(stopped)的作业恢复到后台执行。<job> 的表示方式可以是 PID 或者 JID (组号,具体见 WriteUp)
  • fg <job> 。将某个中止的作业恢复到前台执行。

2、代表用户执行可执行文件。通过 <path> <args[1], ...> 来创建前台作业。如果在最后添加符号 & 代表创建后台作业。

3、对于正在执行的前台作业, tsh 支持 Ctrl+C 来终止(作业完全寄了)和 Ctrl+Z 来中止(作业还没完全寄,只是暂停了,可以通过 bgfg 来恢复)。

4、tsh 能够正确回收所有僵尸进程。如果有子进程因为被未捕获信号(即没有给出信号处理程序)终止,需要输出相关信息。

为了方便我们编码,lab已经给出了关于作业的处理的函数,直接调用即可:

  • addjob ,添加作业;
  • deletejob ,删除作业;
  • fgpid ,返回前台作业的 PID
  • getjobpid ,根据 PID 获得作业结构体指针;
  • getjobjid ,根据 JID 获得作业结构体指针;
  • pid2jid ,输入 PID ,输出对应的 JID
  • ...

关于 tsh ,个人总结需要注意以下几点:

1、信号(signal)阻塞。因为我们需要使用信号来控制子进程(例如上面说的 Ctrl+C 来终止前台作业)与接受子进程信息(子进程终止或中止都会向 tsh 发出信号),这部分我们是需要自己实现信号处理程序的,在处理过程中需要考虑到并发的影响。并发是控制流的一个概念,在这里代表信号处理程序和 tsh 源程序的运行时段相重合。这可能会造成某些意想不到的情况,例如 tsh 在某处接受了某个信号并调用某个信号处理程序,但在执行程序的过程中又收到了某个信号,转而调用另一个信号对应的程序。这种并发流之间的交替是很危险的,因为它不可预测,特别是并发流之间共享数据的情况,它会导致无法预知的结果。

因此书上也给出建议,在信号处理程序内部应当阻塞其它信号的接收,具体是使用 sigprocmask 函数来设置阻塞信号。

2、进程组修改。因为 tsh 在这里是我们实际的 bash 的子进程,它拥有自己的 PID 以及进程组号。通过 tsh 创建的进程的进程组号默认是和 tsh 的进程组号一样的。如果我们需要结束某个作业(这里的作业是一系列子进程,或者包括子进程的子进程),需要通过进程组号来kill掉这个作业,但这样会把 tsh 本身给kill掉了。因此通过 tsh 创建的子进程的进程组号应该修改:setpgid(0, 0);

3、tsh 需要输出很多信息,这些信息的格式通过给出的 tshref.out 文件来查看。输出一般都使用 printf ,因为它方便输出一些格式化的信息,这在本lab是相当方便的。但由于 printf 不是异步安全的,在信号处理程序内部使用可能会有安全问题,因此应当使用安全的 write 函数。也可以使用第十章给出的 RIO 包。不过为了偷懒,我给出的代码还是使用了 printf

4、关于安全的信号处理,CSAPP给出了一些建议,例如保持程序简单、保护 errno 全局变量等,这里不一一赘述。

2. 实验

lab需要我们补充以下函数:

  • eval :主要的函数,用于执行命令行。函数的框架在书上其实已经给出来了。
  • builtin_cmd:用于判断命令是否为内置命令(即那四个)。如果是则立即执行。该函数同样在书上有现有的框架。
  • do_bgfg :用于执行 bgfg 命令。
  • waitfg :通过调用这个函数来让 tsh 挂起,直到当前的前台作业结束。
  • sigchld_handlerSIGCHLD 信号的信号处理程序。通过这个程序来完成僵尸进程回收、作业管理等工作。
  • sigint_handlerSIGINT信号(Ctrl+C)的信号处理程序。通过这个程序来让前台作业终止。
  • sigtstp_handlerSIGTSTP信号(Ctrl+Z)的信号处理程序。通过这个程序来让前台作业中止。

一开始可能会晕头转向,但其实lab也贴心的给出了我们一系列测试样例 tracexx.txt ,可以循序渐进地帮助我们完善 tsh 的功能。

也就是说,你应该想去看样例 trace01.txt ,并根据它的需求来初步实现某些函数。然后等通过了该样例,就跳到下一个样例 trace02.txt ,然后根据它的需求进一步完善程序。

不过这里还是直接给出我的代码吧。

最简单的应该是 builtin_cmd 函数,只需要根据命令的值来执行相应的过程即可:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
int builtin_cmd(char **argv) 
{
if(!strcmp(argv[0], "quit")){
exit(0);
}
if(!strcmp(argv[0], "jobs")){
listjobs(jobs);
return 1;
}
if(!strcmp(argv[0], "bg") || !strcmp(argv[0], "fg")){
do_bgfg(argv);
return 1;
}
if(!strcmp(argv[0], "&"))
return 1;
return 0; /* not a builtin command */
}

然后是主要的 eval 函数,这个因为书上已经给了范本,所以实现难度并不大:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
void eval(char *cmdline) 
{
char *argv[MAXARGS];
char buf[MAXLINE];
int bg;
pid_t pid;
sigset_t mask_one, prev_one, mask_all;

sigfillset(&mask_all);
sigemptyset(&mask_one);
sigaddset(&mask_one, SIGCHLD);
signal(SIGCHLD, sigchld_handler);

strcpy(buf, cmdline);
bg = parseline(buf, argv);


if(argv[0] == NULL)
return;

if(!builtin_cmd(argv)){
sigprocmask(SIG_BLOCK, &mask_one, &prev_one);
if((pid = fork()) == 0){
sigprocmask(SIG_SETMASK, &prev_one, NULL);
setpgid(0, 0);

if(execve(argv[0], argv, environ) < 0){
printf("%s: Command not found.\n", argv[0]);
exit(0);
}
}
sigprocmask(SIG_BLOCK, &mask_all, NULL);
int state = bg ? BG : FG;
addjob(jobs, pid, state, cmdline);
sigprocmask(SIG_SETMASK, &prev_one, NULL);

if(state == FG){
waitfg(pid);
}else{
printf("[%d] (%d) %s", pid2jid(pid), pid, cmdline);
}
}
return;
}

注意到在 fork 的时候我们就把 SIGCHLD 信号阻塞掉了,这是为了能够顺利调用 addjob 来添加作业。不然有可能在添加前,作业就已经结束并且给 tsh 发射 SIGCHLD 信号,造成在添加作业前就删除作业的局面。

后面需要根据作业是前台作业还是后台作业来分类,如果是前台作业,那么 tsh 就需要等待它执行完毕:

1
2
3
4
5
6
7
8
9
void waitfg(pid_t pid)
{
sigset_t mask;
sigemptyset(&mask);
while(pid == fgpid(jobs)){
sigsuspend(&mask);
}
return;
}

在实现 waitfg 函数的时候,相信大部分人都和我一样想到使用 waitpid 函数来实现。事实上这是不推荐的,在官方文档里也提到,因为我们可能 wait 到其它进程。这代表我们需要在这个函数内部要额外考虑后台进程终止(或者中止)的情况,而我们希望这些统一在信号处理程序内部处理。

那怎么办呢?我们可以借助于 fpgid 函数来检测现在的前台进程是否是我们期待的进程。如果二者不相等,说明前台进程就已经结束了。而如果相等则说明前台作业仍在进行,这时候我们可以使用 sigsuspend 函数来挂起 tsh 进程。

那么这时候我们应该要考虑信号的事情了,来看看如何处理 SIGCHLD

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
void sigchld_handler(int sig) 
{
int olderrno = errno;
sigset_t mask_all, prev_all;
pid_t pid;
int status;

sigfillset(&mask_all);
while((pid = waitpid(-1, &status, WNOHANG | WUNTRACED)) > 0){
sigprocmask(SIG_BLOCK, &mask_all, &prev_all);
if(WIFEXITED(status))
deletejob(jobs, pid);
if(WIFSIGNALED(status)){
printf("Job [%d] (%d) terminated by signal %d\n", pid2jid(pid), pid, WTERMSIG(status));
deletejob(jobs, pid);
}
if(WIFSTOPPED(status)){
printf("Job [%d] (%d) stopped by signal %d\n", pid2jid(pid), pid, WSTOPSIG(status));
struct job_t *now = getjobpid(jobs, pid);
now->state = ST;

}
sigprocmask(SIG_SETMASK, &prev_all, NULL);
}

errno = olderrno;
return;
}

通过使用 waitpid 并指定两个选项 WNOHANG | WUNTRACED 来立即检测当前的终止或中止进程的状态。如果是正常退出 WIFEXITED ,那么正常删除作业即可;如果是通过信号结束的作业,那么需要根据一定格式来输出信息,这里事实上不应该用 printf 的;如果是中止的作业,也需要输出相关的信息,同时修改作业的状态。这个状态是一定要修改的,因为 jobs 命令会根据这个信息来输出正确的作业信息。

对于其它两个信号,处理程序较为相似:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
void sigint_handler(int sig) 
{
int olderrno = errno;
sigset_t mask_all, prev_all;
sigfillset(&mask_all);
sigprocmask(SIG_BLOCK, &mask_all, &prev_all);
pid_t pid = fgpid(jobs);
if(pid){
kill(-pid, SIGINT);
}
sigprocmask(SIG_SETMASK, &prev_all, NULL);
errno = olderrno;
return;
}

void sigtstp_handler(int sig)
{
int olderrno = errno;
sigset_t mask_all, prev_all;
sigfillset(&mask_all);
sigprocmask(SIG_BLOCK, &mask_all, &prev_all);
pid_t pid = fgpid(jobs);
if(pid){
kill(-pid, SIGTSTP);
}
sigprocmask(SIG_SETMASK, &prev_all, NULL);
errno = olderrno;
return;
}

通过使用 kill 函数来向目标作业发射信号。

最后,我们来实现命令 bgfg 的功能:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
void do_bgfg(char **argv) 
{
struct job_t *job;
sigset_t mask_all, prev_all;
sigfillset(&mask_all);
if(argv[1] == NULL){
printf("%s command requires PID or %%jobid argument\n", argv[0]);
return;
}
if(argv[1][0] > '9' || argv[1][0] < '0'){
if(argv[1][0] != '%'){
printf("%s: argument must be a PID or %%jobid\n", argv[0]);
return;
}
}
if(!strcmp(argv[0], "bg")){
sigprocmask(SIG_BLOCK, &mask_all, &prev_all);
if(argv[1][0] == '%'){
int jid;
sscanf(argv[1], "%%%d", &jid);
job = getjobjid(jobs, jid);
}else{
int pid;
sscanf(argv[1], "%d", &pid);
job = getjobpid(jobs, pid);
}
if(job != NULL){
kill(-(job->pid), SIGCONT);
job->state = BG;
printf("[%d] (%d) %s", pid2jid(job->pid), job->pid, job->cmdline);
}else{
if(argv[1][0] == '%'){
printf("%s: No such job\n", argv[1]);
}else printf("(%s): No such process\n", argv[1]);
}
}else if(!strcmp(argv[0], "fg")){
// puts("!");
sigprocmask(SIG_BLOCK, &mask_all, &prev_all);
if(argv[1][0] == '%'){
int jid;
sscanf(argv[1], "%%%d", &jid);
job = getjobjid(jobs, jid);
}else{
int pid;
sscanf(argv[1], "%d", &pid);
job = getjobpid(jobs, pid);
}
if(job != NULL){
kill(-(job->pid), SIGCONT);
job->state = FG;
waitfg(job->pid);
}else{
if(argv[1][0] == '%'){
printf("%s: No such job\n", argv[1]);
}else printf("(%s): No such process\n", argv[1]);
}
}
sigprocmask(SIG_SETMASK, &prev_all, NULL);
return;
}

因为代码风格的原因,该部分较为冗长。这里需要将 bgfg 进行分类,同时考虑是通过 PID 还是 JID 访问作业的情况来得到相应的作业。

这里我使用了信号阻塞,它的作用是防止在寻找作业的过程中,目标作业被某个信号给终止了,然后 tsh 转去调用 sigchld_handler 将目标作业删除,导致我们这次的命令执行失败。

3. 总结

通过遍历所有16个测试用例,每个测试用例都和标准程序 tshref 来比对,来判断 tsh 的正确性。本lab是没有自动评分程序的

此次lab主要是通过实现一个自己的shell来更好地了解信号、并发等概念。个人认为目前学习CSAPP下来,异常控制流这章是最难的,但是对应的lab却不难,算是目前完成的五个lab(data、bomb、attack、cache、shell)中用时最少的。

链接笔记

0 屁话

该部分属于屁话,可以不看。

认识我的人都知道,我是一名ACMer,喜欢参加的比赛叫做ICPC,在一般人眼里就是“写代码”的比赛(然而事实上是坐牢的比赛)。

假设你是一名高手ACMer,参加了今年的ICPC World Final。今年WF的压轴题如下:

输入两个整数 ,输出 .

这么难的题,难倒了除了你之外的所有来自世界各地的顶尖选手。稍作思索过后,你写出了如下AC代码:

1
2
3
4
5
6
7
8
9
10
11
12
// add.c
#include<stdio.h>
int add(int a, int b){
return a + b;
}
int main(){
int a, b;
scanf("%d%d", &a, &b);
int c = add(a, b);
printf("%d\n", c);
return 0;
}

一行绿色的Accepted飘过,你AK了WF,然后从梦中醒来。

开个玩笑hh

不过醒来的你突发奇想。作为ACMer的我们,对于每个问题,写的程序一直都在一个文件之下。

但用屁股想都知道,正常的C语言的工程,肯定是由多个源文件组成的。比如上面的 add.c 程序,你可以分成两份源代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
// add.c
int add(int a, int b){
return a + b;
}

// main.c
#include<stdio.h>
int main(){
int a, b;
scanf("%d%d", &a, &b);
int c = add(a, b);
printf("%d\n", c);
return 0;
}

不过问题来了,作为一个ACMer,习惯使用VScode Code Runner的你,执行 main.c 后却遇到了以下错误:

1
2
3
4
5
6
7
main.c: In function ‘main’:
main.c:6:13: warning: implicit declaration of function ‘add’ [-Wimplicit-function-declaration]
6 | int c = add(a, b);
| ^~~
/usr/bin/ld: /tmp/cckuC0BG.o: in function `main':
add.c:(.text+0x4a): undefined reference to `add'
collect2: error: ld returned 1 exit status

这里是ld返回了一个异常信号1,说明是ld程序出现了错误,也就是链接器错误。具体错误是ld找不到add函数。

聪明的你仔细一想,觉得这也正常。毕竟你只是“执行”了一个文件,似乎另一个文件还不知道如何让它加入到执行过程中。

而将多个文件加入到一个程序的过程,其实就是链接的过程。

1. 程序生成流程

一个使用C语言编写的程序,需要通过四个步骤来生成最终的可执行文件:预处理、编译、汇编、链接。

以下描述以GNU编译系统为基础,在Linux平台(x64架构)运行测试。GNU提供了我们最熟悉的编译套件gcc

1.1 预处理

首先,我们的C语言源文件是不能直接被执行的。你双击一个.c文件,出来的只会是IDE或者文本编辑器,因为.c文件实质上就是一个文本文件。

但是在预处理这个步骤,我们输出的仍然是一个文本文件。

预处理的目的,是为了便于接下来的编译步骤,它大致有以下几个作用:

1、删掉注释。如果你特别喜欢printf调试,那么在最后提交程序的时候需要将其注释掉。注释的内容不可能在最终的目标文件里,它在预处理阶段就消失了。

2、处理除了 #progma 外的所有以#开头的代码。例如 #define 定义宏,#ifdef#endif等预编译指令,以及头文件 #include,在预处理阶段会将头文件插入到原有地方。(当然头文件包含可能是递归的,因此需要递归处理)

3、还会添加一些标识信息。

例如以下文件:

1
2
3
4
5
6
7
8
// add.c
#define int long long
int add(int a, int b){
// add two integers
int sum = a + b;
// then return the sum
return sum;
}

可以通过以下两个命令生成预处理文件 add.i

1
2
linux> cpp add.c add.i
linux> gcc -E add.c -o add.i

cpp 是C预处理器,通过预处理可以得到以下文本文件 add.i

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 0 "add.c"
# 0 "<built-in>"
# 0 "<command-line>"
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 0 "<command-line>" 2
# 1 "add.c"



long long add(long long a, long long b){

long long sum = a + b;

return sum;
}

可以发现头部给了一些标识信息。其次所有注释也被删去,而我们的int也因为宏定义被改成了long long类型。

当然 #define int long long 这种代码千万不要写(除了ACM赛场上最后一分钟发现程序爆int),这里只是为了展示~

1.2 编译

得到了我们的预处理文本文件,我们就可以正式开始编译了。通过编译程序,我们最终会得到一个汇编文本文件。它是一个由汇编语言所描述的文本文件,仍然可以被文本编辑器所查看。

可以通过以下命令生成汇编文件 add.s

1
2
3
linux> /usr/lib/gcc/x86_64-linux-gnu/11/cc1 add.i
linux> gcc -S add.i -o add.s
linux> gcc -S add.c -o add.s

这里的cc1便是正式的编译器。由于它不在我的环境变量上面,因此这里需要列出它的地址。当然你也可以直接用gcc -S命令进行编译。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
	.file	"add.i"
.text
.globl add
.type add, @function
add:
.LFB0:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
movq %rdi, -24(%rbp)
movq %rsi, -32(%rbp)
movq -24(%rbp), %rdx
movq -32(%rbp), %rax
addq %rdx, %rax
movq %rax, -8(%rbp)
movq -8(%rbp), %rax
popq %rbp
.cfi_def_cfa 7, 8
ret
.cfi_endproc
.LFE0:
.size add, .-add
.ident "GCC: (Ubuntu 11.2.0-19ubuntu1) 11.2.0"
.section .note.GNU-stack,"",@progbits

这个便是得到的汇编文件。熟悉x86汇编的可以发现这里的寄存器以 r 开头,代表我们操作的是8个字节的long long类型整数。

需要注意的是,汇编的每一行指令都与机器指令一对一相关

1.3 汇编

为了生成可执行文件的那种二进制格式文件,在得到汇编文件之后,我们需要将其转化为机器代码。这便是汇编器所做的工作,可以通过以下指令执行:

1
2
3
linux> as add.s -o add.o
linux> gcc -c add.s -o add.o
linux> gcc -c add.c -o add.o

这里的as便是汇编器,通过它可以生成一个称之为可重定位目标文件的文件。在编辑器是不能正确显示这个文件的,因为它是一种二进制格式文件。

可重定位目标文件是我们在这里所关注的重点。在Linux操作系统下,目标文件(例如这里的可重定位目标文件,以及后续链接生成的可执行目标文件等)遵从的格式称为ELF格式,在这篇文章会大致介绍这类格式,它是我们理解链接的基础。

1.4 链接

得到了 add.o之后,我们还需要进行进一步的链接操作。

所谓链接,就是将多个目标文件进行组合,得到最后的可执行程序。它是将各种代码和数据片段合并成单一文件的过程,我们称之为可执行目标文件。作为目标文件的一种,在Linux环境下它也遵从ELF的格式。

目前我们得到的只有一个 add.o 的可重定位目标文件。因此我们还需要一个 main主函数来调用 add 函数:

1
2
3
4
5
6
7
// main.c
#include<stdio.h>
int main(){
int a = 1, b = 2;
printf("%d", add(a, b));
return 0;
}

通过以下命令生成 main.c对应的main.o

1
linux> gcc -S main.c -o main.o

这时候得到了一个warning:

1
2
3
main.c: In function ‘main’:
main.c:4:18: warning: implicit declaration of function ‘add’ [-Wimplicit-function-declaration]
4 | printf("%d", add(a, b));

warning的内容是警告我们找不到add的函数定义。事实上我们应该在文件中提前定义好add函数格式:

1
2
3
4
5
6
7
#include<stdio.h>
int add(int, int);
int main(){
int a = 1, b = 2;
printf("%d", add(a, b));
return 0;
}

便可以消除这个警告。不过这个add函数内部是空的啊,它的内部实现在 add.c 文件里,我们如何将这个文件的函数和main.c结合呢?答案就是使用最终的链接操作。可以通过以下命令执行:

1
2
3
linux> ld -o add main.o add.o 
linux> gcc -o add main.o add.o
linux> gcc -o add main.c add.c

最终我们得到可执行目标文件 add。通过执行该目标文件,可以在命令行得到期望的输出: 3

2. 静态链接

透过上面对 add.c main.c的编译执行流程,我们了解了两种目标文件:可重定位目标文件(add.o main.o)以及可执行目标文件 (add)。

这两种目标文件都遵从ELF格式。为了方便研究这种格式,我们考虑以下实现交换数组数据的代码(其实是CSAPP的课后习题,摘自https://www.icourse163.org/course/NJU-1001625001?tid=1470930500 ,该课程主要针对32位系统架构IA32,这里我们换成x64架构进行学习):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
// main.c
int buf[2] = {1, 2};
void swap();

int main(){
swap();
return 0;
}

// swap.c
extern int buf[];

int *bufp0 = &buf[0];
static int *bufp1;

void swap(){
int tmp;
bufp1 = &buf[1];
tmp = *bufp0;
*bufp0 = *bufp1;
*bufp1 = tmp;
}

首先我们研究 main.c

1、定义了全局变量数组buf[]

2、声明了一个 void类型的函数swap(),但是没有具体实现;

3、定义了一个 int类型的函数 main()

其次研究 swap.c

1、定义了一个外部数组buf[]

2、定义了一个全局变量指针 bufp0,并赋初值 &buf[0]

3、定义了一个静态变量指针 bufp1,并且没有初始化(未初始化的全局变量或者静态变量默认为0或NULL);

4、定义了一个 void 类型函数 swap()

5、在 swap()函数内部,定义了一个局部变量 tmp

2.1 符号

符号是链接过程中最基本的概念。每个符号对应于一个函数、一个全局变量或一个静态变量。例如上述 main.c中的 bufswap、以及主函数 main,和 swap.c中的 bufbufp0bufp1swap。可以观察到两个文件之间的符号有所重合,链接器可以通过不同符号的绑定属性来统一考虑这些可能重合的符号(例如extern声明的 buf,它所代表的其实就是 main.c定义的buf,通过extern声明的符号的绑定属性其实是弱符号,与之对应的有强符号,后面会详细探讨)。其次局部变量 tmp 不属于符号,链接器不考虑局部变量。局部变量一般存储在用户栈空间或者寄存器内部。

那么全局变量和静态变量存储在哪呢?以下是计算机虚拟存储器的一个视图(摘自CSAPP):

最上面是操作系统内核区,其次便是用户栈。而我们的代码以及全局、静态变量存储在下面的load from the exec file 区域。代码作为只读数据,存储在只读代码段,而数据变存储在其上面的读写数据段。它们是通过可执行目标文件(即链接后的目标文件)加载到主存的。

一般为了构造可执行目标文件,链接器需要完成两个任务:

1、符号解析。对于不同文件的不同符号,可能存在符号定义(即新定义一个符号)和符号引用(即使用一个符号,这个符号需要定义过,但不一定要在本文件(或者本模块)定义)。符号解析所要干的事情就是将所有各自的模块中的符号引用与所有模块的一个大集合中的符号定义相关联。例如 main.c中main函数内部使用了 swap函数,即引用了 swap 符号,链接器需要确定它和 main.c中声明的 swap 函数(函数无内容,为弱符号,后续会提及强弱符号)关联还是和 swap.c 中定义的 swap 函数(有内容,为强符号)关联。事实上用屁股想都知道是和后者关联。

2、重定位。重定位就是对所有的符号引用的地方,把合并后的可执行目标文件装入存储器后内存里各个符号的位置写入到原有的位置。例如我们反编译一下 main 模块:

1
linux> objdump -d main.o > main.txt

得到以下反汇编信息:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

main.o: file format elf64-x86-64


Disassembly of section .text:

0000000000000000 <main>:
0: f3 0f 1e fa endbr64
4: 55 push %rbp
5: 48 89 e5 mov %rsp,%rbp
8: b8 00 00 00 00 mov $0x0,%eax
d: e8 00 00 00 00 call 12 <main+0x12>
12: b8 00 00 00 00 mov $0x0,%eax
17: 5d pop %rbp
18: c3 ret

可以发现,在call命令这里,没法通过反汇编信息看出我们call的是哪个函数。我们知道call的应该是 swap 模块的 swap 过程,但是由于这里我们还没有进行链接,因此 call 这里的偏移量设置成为了0。后续链接之后,这里的偏移量会被重新覆盖:

1
2
3
4
5
6
7
8
9
000000000000116c <main>:
116c: f3 0f 1e fa endbr64
1170: 55 push %rbp
1171: 48 89 e5 mov %rsp,%rbp
1174: b8 00 00 00 00 mov $0x0,%eax
1179: e8 ab ff ff ff call 1129 <swap>
117e: b8 00 00 00 00 mov $0x0,%eax
1183: 5d pop %rbp
1184: c3 ret

进行链接后的main方法中的call内部偏移量不为0,它被覆盖成了 ab ff ff ff。这种地址偏移量(或者绝对地址)值的覆盖就是重定位,而这个值是需要通过前面的符号解析和最终文件的合并来得出的。本文章不会介绍这些模块(可重定位目标文件)具体是如何合并的,只会说个大概。

你可能会有疑问, main 模块声明的 swap 怎么消失了呢?这是因为 swap 只是个声明,不包含实际代码,因此它不在反汇编 Disassembly of section .text: 下面显示。

2.2 可重定位目标文件

可重定位目标文件遵从ELF文件格式。ELF文件格式大致如下(摘自CSAPP):

在可重定位目标文件当中,第二部分(段头表)是没有的,我们这里主要来看看其它部分。

1、ELF头:即ELF的头部部分。首先它拥有16个字节的魔数序列,这个序列包含了文件的类型和格式信息。其次剩余部分则包含了机器类型、节头表(最下面的部分)的位置偏移等帮助链接器进行语法分析和解释的信息。

可以通过以下命令解析ELF头:

1
linux> readelf -h main.o

得到:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
ELF Header:
Magic: 7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00
Class: ELF64 # ELF文件格式为ELF64,这是通过解析Magic Number得出的
Data: 2's complement, little endian # 使用二进制补码,小端方式存储
Version: 1 (current)
OS/ABI: UNIX - System V
ABI Version: 0
Type: REL (Relocatable file) # 可重定位目标文件
Machine: Advanced Micro Devices X86-64
Version: 0x1
Entry point address: 0x0
Start of program headers: 0 (bytes into file) # 没有程序头表,因为是可重定位目标文件
Start of section headers: 560 (bytes into file) # 段头表位置
Flags: 0x0
Size of this header: 64 (bytes) # ELF头占64Bytes
Size of program headers: 0 (bytes)
Number of program headers: 0
Size of section headers: 64 (bytes) # 节头表表项占64Bytes
Number of section headers: 13 # 节头表有13个表项
Section header string table index: 12

2、节头表:即ELF的尾部部分。在可重定位目标文件中,节是一个单位,以.为开头(如.text)表示的都是一个一个节。节中都是字节序列,但是同一个节中的内容的性质相同。而节头表则存储了这些节的一些信息。例如每个节的节名、在ELF文件中的位置、节的大小等等。节头表本身是一个表,也就是一个结构体数组,每个结构体定义如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
typedef struct
{
Elf32_Word sh_name; /* Section name (string tbl index) */
Elf32_Word sh_type; /* Section type */
Elf32_Word sh_flags; /* Section flags */
Elf32_Addr sh_addr; /* Section virtual addr at execution */
Elf32_Off sh_offset; /* Section file offset */
Elf32_Word sh_size; /* Section size in bytes */
Elf32_Word sh_link; /* Link to another section */
Elf32_Word sh_info; /* Additional section information */
Elf32_Word sh_addralign; /* Section alignment */
Elf32_Word sh_entsize; /* Entry size if section holds table */
} Elf32_Shdr;

可以通过以下命令解析节头表:

1
linux> readelf -S main.o

得到:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
There are 13 section headers, starting at offset 0x230:

Section Headers:
[Nr] Name Type Address Offset
Size EntSize Flags Link Info Align
[ 0] NULL 0000000000000000 00000000
0000000000000000 0000000000000000 0 0 0
[ 1] .text PROGBITS 0000000000000000 00000040
0000000000000019 0000000000000000 AX 0 0 1
[ 2] .rela.text RELA 0000000000000000 00000190
0000000000000018 0000000000000018 I 10 1 8
[ 3] .data PROGBITS 0000000000000000 00000060
0000000000000008 0000000000000000 WA 0 0 8
[ 4] .bss NOBITS 0000000000000000 00000068
0000000000000000 0000000000000000 WA 0 0 1
[ 5] .comment PROGBITS 0000000000000000 00000068
0000000000000027 0000000000000001 MS 0 0 1
[ 6] .note.GNU-stack PROGBITS 0000000000000000 0000008f
0000000000000000 0000000000000000 0 0 1
[ 7] .note.gnu.pr[...] NOTE 0000000000000000 00000090
0000000000000020 0000000000000000 A 0 0 8
[ 8] .eh_frame PROGBITS 0000000000000000 000000b0
0000000000000038 0000000000000000 A 0 0 8
[ 9] .rela.eh_frame RELA 0000000000000000 000001a8
0000000000000018 0000000000000018 I 10 8 8
[10] .symtab SYMTAB 0000000000000000 000000e8
0000000000000090 0000000000000018 11 3 8
[11] .strtab STRTAB 0000000000000000 00000178
0000000000000016 0000000000000000 0 0 1
[12] .shstrtab STRTAB 0000000000000000 000001c0
000000000000006c 0000000000000000 0 0 1
Key to Flags:
W (write), A (alloc), X (execute), M (merge), S (strings), I (info),
L (link order), O (extra OS processing required), G (group), T (TLS),
C (compressed), x (unknown), o (OS specific), E (exclude),
D (mbind), l (large), p (processor specific)

第一行说明节头表在位置 0x230 处,这和ELF头中给出的560一致。

然后节头表描述了13个节各自的信息,例如名字(.text,.data等等),大小等等。

3、.text:是一个节。节中包含着该可重定位目标文件的代码段。我们知道汇编之后的代码段是二进制形式,因此这里是无法查看的。

4、.rodata:是一个节。节中包含着只读数据。例如switch语句中可能生成的跳转表。

5、.data:是一个节。节中包含着已经初始化的全局和静态变量。关于这些值对应的哪些变量的信息在后续的.symtab(符号表节)给出。

6、.bss:是一个节。节中包含着初始化的全局和静态变量与初始化为0的变量。这个节其实只是意义上的一个节,它在ELF文件中只是个占位符,不占据硬盘空间。因为.data包含的是值,所以.bss包含的理论上也应该是值,然而未初始化的变量默认为0,因此可以考虑优化掉这些空间。

7、.symtab:是一个节。节中存着一个符号表,它存放的是符号相关信息。符号表和节头表一样是个结构体数组,结构体定义如下:

1
2
3
4
5
6
7
8
9
typedef struct
{
Elf64_Word st_name; /* Symbol name (string tbl index) */
unsigned char st_info; /* Symbol type and binding */
unsigned char st_other; /* Symbol visibility */
Elf64_Section st_shndx; /* Section index */
Elf64_Addr st_value; /* Symbol value */
Elf64_Xword st_size; /* Symbol size */
} Elf64_Sym;

每一个表项(结构体)定义了符号的名字、在对应节中的偏移量位置、符号占用字节数(变量为变量大小,函数为函数内部机器指令共占用字节大小)、符号对应的节、符号的类型(数据还是函数,或者未定义)以及符号的绑定属性(强弱全局符号或者局部符号即static)

可以通过以下命令来解析符号表:

1
linux> readelf -s main.o

得到:

1
2
3
4
5
6
7
8
Symbol table '.symtab' contains 6 entries:
Num: Value Size Type Bind Vis Ndx Name
0: 0000000000000000 0 NOTYPE LOCAL DEFAULT UND
1: 0000000000000000 0 FILE LOCAL DEFAULT ABS main.c
2: 0000000000000000 0 SECTION LOCAL DEFAULT 1 .text
3: 0000000000000000 8 OBJECT GLOBAL DEFAULT 3 buf
4: 0000000000000000 25 FUNC GLOBAL DEFAULT 1 main
5: 0000000000000000 0 NOTYPE GLOBAL DEFAULT UND swap

符号表第3个表项显示buf符号的信息。它在第3个节(即.data节),占用8个字节,为OBJECT(数据),为全局符号。

符号表第4个表项显示main符号的信息。它在第1个节(即.text节),占用25个字节(和前面对应上了),为FUNC(函数),为全局符号。

符号表第5个表项显示swap符号的信息。它所在的节是个伪节 UNDEF,代表未定义的符号。main 模块只是声明了这个符号,但并没有给出完整的定义,完整的定义在 swap 模块。

同样,解析 swap.o 的符号表:

1
2
3
4
4: 0000000000000000     8 OBJECT  LOCAL  DEFAULT    4 bufp1
5: 0000000000000000 8 OBJECT GLOBAL DEFAULT 5 bufp0
6: 0000000000000000 0 NOTYPE GLOBAL DEFAULT UND buf
7: 0000000000000000 67 FUNC GLOBAL DEFAULT 1 swap

由于 bufp1 是静态变量,它的使用被限制在了这个模块,因此它是一种局部符号。 而其余符号则是全局符号

8、.rel.text与.rel.data:是节,都存储着关于该模块的重定位条目表。当汇编器遇到对一个未知位置的引用(例如上述 main.o 的反汇编信息

d: e8 00 00 00 00 call 12 <main+0x12>),就会生成对应的重定位条目。如果是命令遇到的引用,生成的重定位条目存储在.rel.text中;如果是数据遇到的引用(例如给全局变量定义时用另一个全局变量进行初始化),生成的重定位条目存储在.rel.data中。重定位条目内部包含:需要修改的地址引用相对于其所在节的偏移(即哪里引用的)、应该指向的符号以及重定位类型。ELF定义了很多重定位类型,比如:

  • R_X86_64_PC32:所覆盖的地址使用PC相对寻址,即引用位置的下一条命令的位置和符号位置之间的差值;
  • R_X86_64_32:绝对寻址。

可以通过以下命令解析重定位条目:

1
linux> readelf --relocs swap.o

得到以下内容:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Relocation section '.rela.text' at offset 0x1f0 contains 6 entries:
Offset Info Type Sym. Value Sym. Name + Addend
00000000000b 000600000002 R_X86_64_PC32 0000000000000000 buf + 0
000000000012 000300000002 R_X86_64_PC32 0000000000000000 .bss - 4
000000000019 000500000002 R_X86_64_PC32 0000000000000000 bufp0 - 4
000000000025 000300000002 R_X86_64_PC32 0000000000000000 .bss - 4
00000000002c 000500000002 R_X86_64_PC32 0000000000000000 bufp0 - 4
000000000037 000300000002 R_X86_64_PC32 0000000000000000 .bss - 4

Relocation section '.rela.data.rel' at offset 0x280 contains 1 entry:
Offset Info Type Sym. Value Sym. Name + Addend
000000000000 000600000001 R_X86_64_64 0000000000000000 buf + 0

Relocation section '.rela.eh_frame' at offset 0x298 contains 1 entry:
Offset Info Type Sym. Value Sym. Name + Addend
000000000020 000200000002 R_X86_64_PC32 0000000000000000 .text + 0

可以发现,对于.rel.text中所有的重定位条目,所有的重定位类型都是R_X86_64_PC32。

9、.strtab:是一个节。节存储着一张字符串表。例如.symtab内部的符号名字(Elf64_Word 格式定义的 Name)以及节头表内部存储着各个节的名字,都是一种整数格式,它代表着在字符串表当中相对于节头的偏移。

2.3 静态库文件(.a)

作为程序员,我们对库这个概念并不陌生。在ISO C99标准内定义了一个标准库 libc.a ,它是系统自带的静态库。在老版本系统上作为一个默认被链接的对象和目标文件进行链接(当然现在一般采用动态链接技术,这里我们所接触的都是静态链接)。

静态库是一系列可重定位目标文件的集合,可以使用 ar 工具进行创建。例如我们想将 main 模块和 swap 模块进行打包,可以输入以下命令:

1
linux> ar rcs mylib.a swap.o main.o

这样就在本地生成了 mylib.a 静态库。

需要记住的是,静态库可以认为是一系列可重定位目标文件 .o 的集合。在链接过程中,通过在静态库当中寻找当前还未被解析的符号,来从中抽取一些 .o 文件来进行链接。所以就算标准静态库 libc.a 有5MB那么大,生成的可执行目标文件的大小也只是以KB为单位。(本例的 main 可执行目标文件只有十几KB)

2.4 符号解析过程

符号解析如我们之前所说,是将符号的引用与符号的定义之间进行关联。在符号解析这个过程,便是链接错误产生的过程(

根据符号的绑定属性,分为以下几种:

1、局部符号。这种符号只在某个模块内部生效。

2、全局符号的强符号。它代表函数与初始化的全局变量。

3、全局符号的弱符号。它代表未初始化的全局变量。

在符号解析的过程中,可能存在同一个符号被定义多次(即多重定义)。因此Linux链接器使用以下规则来从多重符号中进行选择:

1、同名强符号只允许存在一个。

2、如果一个强符号和多个弱符号重名,选择强符号。

3、如果多个弱符号重名,则随机选择一个。

因此,我们不能在多个模块同时定义同一个初始化的全局变量,或者定义同名函数。

然而我们却可以同时定义多个同名的未初始化的全局变量,这个是不会报错的,但是极不推荐!具体相关例子可以参考南大ICS课程:https://www.icourse163.org/learn/NJU-1001625001?tid=1470930500#/learn/content?type=detail&id=1255034632&cid=1286661897

在链接过程中,链接器是根据你输入到命令行的文件(包括可重定位目标文件与静态库文件)的顺序来顺序地进行解析。

具体地,链接器会维护以下三个集合:

E:可重定位目标文件的集合。这包括命令行输入的可重定位目标文件以及静态库内部被抽取的可重定位目标文件;

U:在目前已经遍历到的文件中,解析过程所没能解析出的符号;

D:已定义的符号。

链接过程如下:

1、对于命令行输入的文件,如果是可重定位目标文件,则加入集合E,同时根据可重定位目标文件中定义和引用的符号来修改集合U和D。然后进行下一个文件读入;

2、如果是静态库文件,则尝试对目前集合U中的符号进行匹配。若在静态库中的某个文件成员.o内部匹配成功,则将该文件成员加入到E中,同时与第一步一样进行集合U和D的修改。然后反复进行U中的符号匹配,直到U和D集合不再变化,则进行下一个文件读入。

为了解释清楚,我们稍微修改一下 swap 模块:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
// swap.c
#include<stdio.h>
extern int buf[];

int *bufp0 = &buf[0];
static int *bufp1;

void swap(){
int tmp;
bufp1 = &buf[1];
tmp = *bufp0;
*bufp0 = *bufp1;
*bufp1 = tmp;

printf("swap complete!"); // 加入输出函数
}

// main.c
int buf[2] = {1, 2};
void swap();

int main(){
swap();
return 0;
}

然后我们使用以下命令进行链接:

1
linux> gcc -o main main.o swap.o

考虑符号解析过程:

1、E集合加入目标文件 main.o 。此时D中已解析符号有:bufmain ,而U中存在未解析符号 swap(因为main函数内部对该符号进行了引用);

2、E集合加入目标文件 swap.o 。此时D中加入新的已解析符号:bufp0。然后该模块内部引用了符号 bufbufp0printf 和局部符号 bufp1 。对于 U 中未解析符号 swap ,在本模块给出了定义,因此将其转入集合D。同时由于 printf 尚未解析,将其加入集合 U;

3、链接器默认链接静态库文件 libc.a 。此时在静态库内部寻找U中 printf 符号的定义,发现在 printf.o 内部存在定义,因此将 printf 符号转入集合D。同时也将 printf.o 内部的定义符号加入集合D,新的未解析符号加入集合U;

4、继续在 libc.a 中往复上述过程,直至U集合为空。

2.5 重定位

确定好了集合E中需要使用的可重定位目标文件以及符号引用与符号定义之间的关联,接下来就需要将引用处的地址进行覆盖了,也就是重定位。重定位过程大致分为以下三个步骤(摘自南大ICS):

1、合并相同的节。将所有可重定位目标文件中相同的节进行合并,例如.text节内部的代码进行合并,方便将来统一装入内存运行。

2、对定义符号进行重定位。其实就是将节合并后的文件中每个定义的符号的地址进行确定,对于函数即其首条指令的首地址,对于数据即其在合并后的.data中的地址。

3、对引用符号进行重定位。每一个引用符号都对应于上述我们讲过的重定位条目,它们是存在.rel开头的节中的。在这步需要通过遍历这些条目,一步一步用上面得到的定义符号的地址进行覆盖。当然不完全是覆盖,例如PC相对地址的重定位方式,它所要覆盖的运行时地址是需要进行相关计算的。有时候在可重定位目标文件中上面给出的地址(例如上面d: e8 00 00 00 00 call 12 <main+0x12> 中的机器数0,有时候不一定是0)是需要参与计算的,这与重定位类型有关,每个重定位类型都对应着一个覆盖地址计算公式。

重定位过后,每个符号的引用都填入了正确的实际地址,于是生成了最后的可执行目标文件。

2.6 可执行目标文件

可执行目标文件作为一种目标文件,同样在Linux环境下遵循ELF文件格式。

我们可以使用以下命令读取 main 文件的ELF头:

1
linux> readelf -h main

得到结果如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
ELF Header:
Magic: 7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00
Class: ELF64 # ELF文件格式为ELF64,这是通过解析Magic Number得出的
Data: 2's complement, little endian # 使用二进制补码,小端方式存储
Version: 1 (current)
OS/ABI: UNIX - System V
ABI Version: 0
Type: DYN (Position-Independent Executable file) # 位置无关可执行文件
Machine: Advanced Micro Devices X86-64
Version: 0x1
Entry point address: 0x1060 # 程序入口地址
Start of program headers: 64 (bytes into file) # 程序头表
Start of section headers: 14136 (bytes into file)
Flags: 0x0
Size of this header: 64 (bytes)
Size of program headers: 56 (bytes) # 程序头表表项占用56Bytes
Number of program headers: 13 # 有13个表项
Size of section headers: 64 (bytes)
Number of section headers: 31
Section header string table index: 30

可以和上面可重定位目标文件的ELF头进行对比:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
ELF Header:
Magic: 7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00
Class: ELF64 # ELF文件格式为ELF64,这是通过解析Magic Number得出的
Data: 2's complement, little endian # 使用二进制补码,小端方式存储
Version: 1 (current)
OS/ABI: UNIX - System V
ABI Version: 0
Type: REL (Relocatable file) # 可重定位目标文件
Machine: Advanced Micro Devices X86-64
Version: 0x1
Entry point address: 0x0
Start of program headers: 0 (bytes into file) # 没有程序头表,因为是可重定位目标文件
Start of section headers: 560 (bytes into file) # 段头表位置
Flags: 0x0
Size of this header: 64 (bytes) # ELF头占64Bytes
Size of program headers: 0 (bytes)
Number of program headers: 0
Size of section headers: 64 (bytes) # 节头表表项占64Bytes
Number of section headers: 13 # 节头表有13个表项
Section header string table index: 12

可以发现,首先是我们ELF文件类型变成了位置无关的可执行文件,其次ELF文件内部新增了程序头表。

在可执行目标文件中,ELF文件被分成一个一个段,每个段内又分成一个一个节。例如(摘自CSAPP):

开头是ELF头,其次是可执行目标文件中特有的程序头表(段头表),然后接下来黄色的三个节属于一个段,我们称之为只读内存段,它包含着.text、.rodata只读数据节和新的.init节,它们都是只读的数据或者代码,独属于一个段。.init节内部定义了一个_init函数,在程序通过ELF头中规定的入口地址进行执行的时候,会在初始化过程中调用这个函数,只需了解即可。接下来两个蓝色的节属于另一个段,我们称之为读/写内存段,它包含.data和.bss节。另外ELF文件还包含着其它段,这些段的信息在程序头表内部有所定义。程序头表本身是个结构体数组,其结构体定义如下:

1
2
3
4
5
6
7
8
9
10
typedef struct {
Elf64_Half p_type; /* entry type */
Elf64_Half p_flags; /* flags */
Elf64_Off p_offset; /* offset */
Elf64_Addr p_vaddr; /* virtual address */
Elf64_Addr p_paddr; /* physical address */
Elf64_Xword p_filesz; /* file size */
Elf64_Xword p_memsz; /* memory size */
Elf64_Xword p_align; /* memory & file alignment */
} Elf64_Phdr;

通过以下命令解析程序头表:

1
linux> readelf -l main

可得:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Elf file type is DYN (Position-Independent Executable file)
Entry point 0x1060
There are 13 program headers, starting at offset 64

Program Headers:
Type Offset VirtAddr PhysAddr
FileSiz MemSiz Flags Align
PHDR 0x0000000000000040 0x0000000000000040 0x0000000000000040
0x00000000000002d8 0x00000000000002d8 R 0x8
INTERP 0x0000000000000318 0x0000000000000318 0x0000000000000318
0x000000000000001c 0x000000000000001c R 0x1
[Requesting program interpreter: /lib64/ld-linux-x86-64.so.2]
LOAD 0x0000000000000000 0x0000000000000000 0x0000000000000000
0x0000000000000640 0x0000000000000640 R 0x1000
LOAD 0x0000000000001000 0x0000000000001000 0x0000000000001000
0x00000000000001cd 0x00000000000001cd R E 0x1000
LOAD 0x0000000000002000 0x0000000000002000 0x0000000000002000
0x000000000000011c 0x000000000000011c R 0x1000
LOAD 0x0000000000002db8 0x0000000000003db8 0x0000000000003db8
0x0000000000000268 0x0000000000000278 RW 0x1000
DYNAMIC 0x0000000000002dc8 0x0000000000003dc8 0x0000000000003dc8
0x00000000000001f0 0x00000000000001f0 RW 0x8
NOTE 0x0000000000000338 0x0000000000000338 0x0000000000000338
0x0000000000000030 0x0000000000000030 R 0x8
NOTE 0x0000000000000368 0x0000000000000368 0x0000000000000368
0x0000000000000044 0x0000000000000044 R 0x4
GNU_PROPERTY 0x0000000000000338 0x0000000000000338 0x0000000000000338
0x0000000000000030 0x0000000000000030 R 0x8
GNU_EH_FRAME 0x0000000000002014 0x0000000000002014 0x0000000000002014
0x000000000000003c 0x000000000000003c R 0x4
GNU_STACK 0x0000000000000000 0x0000000000000000 0x0000000000000000
0x0000000000000000 0x0000000000000000 RW 0x10
GNU_RELRO 0x0000000000002db8 0x0000000000003db8 0x0000000000003db8
0x0000000000000248 0x0000000000000248 R 0x1

Section to Segment mapping:
Segment Sections...
00
01 .interp
02 .interp .note.gnu.property .note.gnu.build-id .note.ABI-tag .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt
03 .init .plt .plt.got .plt.sec .text .fini
04 .rodata .eh_frame_hdr .eh_frame
05 .init_array .fini_array .dynamic .got .data .bss
06 .dynamic
07 .note.gnu.property
08 .note.gnu.build-id .note.ABI-tag
09 .note.gnu.property
10 .eh_frame_hdr
11
12 .init_array .fini_array .dynamic .got

第3个段包含了.init,.text等代码信息,可以发现它的类型是LOAD,即该段是可装入段。后面也给出了它装入内存的虚拟地址和物理地址(二者是相等的),以及执行权限(R E,即可读,不可写,可执行)。

第5个段包含了.data,.bss等数据信息,它的类型也是LOAD。同时它拥有RW权限,即可读可写不可执行。

需要注意的是,可执行目标文件中没有.rel开头的段,因为它已经不需要被重定位了。

另外这里每一个段都有个Align,代表对齐要求。对于任何段s,链接器必须选择一个该段的起始地址 ,满足: 这是为了将可执行目标文件装入内存的效率提高,具体原理在于虚拟内存的组织方式。

2.7 加载

在shell内部通过输入以下命令进行程序加载:

1
linux> ./main

shell加载一个程序时,会通过调用 execve 函数来启动操作系统的加载器,从而在shell的上下文中创建一个 main 的进程,它是shell的子进程,将 main 可执行目标文件装入内存后将跳转到程序的入口点(在ELF文件头中有给出,其实是 _start 函数的地址)进行初始化,然后调用用户层的 main 函数,处理返回值后将控制返回给内核。

3. 动态链接

事实上上述我们讨论的部分都属于静态链接。但是我们所运行的结果都是建立在现在大规模普及的动态链接的基础上(即,上述有个例子讲述了我们是怎么链接 libc.a 的。事实上根本没有 libc.a ,取而代之的是对应的共享库 libc.so ,它是通过动态链接而链接到程序内部的)

我们稍微讨论一下动态链接。由于笔者也没有多么深入,因此以下内容仅供参考,建议可以系统学习后参考本文进行总结。

3.1 共享库

共享库是一种目标文件,本身在Linux平台也遵从ELF文件格式。与静态库文件不同的是,共享库可以在程序进行静态链接后生成可执行目标文件且被装入内存后,将其内部的代码和数据动态地装入主存并供调用。

共享库相比静态库,有着省空间、可灵活更改的优点。想象一下,每一个可执行目标文件都包含着 libc.a 静态库内部的符号,它们之间会有很大的重复,这会造成很大的硬盘空间浪费。

由于共享库是动态被装载到内存中的,因此需要确保装载的代码是位置无关代码,接下来我们介绍一下位置无关代码。

3.2 位置无关代码

位置无关代码具有以下两个特征(摘自南大ICS):

1、保证共享库的代码在主存中的位置是不确定的;

2、即使代码长度发生变化,也不影响调用它的程序。

可以通过以下命令生成位置无关代码对应的可重定位目标文件:

1
linux> gcc -c -fPIC main.o swap.o

所谓的位置无关,就是在代码内部进行符号引用的时候,可以不通过自己本身代码的位置来获得相关符号的信息。我们前面了解过的一个重定位类型:R_X86_64_PC32,即PC相对寻址,它是一种需要当前代码地址(即位置相关)的重定位方式。因此之前生成的可重定位目标文件不是位置无关代码。

通过指定 -fPIC 选项可以生成位置无关代码。生成后可以通过 readelf --relocs swap.o 命令来查看重定位条目:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Relocation section '.rela.text' at offset 0x228 contains 6 entries:
Offset Info Type Sym. Value Sym. Name + Addend
00000000000b 00060000002a R_X86_64_REX_GOTP 0000000000000000 buf - 4
000000000016 000300000002 R_X86_64_PC32 0000000000000000 .bss - 4
00000000001d 00050000002a R_X86_64_REX_GOTP 0000000000000000 bufp0 - 4
00000000002c 000300000002 R_X86_64_PC32 0000000000000000 .bss - 4
000000000033 00050000002a R_X86_64_REX_GOTP 0000000000000000 bufp0 - 4
000000000041 000300000002 R_X86_64_PC32 0000000000000000 .bss - 4

Relocation section '.rela.data.rel' at offset 0x2b8 contains 1 entry:
Offset Info Type Sym. Value Sym. Name + Addend
000000000000 000600000001 R_X86_64_64 0000000000000000 buf + 0

Relocation section '.rela.eh_frame' at offset 0x2d0 contains 1 entry:
Offset Info Type Sym. Value Sym. Name + Addend
000000000020 000200000002 R_X86_64_PC32 0000000000000000 .text + 0

可以发现,除去.bss这种特殊的符号,其余我们需要的重定位条目的重定位类型都改成了R_X86_64_REX_GOTP。这种方式可以消除代码对PC位置的依赖,从而达到位置无关。

有了位置无关的可重定位目标文件,我们就可以生成我们自己的共享库 mylib.so

1
linux> gcc -shared -fPIC -o mylib.so main.o swap.o

3.3 动态链接过程

加载时动态链接过程大致如下(摘自CSAPP):

首先,共享库 libc.solibvector.so 都作为静态链接对象和可重定位目标文件进行链接。这里链接的目的是为了完成相关的符号解析,而没有进行重定位。真正的重定位在后续可执行目标文件装入内存后动态链接器执行的。

这种可执行目标文件内部有一个特殊的段.interp,它包含动态链接器(ld-linux.so ,本身就是个共享库)的路径,让shell调用execve后将控制传递给这个加载进内存的动态链接器。接着动态链接器会根据与共享库静态链接的信息来加载libc.solibvector.so,并完成重定位。

除去加载时动态链接,Linux系统为动态链接器提供了一系列运行时动态链接的接口,允许应用在运行时加载和链接共享库。这叫做运行时动态链接。

Linux定义了一系列接口,如 dlopendlsym 等,头文件为 dlfcn.h ,我们可以直接使用这些接口。

3.4 重定位

由于共享库文件是位置无关的,因此它们和外部程序引用它们的时候需要采取一些特殊的重定位策略。

对于某个共享库文件的模块内部之间函数互相调用,由于它们同在一个固定模块中,即便它们在内存中的位置不确定,但相对位置之差是固定的,因此可以使用相对寻址。

而对于模块内部的数据调用,调用的命令在.text区域,数据加载在.data区域。同一个模块在加载的时候是可以知道它们之间的相对位置的,因此可以通过某些指令获得当前的PC值,采用PC相对寻址方式来访问数据。

因此难点在于模块之间的数据、函数调用。

3.5 GOT

引用不同模块的数据,可以基于以下事实:代码段中任何指令和数据段中任何变量之间的距离都是一个运行时常量

因此编译器在数据段开始的地方创建了一个表,叫做全局偏移量表(GOT)。GOT可以看做是一个指针数组,编译器会在编译的时候对每一个GOT项确定一个重定位项,在后续动态链接装载的时候会实时对对应的GOT项进行重定位,填入不同模块数据的地址。

例如某个程序内部需要引用一个数据 addcnt,而它的定义在共享库 libvector.so 中。编译器会在数据段.data头部创建一个指针数组GOT,并将符号 addcnt 与GOT的一项对应并生成对应的重定位条目。在程序执行的时候,libvector.so 装入主存时会将数据 addcnt 的地址填入对应的GOT表。

事实上对于同一个模块内部的数据调用,也使用GOT方案。

3.6 PLT

模块间的函数调用,主要使用的是一个称之为延迟绑定的技术。它的主要动机是想让函数的重定位延迟到调用其的第一次才发生。这需要代码段中的过程链接表(PLT)支持。PLT是一个数组,每个条目都是16字节的可运行代码。简单来讲,一个模块调用另一个模块的函数,会先进入该函数对应的PLT条目开始运行代码,代码的主要功能是跳转到动态链接器中并由动态链接器将PLT中的代码改成直接跳到函数地址的代码。以后每次都可以通过进入对应的PLT条目来调用对应的函数。

4. 总结

CSAPP的链接这一章写的着实抽象,无论是看视频还是看书都搞不懂。因此我花了几天时间专门试图去弄懂关于链接的概念,也因此作了本篇笔记。笔记内部包含了不少个人对链接的理解,可能有所谬误,望谅解。

链接是个很大的话题,感觉和编译原理一样,需要真正弄懂的话要花很大力气。关于动态链接的详细部分,以后有时间再作功课!

寒假学习计划

1、自学 CMU 15-213 课程,并完成课程要求的相关lab

2、自学计网

3、初步掌握java

4、力扣Hot 100,争取用java实现

5、洛谷题单

第六学期学习计划(初步)

1、继续学计网

2、操作系统

3、数据库

4、大创,nlp

代码块测试

C++

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
#include<bits/stdc++.h>
typedef long long ll;
using namespace std;
const int _ = 2333;
int n, K;
int f[_], a[_];
bool check(ll mid){
int cnt = n;
for(int i = 2; i <= n; ++i){
f[i] = i - 1;
for(int j = 1; j < i; ++j){
if(abs(a[i]-a[j]) <= (i - j) * mid)
f[i] = min(f[i], f[j] + i - j - 1);
}
cnt = min(cnt, f[i] + n - i);
}
return cnt <= K;
}
int main(){
ios::sync_with_stdio(0);
cin.tie();
cin >> n >> K;
for(int i = 1; i <= n; ++i)
cin >> a[i];
ll l = 0, r = 2e9;
ll ans=2e9;
while(l <= r){
ll mid = l + r >> 1;
if(check(mid)) ans = mid, r = mid - 1;
else l = mid + 1;
}
cout << ans;
return 0;
}

java

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
package com.goodnuaa;

import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.ResponseBody;

@Controller
public class MyController {

@RequestMapping("/resp")
@ResponseBody
String resp(){
return "Atri Kawaii";
}
}

python

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
from sklearn.preprocessing import StandardScaler, MinMaxScaler
from sklearn.model_selection import KFold, train_test_split
import numpy as np
from libsvm.svmutil import *

import read

def classify(param_str="-t 2 -c 1", scaler=None):
# 读入、划分数据集
X_array, y_array = read.getdata()
X_train, X_val, y_train, y_val = train_test_split(X_array, y_array, test_size=0.3, random_state=42)

# 标准化
if scaler is not None:
X_train = scaler.fit_transform(X_train)
X_val = scaler.fit_transform(X_val)

prob = svm_problem(y_train.tolist(), X_train.tolist())

# 设置超参数
param = svm_parameter(param_str)

# SMO训练SVM
model = svm_train(prob, param)

print("\nvalid acc: ")
labels, acc, vals = svm_predict(y_val.tolist(), X_val.tolist(), model)

# print(acc)
print("train acc: ")
labels, acc, vals = svm_predict(y_train.tolist(), X_train.tolist(), model)

# print(acc)

if __name__ == "__main__":

# 选择归一化方式
# scaler = MinMaxScaler()
scaler = StandardScaler()
# scaler = None

classify(scaler=scaler)

0%