查看原文
其他

一个奇怪的链接问题

守望先生 编程珠玑 2021-01-31


前言

链接是代码生成可执行文件中一个非常重要的过程。我们在使用一些库函数时,有时候需要链接库,有时候又不需要,这是为什么呢?了解一些链接的基本过程,能够帮助我们在编译时解决一些疑难问题。比如,下面就有一种奇怪的现象。

一个奇怪的链接问题

程序功能很简单,计算e的n次方。程序清单如下(代码一):

#include<stdio.h>
#include<math.h>
int main(int argc,char *argv[])
{
    double a = exp(2);
    printf("%lf\n",a);
    return 0;
}

编译运行:

gcc -o expTest expTest.c
./expTest
7.389056

一切似乎顺理成章,我们再来看下面这种情况,将变量b=2传入exp函数(代码二):

#include<stdio.h>
#include<math.h>
int main(int argc,char *argv[])
{
    int b = 2;
    double a = exp(b);
    printf("%lf\n",a);
    return 0;
}

编译:

gcc -o expTest expTest.c
/tmp/ccx5lXbS.o:在函数‘main’中:
expTest.c:(.text+0x20):对‘exp’未定义的引用
collect2: error: ld returned 1 exit status

我们发现,同样的编译方法编译不过了,提示对‘exp’未定义的引用,并且抛出链接出错。

我们通过man命令查看exp函数:

man 3 exp
NAME
       exp, expf, expl - base-e exponential function

SYNOPSIS
       #include <math.h>

       double exp(double x);
       float expf(float x);
       long double expl(long double x);

       Link with -lm.

发现它除了需要包含头文件math.h外,编译时还需要使用-lm链接。
再次编译运行:

gcc -lm -o  expTest expTest.c 
/tmp/ccYT3E65.o:在函数‘main’中:
expTest.c:(.text+0x20):对‘exp’未定义的引用
collect2: error: ld returned 1 exit status

为什么还是不行呢?我们已经按照帮助手册的只是加了-lm了啊?难道是位置不对?我们换个位置试试:

gcc -o  expTest expTest.c -lm 
./expTest
7.389056

现在终于成功编译并运行。

分析

虽然最后终于成功编译运行,但是不免产生了几个疑问:

  • 两段代码同样都调用了exp函数,为什么一个需要链接,一个不需要链接呢?

  • 到底什么时候需要链接呢?

  • 为什么链接的时候放在前面就不行呢?

我们一一解答。
1.为什么一个需要链接,一个不需要?
我们可以观察到,代码一调用exp传入的参数是常量2,代码二调用exp传入的参数是变量b,那么对于代码一会不会在运行之前就计算好了呢?
我们来看一下它们的汇编代码。
代码一:

.LC1:
        .string "%lf\n"
main:
        push    rbp
        mov     rbprsp
        sub     rsp, 32
        mov     DWORD PTR [rbp-20]edi
        mov     QWORD PTR [rbp-32]rsi
        movsd   xmm0QWORD PTR .LC0[rip]
        movsd   QWORD PTR [rbp-8]xmm0
        movsd   xmm0QWORD PTR [rbp-8]
        mov     ediOFFSET FLAT:.LC1
        mov     eax, 1
        call    printf
        mov     eax, 0
        leave
        ret
.LC0:
        .long   3100958126
        .long   1075678820

代码二:

.LC0:
        .string "%lf\n"
main:
        push    rbp
        mov     rbprsp
        sub     rsp, 32
        mov     DWORD PTR [rbp-20]edi
        mov     QWORD PTR [rbp-32]rsi
        mov     DWORD PTR [rbp-4], 2
        cvtsi2sd        xmm0DWORD PTR [rbp-4]
        call    exp
        movq    raxxmm0
        mov     QWORD PTR [rbp-16]rax
        movsd   xmm0QWORD PTR [rbp-16]
        mov     ediOFFSET FLAT:.LC0
        mov     eax, 1
        call    printf
        mov     eax, 0
        leave
        ret

汇编的具体细节我们无需尽知,但是我们可以很明显地看到,第二段代码调用了exp函数(call exp指令),而第一段代码没有看到调用exp的身影。
实际上,通过汇编代码可以看到,当传入参数为常量时,就已经计算好了值(emm0寄存器为浮点运算相关寄存器),最后根本不需要调用exp函数。而对于变量型的参数,其值在运行时确定,因此需要调用。我们还可以通过ldd命令来看它们链接的库有什么不同。
对于代码一:

ldd expTest
    linux-vdso.so.1 =>  (0x00007ffec079d000)
    libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007fd327744000)
    /lib64/ld-linux-x86-64.so.2 (0x00007fd327b0e000)

对于代码二:

ldd expTest
    linux-vdso.so.1 =>  (0x00007ffefdfc9000)
    libm.so.6 => /lib/x86_64-linux-gnu/libm.so.6 (0x00007f9afcccb000)
    libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f9afc901000)
    /lib64/ld-linux-x86-64.so.2 (0x00007f9afcfd4000)

可以看到,第二段代码编译出来的可执行文件,多依赖了libm.so.6,也就是exp函数所在的库。

2.什么时候需要链接?
事实上,C编译器总是主动传送libc.a或libc.so给链接器,也就是说,对于使用包含在libc.a或libc.so库中的函数,是不需要在编译时手动链接的。而调用函数是否需要链接,可以使用命令“man 3 函数名“查看,如果需要链接库,最后都有说明。

3.为什么链接的时候放在前面就不行呢?
这个就涉及到链接器的工作原理了,在此只简单说明一下:链接过程中,需要进行符号解析,并且是按照顺序解析;如果库链接在前,就可能出现库中的符号不会被需要,链接器不会把它加到未解析的符号集合中,那么后面引用这个符号的目标文件就不能解析该引用,导致最后链接失败。因此链接库的一般准则是将它们放在命令行的结尾。

总结

通过前面的实例和分析,我们总结出以下几点:

  • 调用包含于libc库中的函数不需要链接。

  • 对于传参为常量的数学函数调用,生成可执行文件过程中可能将其优化,而无需调用该函数。

  • 库链接一般放在命令行结尾。

  • 通过man命令查看在调用某个函数时是否需要链接。



关注公众号【编程珠玑】,第一时间获取更多原创技术文

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存