扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
我们知道Linux环境下不是所有的二进制文件都有相同的格式,Linux系统使用二进制文件的处理程序来实现对不同二进制格式文件的分别处理。二进制处理程序通过内嵌在文件开头的“特征序列”(一个特殊的字节序列)来识别文件,有时也会通过文件名的一些特征,例如ELF文件以’E’’L’’F’字符开头,Java文件以0xcafebabe开始前四个字节。
Linux用sys_execve装入可执行二进制文件。
1.当前Linux版本(2.2)提供以下几种二进制文件处理程序:
• a.out:主要时为了和以前兼容,因为a.out很难实现动态链接,以被ELF所取。
• ELF:现在主流的Linux二进制文件。尽管如此,她一样要和其他格式一样需要使用二进制处理程序。
• EM86:主要作用是在Alpha的主机上运行Intel的Linux二进制文件,仿佛他们就是Alpha的本地二进制文件。
• Java:通过以.class文件的文件名为参数,处理程序返回执行字节码的解释程序。
• Misc:最明智的二进制处理程序的方法。她通过内嵌的特征数字或文件名后缀识别二进制格式。另外她可以运行期配置,而不是只能在编译期配置,这样,你就可以在增加新二进制格式文件的支持而不用重新编译内核。有说将用她取代Java和EM86二进制处理程序。
• 脚本:主要支持shell脚本、Perl脚本,宽松一点说,所有前面两个字符是#!的可执行文件都由她来处理。
在继续向下介绍之前,我们必须先来认识一个数据结构linux_binfmt;
在linux_binfmt中包含两个重要指向函数的指针,load_binary装入可执行代码,load_shlib装入共享库。Core_dump是个转储函数指针。
很显然,由next构成一个链表,表头则由formats指向:
系统为每个不同的文件格式定义了一个相应的对象:
linux_binfmt的链表(由formats指向)则就是由这些不同的文件格式的linux_binfmt构成的一个链表。而对不同格式二进制文件的处理程序则通过注册在相应的linux_binfmt中的函数来实行,实际这里已经使用了面向对象的思想,而这种情况在Linux的内核源码中经常可以看到。
例如对于ELF文件格式:
当使用“装入函数的指针”使,指针指向装入函数分别为:
以上函数在中定义实现。
而相应的elf_format 被定义成:
以此为参考我们自然也就可以想到其他文件格式的定义形式。
『注』Java的load函数为load_java,em86的load函数为load_em86,script 的load函数为load_script,他们没有提供library的load函数。
2.下面我们来看看关于这几个数据结构的主要操作:
register_binfmt:主要作用使将一中二进制文件加到formats链表中。
unregister_binfmt:执行与register_binfmt的反操作。 % |
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者