程序体积优化的十个小妙招
本文转载自微信公众号「程序喵大人」,程序作者程序喵大人。体积转载本文请联系程序喵大人公众号。优化
大家好,小妙我是程序程序喵,众所周知,体积前两天,优化小破站又上市了,小妙慷慨的程序宣布要给员工加鸡腿,激动的体积喵哥一夜没睡好,万万妹想到啊,优化人算不如天算,小妙公司真的程序发了鸡腿,没错,体积就是优化你想的那个。
鸡腿啥的不想了,我还是安心肝文章吧。。。
前一段时间在知乎上看到个问题:Linux如何优化可执行程序的体积?
在我们的日常工作中,一般对程序的体积都有严格的要求,有时候仅仅因为几字节的亿华云计算代码段体积或者多了几十毫秒的运行时间,整个项目就达不到验收标准,甚至不能成功上线。这里我抛砖引玉先提出几个思路,大家如果有好的优化策略欢迎打在评论区。
大体思路有这些:
好好写代码,减小代码段体积,别人300代码的逻辑我们50行搞定,程序体积肯定有机会更小一些,这个就得考验开发者自己的编程功底了 如果是C++程序,可以尽量减少模板的使用,模板实例化可能会导致代码膨胀 不用引用没有用的头文件 使用strip,像脱衣服一样,移除程序的所有符号,这也是很多开发者常用的方式 strip只会清除普通符号,不会动态符号表中的符号,某些动态符号其实也可以隐藏掉,进而来减小库的体积,可以使用-fvisibility=hidden命令 巧用.bss段,未初始化的全局变量和局部静态变量会存在.bss段中,服务器托管这些变量不占用程序空间 inline-limit:内联过多会导致代码段体积较大,可以通过此优化选项减少内联的数量 开启Os编译,这是产生较小代码体积的优化选项 适当使用编译选项-fdata-sections和-ffunction-sections 考虑链接动态库而非静态库以上说的太笼统了?贴心如我早就准备好了,不谢~
strip使用
在Linux中可以使用man strip查看strip使用方法,最主要的就是移除所有符号的-s参数,用于清除所有的符号信息:
strip -s xxx在使用strip之前先使用nm查看下可执行程序的符号信息:
~/test$ nm a.out 0000000000200da0 d _DYNAMIC 0000000000200fa0 d _GLOBAL_OFFSET_TABLE_ 000000000000089b t _GLOBAL__sub_I__Z4funcPc 0000000000000930 R _IO_stdin_used w _ITM_deregisterTMCloneTable w _ITM_registerTMCloneTable 0000000000000852 t _Z41__static_initialization_and_destruction_0ii 00000000000007fa T _Z4funcPc 000000000000081c T _Z4funci U _ZNSt8ios_base4InitC1Ev@@GLIBCXX_3.4 U _ZNSt8ios_base4InitD1Ev@@GLIBCXX_3.4 0000000000201020 B _ZSt4cout@@GLIBCXX_3.4 0000000000000934 r _ZStL19piecewise_construct 0000000000201131 b _ZStL8__ioinit U _ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@@GLIBCXX_3.4 0000000000000b24 r __FRAME_END__ 0000000000000940 r __GNU_EH_FRAME_HDR 0000000000201010 D __TMC_END__ 0000000000201010 B __bss_start U __cxa_atexit@@GLIBC_2.2.5 w __cxa_finalize@@GLIBC_2.2.5 0000000000201000 D __data_start 00000000000007b0 t __do_global_dtors_aux 0000000000200d98 t __do_global_dtors_aux_fini_array_entry 0000000000201008 D __dso_handle 0000000000200d88 t __frame_dummy_init_array_entry w __gmon_start__ 0000000000200d98 t __init_array_end 0000000000200d88 t __init_array_start 0000000000000920 T __libc_csu_fini 00000000000008b0 T __libc_csu_init U __libc_start_main@@GLIBC_2.2.5 0000000000201010 D _edata 0000000000201138 B _end 0000000000000924 T _fini 0000000000000688 T _init 00000000000006f0 T _start 0000000000201130 b completed.7698 0000000000201000 W data_start 0000000000000720 t deregister_tm_clones 00000000000007f0 t frame_dummy 000000000000083d T main 0000000000000760 t register_tm_clones当前这个可执行程序的文件大小是8840字节:
-rwxrwxrwx 1 a a 8840 Nov 29 14:54 a.out使用strip清除符号信息:
~/test$ strip -s a.outstrip后再查看可执行文件的符号信息:
~/test$ nm a.out nm: a.out: no symbols发现什么符号都没有了,但还是可以执行。
strip后的可执行程序文件大小是6120字节:
-rwxrwxrwx 1 a a 6120 Nov 29 14:54 a.out具体可以看我这篇文章:《Linux有一个命令你一定要知道》
-fvisibility=hidden可以这样使用:
$ g++ -fvisibility=hidden -c layer.cxx -o layer.o巧用.bss段:
看下面代码:
#include <stdio.h> int a[1000]; int b[1000] = { 1}; int main() { printf("程序喵\n"); return 0; }我们查看下文件大小和各个段大小:
$ gcc testlink.c -o test $ ls -l test -rwxrwxrwx 1 wzq wzq 12368 May 30 08:48 test $ size test text data bss dec hex filename 1512 4616 4032 10160 27b0 test再看这段初始化的代码:
#include <stdio.h> int a[1000] = { 1}; int b[1000] = { 1}; int main() { printf("程序喵\n"); return 0; }再查看下文件大小和各个段大小:
$ gcc testlink.c -o test $ ls -l test -rwxrwxrwx 1 wzq wzq 16368 May 30 08:49 test $ size test text data bss dec hex filename 1512 8616 8 10136 2798 test可以看到仅仅是做了一次初始化,文件大小就从12368变成了16368,正好是初始化了的那a[1000]的大小,这4000字节从.bss段移动到了.data段,程序大小增加了,这里可以看出.bss段不占据磁盘空间。香港云服务器
巧用-fdata-sections和-ffunction-sections:
现在的程序和库通常来讲都很大,一个目标文件可能包含成百上千个函数或变量,当需要用到某个目标文件的任意一个函数或变量时,就需要把它整个目标文件都链接进来,也就是说那些没有用到的函数也会被链接进去,这会导致链接输出文件变的很大,造成空间浪费。
有一个编译选项叫函数级别链接,可以使得某个函数或变量单独保存在一个段里面,都链接器需要用到某个函数时,就将它合并到输出文件中,对于没用到的函数则将他们抛弃,减少空间浪费,但这会减慢编译和链接过程,GCC编译器的编译选项是:
-ffunction-sections -fdata-sections