iOS App 启动过程:从 exec 到 main

iOS App 启动过程(二),本文介绍从 exec() 方法到 main() 方法的过程。

概述:

从点击应用到执行 main() 之前,系统进行了以下行为:

  • Load dylibs:递归映射所有依赖的动态库(dylibs)
  • Rebase:对所有图像进行重设基址
  • Bind:对所有图像进行绑定
  • Notify ObjC Runtime:运行时操作
  • Initializers:初始化

注意:

这里的图像是 Mach-O 中的术语,指所有文件类型。
Mach-O 有三种文件类型

  1. Executable:应用程序的二进制文件;
  2. Dylib:动态库;
  3. Bundle:无法被链接的动态库,只能通过 dlopen() 打开;
    所有的 ExecutableDylibBundle 称为 Image

Loading Dylibs

第一个执行的是加载动态库,首先需要去解析所有依赖的动态库的列表,找到 App 需要的所有 mach-o 文件。找到动态库后,需要打开并读取每个文件,在此过程中,验证 mach-o 文件的有效性,依次注册代码签名。最后对每个 segment 调用 mmap() 方法。

加载一个动态库后需要递归加载每个依赖的动态库,一个 App 大约有 400 多个动态库,其中大部分是系统动态库。

Fix-ups

加载完所有的动态库后,动态库只是一个个单独的存在,此时需要通过 fix-ups 使动态库相互关联。在 __DATA segment 中有一个指针,可以用来跳转。
fix-ups 分为两种,rebasebindrebase 是在图像内部调整指针;而 bind 是在图像外部调整指针。

Rebase

因为 ASLR(Address space layout randomization) 使所有动态库被加载到随机地址上,所以需要 rebase 遍历所有的内部数据指针,然后为它们添加一个地址偏移值。

Bind

Bind 针对那些指向动态库之外的指针,这些指针通过名称绑定。运行时,dylb 通过符号名找到实现该符号的位置,主要是遍历查找符号表,当找到时把值存到该数据指针中。

Notify ObjC Runtime

ObjC 是动态语言,可以在运行时通过类名把类实例化,所以在运行时,ObjC 需要维护一张包含所有类与其映射的表格。每个加载类时,在这个全局表格中注册类名。在运行时还会把定义的 Category 插入到方法列表中。

Selector 对于 ObjC 是唯一的。

Initializers

调用所有类的 +(void)load 方法,对所有动态库初始化。需要从下到上初始化,因为上层的一些动态库可能依赖于下层的动态库,所以先初始化下层的动态库保证所有的动态库都可以正确初始化。

当所有的动态库初始化完成后,最终调用主 dylib 程序,也就是 main()

总结

Dyld 是一个辅助程序,主要功能

  • 加载所有依赖库;
  • 修复所有 DATA 页面的指针;
  • 运行所有构造器初始化,并最终调用 mian()

本文参考 WWDC2016 Session 406: Optimizing App Startup Time