本文共 3188 字,大约阅读时间需要 10 分钟。
Objective-C (以下简称 OC )是一门动态性强的编程语言,OC 的动态性是基于 Runtime 来实现的,Runtime 系统是由 C\C++\汇编语言 编写的,提供的 API 基本都是 C 语言的。这里我们从苹果提供的 Runtime 代码来探究类的本质。
legacy 版本
OC 的 runtime 分为两个版本.一个是 legacy 版本,一个是 modern 版本。相信很多读者都见过下面这段代表 OC 类结构的代码:
struct objc_class {
Class _Nonnull isa OBJC_ISA_AVAILABILITY;
#if !__OBJC2__
Class _Nullable super_class OBJC2_UNAVAILABLE;
const char * _Nonnull name OBJC2_UNAVAILABLE;
long version OBJC2_UNAVAILABLE;
long info OBJC2_UNAVAILABLE;
long instance_size OBJC2_UNAVAILABLE;
struct objc_ivar_list * _Nullable ivars OBJC2_UNAVAILABLE;
struct objc_method_list * _Nullable * _Nullable methodLists OBJC2_UNAVAILABLE;
struct objc_cache * _Nonnull cache OBJC2_UNAVAILABLE;
struct objc_protocol_list * _Nullable protocols OBJC2_UNAVAILABLE;
#endif
} OBJC2_UNAVAILABLE;
其实这段代码就是 legacy 版本 已经在 2006 年的 WWDC 大会上发布 Objective-C 2.0 后弃用了, OBJC2_UNAVAILABLE 标记的内容已经不再使用,那么现在的结构是什么呢?
对象
OC 中,每一个对象都是类的实例,先直接来看源码中的结构:
struct objc_object {
private:
isa_t isa;
// ...
}
代表对象的结构中只有一个 isa 的成员变量,在 arm64 架构下,系统对 isa 进行了优化,它不光存着地址信息,还存着其他信息。因此对象的本质就是包含了一个私有成员变量 isa 的结构体,而 isa 存着的地址就指向着对象所属的类。不同的对象有不同的成员变量,编译后,每个对象的结构体也会存着自己的成员变量的值。
使用命令获取编译后的代码 -sdk iphoneos clang -arch arm64 -rewrite-objc Coder.m
@interface Coder : Person
@property (nonatomic, copy) NSString *name;
@end
// 编译后查看 `Coder` 的实现
struct NSObject_IMPL {
Class isa;
};
struct Coder_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString * _Nonnull _name;
};
之所以成员变量的值存在对象中,这个也很好理解,每个对象肯定是独立存在的,都需要拥有自己的变量值。而变量名称和方法等等存在什么地方呢,就是类了!
类
类存着成员变量的类型,方法等等,源码如下:
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() {
return bits.data();
}
// 省略...
}
首先可以看到的一点是 objc_class 继承了 objc_object,因此其实 OC 中的类也可以理解为一种对象,称之为类对象,在 legacy 版本中,对象的结构体中只有一个 isa 指针,指向它的类对象,而类对象中也有一个 isa 指针,指向它的元类。modern 版本使用继承后,类对象的结构体就继承了这个优化后的 isa 变量。但对比两个版本,会发现 modern 版本中除了superclass&cache ,其余的很多变量不在了,并多了一个 bits 变量。
struct class_data_bits_t {
uintptr_t bits;
class_rw_t* data() {
return (class_rw_t *)(bits & FAST_DATA_MASK);
}
// ...
}
这个结构体里面是通过一个位运算获取的指向 class_rw_t 的指针,可见 bits 存着 class_rw_t 结构体的指针和一些其他信息。然后把目光转到 class_rw_t 上:
'rw' 和 ro' 分别表示 'readwrite' 和 'readonly'
struct class_rw_t {
// Be warned that Symbolication knows the layout of this structure.
uint32_t flags;
uint32_t version;
const class_ro_t *ro;
method_array_t methods;
property_array_t properties;
protocol_array_t protocols;
// ...
}
可以看到原先 legacy 版本中的方法、属性和协议列表就存在这个里面,这几个列表可以理解为是二维数组,是可读可写的,包含了类的初始内容、分类的内容,二维数组方便增加。 而这里又有一个 class_ro_t :
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;
// ....
const char * name;
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;
// ....
};
class_ro_t 里面的 baseMethodList、baseProtocols、ivars、baseProperties 可以理解为是一维数组,是只读的,包含了类的初始内容。
从这里我们也能看出分类不能动态添加成员变量到类对象的原因,分类是通过 runtime 加载的,这时候类结构已经确定下来了,并且这里保存成员变量的内存是只读的。
元类
上面已经提到,类对象的 isa 中储存的地址指向的就算类对象的类,称之为元类,元类储存着对象方法。也就是说实例方法是储存在类中的,类方法是存储在元类中的。用一个经典的图来表示对象、类和元类的关系。
object_model.png
图中已经很好的阐述了三者之间的关系,不过这里需要强调两点。
元类的 isa 指向的是基类的元类。
基类的元类的 superclass 指向的是基类
这两个点很容易被忽略,在一些面试题中经常出现。
参考
转载地址:http://vzrav.baihongyu.com/