广告
返回顶部
首页 > 资讯 > 移动开发 >iOS内存管理TaggedPointer使用原理详解
  • 866
分享到

iOS内存管理TaggedPointer使用原理详解

iOS内存管理TaggedPointeriOSTaggedPointer 2023-01-06 12:01:30 866人浏览 薄情痞子
摘要

目录正文Tagged Pointer 的原理MacOS 分析如何判断 Tagged Pointer Tagged Pointer 注意点正文 为了节省内存和提高执行效率,

正文

为了节省内存和提高执行效率,苹果在64bit程序中引入了Tagged Pointer技术,用于优化NSNumberNSDateNSString等小对象的存储。在引入 Tagged Pointer 技术之前,NSNumber等对象存储在堆上,NSNumber的指针中存储的是堆中NSNumber对象的地址值。

从内存占用来看基本数据类型所需的内存不大。比如NSInteger变量,它所占用的内存是与 CPU 的位数有关,如下。在 32 bit 下占用 4 个字节,而在 64 bit 下占用 8 个字节。指针类型的大小通常也是与 CPU 位数相关,一个指针所在 32 bit 下占用 4 个字节,在 64 bit 下占用 8 个字节。

#if __LP64__ || 0 || NS_BUILD_32_LIKE_64
typedef long NSInteger;
typedef unsigned long NSUInteger;
#else
typedef int NSInteger;
typedef unsigned int NSUInteger;
#endif

假设我们通过NSNumber对象存储一个NSInteger的值,系统实际上会给我们分配多少内存呢?
由于Tagged Pointer无法禁用,所以以下将变量i设了一个很大的数,以让NSNumber对象存储在堆上。

可以通过设置环境变量OBJC_DISABLE_TAGGED_POINTERSYES来禁用Tagged Pointer,但如果你这么做,运行就Crash

tagged pointers are disabled

因为Runtime在程序运行时会判断Tagged Pointer是否被禁用,如果是的话就会调用_objc_fatal()函数杀死进程。所以,虽然苹果提供了OBJC_DISABLE_TAGGED_POINTERS这个环境变量给我们,但是Tagged Pointer还是无法禁用。

在 64 bit 下,如果没有使用Tagged Pointer的话,为了使用一个NSNumber对象就需要 8 个字节指针内存和 32 个字节对象内存。而直接使用一个NSInteger变量只要 8 个字节内存,相差好几倍。

NSNumber等对象的指针中存储的数据变成了Tag+Data形式(Tag为特殊标记,用于区分NSNumberNSDateNSString等对象类型;Data为对象的值)。这样使用一个NSNumber对象只需要 8 个字节指针内存。当指针的 8 个字节不够存储数据时,才会在将对象存储在堆上。

Tagged Pointer 的原理

在现在的版本中,为了保证数据安全,苹果对 Tagged Pointer 做了数据混淆,开发者通过打印指针无法判断它是不是一个Tagged Pointer,更无法读取Tagged Pointer的存储数据。

所以在分析Tagged Pointer之前,我们需要先关闭Tagged Pointer的数据混淆,以方便我们调试程序。通过设置环境变量OBJC_DISABLE_TAG_OBFUSCATioNYES

MacOS 分析

int main(int arGC, const char * argv[]) {
    @autoreleasepool {
        NSNumber *number1 = @1;
        NSNumber *number2 = @2;
        NSNumber *number3 = @3;
        NSNumber *number4 = @(0xFFFFFFFFFFFFFFFF);
        NSLog(@"%p %p %p %p", number1, number2, number3, number4);
    }
    return 0;
}
// 关闭 Tagged Pointer 数据混淆后:0x127 0x227 0x327 0x600003a090e0
// 关闭 Tagged Pointer 数据混淆前:0xaca2838a63a4fb34 0xaca2838a63a4fb04 0xaca2838a63a4fb14 0x600003a090e0

从以上打印结果可以看出,number1~number3指针为Tagged Pointer类型,可以看到对象的值都存储在了指针中,对应0x10x20x3。而number4由于数据过大,指针的8个字节不够存储,所以在堆中分配了内存。

注意:  MacOSiOS平台下的Tagged Pointer有差别,下面会讲到。

0x127 中的 2 和 7 表示什么?我们先来看这个70x127为十六进制表示,7的二进制为0111
最后一位1Tagged Pointer标识位,代表这个指针是Tagged Pointer
前面的011是类标识位,对应十进制为3,表示NSNumber类。

备注:  MacOS下采用 LSB(Least Significant Bit,即最低有效位)为Tagged Pointer标识位,而iOS下则采用 MSB(Most Significant Bit,即最高有效位)为Tagged Pointer标识位。

可以在Runtime源码objc4中查看NSNumberNSDateNSString等类的标识位。

// objc-internal.h
{
    OBJC_TAG_NSAtom            = 0, 
    OBJC_TAG_1                 = 1, 
    OBJC_TAG_NSString          = 2, 
    OBJC_TAG_NSNumber          = 3, 
    OBJC_TAG_NSIndexPath       = 4, 
    OBJC_TAG_NSManagedObjectID = 5, 
    OBJC_TAG_NSDate            = 6,
    ......
}

0x127 中的 2(即倒数第二位)又代表什么呢?

倒数第二位用来表示数据类型。

示例:

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        char a = 1;
        short b = 1;
        int c = 1;
        long d = 1;
        float e = 1.0;
        double f = 1.00;
        NSNumber *number1 = @(a);
        NSNumber *number2 = @(b);
        NSNumber *number3 = @(c);
        NSNumber *number4 = @(d);
        NSNumber *number5 = @(e);
        NSNumber *number6 = @(f);
        NSLog(@"%p %p %p %p %p %p", number1, number2, number3, number4, number5, number6);
    }
    return 0;
}
// 0x107 0x117 0x127 0x137 0x147 0x157

Tagged Pointer倒数第二位对应数据类型:

Tagged Pointer 倒数第二位对应数据类型
0char
1short
2int
3long
4float
5double

下图是MacOSNSNumberTagged Pointer位视图:

接下来我们来分析一下Tagged PointerNSString中的应用。同NSNumber一样,在64 bitMacOS下,如果一个NSString对象指针为Tagged Pointer,那么它的后 4 位(0-3)作为标识位,第 4-7 位表示字符串长度,剩余的 56 位就可以用来存储字符串。

示例:

// MRC 环境
#define HTLog(_var) \
{ \
    NSString *name = @#_var; \
    NSLog(@"%@: %p, %@, %lu", name, _var, [_var class], [_var retainCount]); \
}
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        NSString *a = @"a";
        NSMutableString *b = [a mutableCopy];
        NSString *c = [a copy];
        NSString *d = [[a mutableCopy] copy];
        NSString *e = [NSString stringWithString:a];
        NSString *f = [NSString stringWithFORMat:@"f"];
        NSString *string1 = [NSString stringWithFormat:@"abcdefg"];
        NSString *string2 = [NSString stringWithFormat:@"abcdefghi"];
        NSString *string3 = [NSString stringWithFormat:@"abcdefghij"];
        HTLog(a);
        HTLog(b);
        HTLog(c);
        HTLog(d);
        HTLog(e);
        HTLog(f);
        HTLog(string1);
        HTLog(string2);
        HTLog(string3);
    }
    return 0;
}

从打印结果来看,有三种NSString类型:

类型描述
__NSCFConstantString1. 常量字符串,存储在字符串常量区,继承于 __NSCFString。相同内容的 __NSCFConstantString 对象的地址相同,也就是说常量字符串对象是一种单例,可以通过 == 判断字符串内容是否相同。 2. 这种对象一般通过字面值@"..."创建。如果使用 __NSCFConstantString 来初始化一个字符串,那么这个字符串也是相同的 __NSCFConstantString。
__NSCFString1. 存储在堆区,需要维护其引用计数,继承于 NSMutableString。 2. 通过stringWithFormat:等方法创建的NSString对象(且字符串值过大无法使用Tagged Pointer存储)一般都是这种类型。
NSTaggedPointerStringTagged Pointer,字符串的值直接存储在了指针上。

打印结果分析:

NSString 对象类型分析
a__NSCFConstantString通过字面量@"..."创建
b__NSCFStringa 的深拷贝,指向不同的内存地址,被拷贝到堆区
c__NSCFConstantStringa 的浅拷贝,指向同一块内存地址
dNSTaggedPointerString单独对 a 进行 copy(如 c),浅拷贝是指向同一块内存地址,所以不会产生Tagged Pointer;单独对 a 进行 mutableCopy(如 b),复制出来是可变对象,内容大小可以扩展;而Tagged Pointer存储的内容大小有限,因此无法满足可变对象的存储要求。
e__NSCFConstantString使用 __NSCFConstantString 来初始化的字符串
fNSTaggedPointerString通过stringWithFormat:方法创建,指针足够存储字符串的值。
string1NSTaggedPointerString通过stringWithFormat:方法创建,指针足够存储字符串的值。
string2NSTaggedPointerString通过stringWithFormat:方法创建,指针足够存储字符串的值。
string3__NSCFString通过stringWithFormat:方法创建,指针不足够存储字符串的值。

可以看到,为Tagged Pointer的有dfstring1string2指针。它们的指针值分别为
0x61150x66150x67666564636261750x880e28045a54195

其中0x610x660x67666564636261分别对应字符串的 ASCII 码。

最后一位5的二进制为0101,最后一位1是代表这个指针是Tagged Pointer010对应十进制为2,表示NSString类。

倒数第二位1179代表字符串长度。

对于string2的指针值0x880e28045a54195,虽然从指针中看不出来字符串的值,但其也是一个Tagged Pointer

下图是MacOSNSStringTagged Pointer位视图:

如何判断 Tagged Pointer

objc4源码中找到判断Tagged Pointer的函数:

// objc-internal.h
static inline bool 
_objc_isTaggedPointer(const void * _Nullable ptr)
{
    return ((uintptr_t)ptr & _OBJC_TAG_MASK) == _OBJC_TAG_MASK;
}

可以看到,它是将指针值与一个_OBJC_TAG_MASK掩码进行按位与运算,查看该掩码:

#if (TARGET_OS_OSX || TARGET_OS_IOSMAC) && __x86_64__
    // 64-bit Mac - tag bit is LSB
#   define OBJC_MSB_TAGGED_POINTERS 0  // MacOS
#else
    // Everything else - tag bit is MSB
#   define OBJC_MSB_TAGGED_POINTERS 1  // iOS
#endif
#define _OBJC_TAG_INDEX_MASK 0x7
// array slot includes the tag bit itself
#define _OBJC_TAG_SLOT_COUNT 16
#define _OBJC_TAG_SLOT_MASK 0xf
#define _OBJC_TAG_EXT_INDEX_MASK 0xff
// array slot has no extra bits
#define _OBJC_TAG_EXT_SLOT_COUNT 256
#define _OBJC_TAG_EXT_SLOT_MASK 0xff
#if OBJC_MSB_TAGGED_POINTERS
#   define _OBJC_TAG_MASK (1UL<<63)  // _OBJC_TAG_MASK
#   define _OBJC_TAG_INDEX_SHIFT 60
#   define _OBJC_TAG_SLOT_SHIFT 60
#   define _OBJC_TAG_PAYLOAD_LSHIFT 4
#   define _OBJC_TAG_PAYLOAD_RSHIFT 4
#   define _OBJC_TAG_EXT_MASK (0xfUL<<60)
#   define _OBJC_TAG_EXT_INDEX_SHIFT 52
#   define _OBJC_TAG_EXT_SLOT_SHIFT 52
#   define _OBJC_TAG_EXT_PAYLOAD_LSHIFT 12
#   define _OBJC_TAG_EXT_PAYLOAD_RSHIFT 12
#else
#   define _OBJC_TAG_MASK 1UL       // _OBJC_TAG_MASK
#   define _OBJC_TAG_INDEX_SHIFT 1
#   define _OBJC_TAG_SLOT_SHIFT 0
#   define _OBJC_TAG_PAYLOAD_LSHIFT 0
#   define _OBJC_TAG_PAYLOAD_RSHIFT 4
#   define _OBJC_TAG_EXT_MASK 0xfUL
#   define _OBJC_TAG_EXT_INDEX_SHIFT 4
#   define _OBJC_TAG_EXT_SLOT_SHIFT 4
#   define _OBJC_TAG_EXT_PAYLOAD_LSHIFT 0
#   define _OBJC_TAG_EXT_PAYLOAD_RSHIFT 12
#endif

由此我们可以验证:

  • MacOS下采用 LSB(Least Significant Bit,即最低有效位)为Tagged Pointer标识位;
  • iOS下则采用 MSB(Most Significant Bit,即最高有效位)为Tagged Pointer标识位。

而存储在堆空间的对象由于内存对齐,它的内存地址的最低有效位为 0。由此可以辨别Tagged Pointer和一般对象指针。

objc4源码中,我们经常会在函数中看到Tagged Pointer。比如objc_msgSend函数:

    ENTRY _objc_msgSend
    UNWIND _objc_msgSend, NoFrame
    cmp p0, #0          // nil check and tagged pointer check
#if SUPPORT_TAGGED_POINTERS
    b.le    LNilOrTagged        //  (MSB tagged pointer looks negative)
#else
    b.eq    LReturnZero
#endif
    ldr p13, [x0]       // p13 = isa
    GetClassFromIsa_p16 p13     // p16 = class
LGetIsaDone:
    // calls imp or objc_msgSend_uncached
    CacheLookup NORMAL, _objc_msgSend
#if SUPPORT_TAGGED_POINTERS
LNilOrTagged:
    b.eq    LReturnZero     // nil check
    // tagged
    adrp    x10, _objc_debug_taggedpointer_classes@PAGE
    add x10, x10, _objc_debug_taggedpointer_classes@PAGEOFF
    ubfx    x11, x0, #60, #4
    ldr x16, [x10, x11, LSL #3]
    adrp    x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGE
    add x10, x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGEOFF
    cmp x10, x16
    b.ne    LGetIsaDone
    // ext tagged
    adrp    x10, _objc_debug_taggedpointer_ext_classes@PAGE
    add x10, x10, _objc_debug_taggedpointer_ext_classes@PAGEOFF
    ubfx    x11, x0, #52, #8
    ldr x16, [x10, x11, LSL #3]
    b   LGetIsaDone
// SUPPORT_TAGGED_POINTERS
#endif

objc_msgSend能识别Tagged Pointer,比如NSNumberintValue方法,直接从指针提取数据,不会进行objc_msgSend的三大流程,节省了调用开销。

内存管理相关的,如retain方法中调用的rootRetain

ALWAYS_INLINE id 
objc_object::rootRetain(bool tryRetain, bool handleOverflow)
{
    // 如果是 tagged pointer,直接返回 this
    if (isTaggedPointer()) return (id)this; 
    bool sideTableLocked = false;
    bool transcribeToSideTable = false; 
    isa_t oldisa;
    isa_t newisa;
    ......

 Tagged Pointer 注意点

我们知道,所有OC对象都有isa指针,而Tagged Pointer并不是真正的对象,它没有isa指针,所以如果你直接访问Tagged Pointerisa成员的话,在编译时将会有如下警告:

对于Tagged Pointer,应该换成相应的方法调用,如isKindOfClassobject_getClass。只要避免在代码中直接访问Tagged Pointerisa,即可避免这个问题。

当然现在也不允许我们在代码中直接访问对象的isa了,否则编译不通过。

我们通过 LLDB 打印Tagged Pointerisa,会提示如下错误:

以上就是iOS内存管理Tagged Pointer使用原理详解的详细内容,更多关于iOS内存管理Tagged Pointer的资料请关注编程网其它相关文章!

--结束END--

本文标题: iOS内存管理TaggedPointer使用原理详解

本文链接: https://www.lsjlt.com/news/176928.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • iOS内存管理TaggedPointer使用原理详解
    目录正文Tagged Pointer 的原理MacOS 分析如何判断 Tagged Pointer Tagged Pointer 注意点正文 为了节省内存和提高执行效率,...
    99+
    2023-01-06
    iOS内存管理Tagged Pointer iOS Tagged Pointer
  • C++内存管理详解使用方式
    目录c++中内存管理的方式new和delete操作符的使用方式operator new和operator delete函数new和delete的原理内部实现内置类型自定义类型c++中...
    99+
    2022-11-13
  • JVM内存管理之JAVA语言的内存管理详解
    引言内存管理一直是JAVA语言自豪与骄傲的资本,它让JAVA程序员基本上可以彻底忽略与内存管理相关的细节,只专注于业务逻辑。不过世界上不存在十全十美的好事,在带来了便利的同时,也因此引入了很多令人抓狂的内存溢出和泄露的问题。可怕的事情还不只...
    99+
    2023-05-31
    jvm 内存管理 java
  • 详解C/C++内存管理
    目录C/C++内存分布C语言中动态内存管理方式C++中动态内存管理方式new和delete操作内置类型new和delete操作自定义类型operator new和operator d...
    99+
    2022-11-12
  • 详解Swift的内存管理
    目录内存管理weak循环引用闭包的循环引用self的循环引用内存访问冲突指针指针分类获得变量的指针创建指针指针之间的转换内存管理 和OC一样, 在Swift中也是采用基于引用计数的A...
    99+
    2022-11-12
  • Python中的内存管理之python list内存使用详解
    前言 使用 Python 的时候,我们知道 list 是一个长度可变对的数组, 可以通过 insert,append 和 extend 轻易的拓展其中的元素个数。 也可以使用运算符 ...
    99+
    2022-11-12
  • C++动态内存管理详解
    目录1.C/C++程序地址空间2.C语言动态内存管理(1)malloc(2)calloc(3)realloc(4)free3.C++动态内存管理(1)C++为什么要设计一套自己专属的...
    99+
    2022-11-12
  • Java内存区域管理详解
    目录1 关于自动内存管理2 运行时数据区域2.1 程序计数器2.2 虚拟机栈2.2.1 局部变量表2.2.2 操作数栈2.3 本地方法栈2.4 堆2.5 方法区2.5.1 运行时常量...
    99+
    2022-11-13
  • C++内存管理详细解析
    目录一、C++内存管理1、 new/delete表达式2、new/delete重载3、类内自定义allocator(per-class allocator) 二、多线程内存分配器1、...
    99+
    2022-11-12
  • 详解Linux内核内存管理架构
    内存管理子系统可能是linux内核中最为复杂的一个子系统,其支持的功能需求众多,如页面映射、页面分配、页面回收、页面交换、冷热页面、紧急页面、页面碎片管理、页面缓存、页面统计等,而且对性能也有很高的要求。本文从内存管理硬...
    99+
    2022-06-04
    Linux 内存 架构
  • SQLServer的内存管理架构详解
    目录一、Windows的虚拟内存管理器二、SQL Server 内存体系结构2.1、传统(虚拟)内存2.2、地址窗口扩展 (AWE) 内存三、从 SQL Server 2012 (11.x) 开始发生的改变3.1、对内存...
    99+
    2023-04-19
    SQLServer的内存管理架构 SQL Server内存管理 SQL内存架构
  • C++的内存管理详细解释
    目录一、C/C++内存分布二、C语言中动态内存管理方式:1、malloc/calloc/realloc区别:三、C++中动态内存管理:new/delete四、实现原理五、面试常问问题...
    99+
    2022-11-12
  • iOS内存管理引用计数示例分析
    目录内存管理机制isaSideTable内存管理机制 目前流行的内存管理机制主要有GC和RC两种。 GC (Garbage Collection):垃圾回收机制,定期查找不再使用的...
    99+
    2023-01-06
    iOS内存管理引用计数 iOS 引用计数
  • Python 内存管理的工作原理,你了解吗?
    Python 为开发者提供了许多便利,其中最大的便利之一是其几乎无忧的内存管理。开发者无需手动为 Python 中的对象和数据结构分配、跟踪和释放内存。运行时会为你完成所有这些工作,因此你可以专注于解决实际问题,而不是争论机器级细节。尽管如...
    99+
    2023-05-14
    Python 内存管理
  • iOS使用频率最高的内存管理有哪几种
    这篇文章主要介绍“iOS使用频率最高的内存管理有哪几种”,在日常操作中,相信很多人在iOS使用频率最高的内存管理有哪几种问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”iOS使用频率最高的内存管理有哪几种”的疑...
    99+
    2023-06-04
  • c++动态内存管理详解(new/delete)
    目录前言用法上对内置类型对自定义类型new/delete底层原理重载类的专属operator new和 operator delete定位newnew/delete与malloc/f...
    99+
    2022-11-13
  • 详解android是如何管理内存的
    目录前言Java Heap进程内存分配内存不足管理GC 垃圾回收内核交换守护进程低内存终止守护进程最后前言 很高兴遇见你~ 内存优化一直是 Android 开发中的一个非常重要的话...
    99+
    2022-11-12
  • Golang内存管理简单技巧详解
    目录引言预先分配切片结构中的顺序字段使用 map[string]struct{} 而不是 map[string]bool引言 除非您正在对服务进行原型设计,否则您可能会关心应用程序的...
    99+
    2022-11-11
  • C++动态内存管理详情解说
    目录写在前面C/C++ 内存分布C语言内存管理方式C++内存管理方式C++为何增加了new 和 deletenew 一个对象new 一个数组deletemalloc &am...
    99+
    2022-11-13
  • 详解MySQL InnoDB存储引擎的内存管理
    存储引擎之内存管理 在InnoDB存储引擎中,数据库中的缓冲池是通过LRU(Latest Recent Used,最近最少使用)算法来进行管理的,即最频繁使用的页在LRU列表的最前段,而最少使用的页在LRU列表的尾端...
    99+
    2022-05-13
    MySQL InnoDB InnoDB 内存管理 InnoDB 存储引擎
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作