php引用计数器和垃圾回收机制引用计数器和垃圾回收机制
谈到引用计数器和垃圾回收机制,必须得从php变量说起。总所周知,php是一种弱类型,但具体表现在哪里,
程序里面又是怎么表现的呢?php里面又是怎样实现引用计数器的,程序如何区分变量引用和复制?php是如何对已用完的变量进行回收,不同的php版本的不同的垃圾回收机制又是如何实现的?
1.引用计数器引用计数器
讲到引用计数器,不得不先说一下变量的c语言实现。如下,几个变量的结构体和联合体:zvalue_value联合体:typedefunion_zvalue_value{longlval;/*longvalue*//*doublevalue*/doubledval;struct{char*val;intlen;}str;HashTable*ht;/*hashtablevalue*/zend_object_valueobj;}zvalue_value;zval的结构:struct_zval_struct{/*Variableinformation*/zvalue_valuevalue;/*value*/zend_uintrefcount__gc;zend_uchartype;/*activetype*/zend_ucharis_ref__gc;};zval可以看成一个容器,zvalue_value是该容器存储变量值的联合体,refcount__gc是引用计数,记录引用数,is_ref__gc是标志这个容器是否真正的引用,type表示这个变量的类型。zend根据type值来决定访问value的哪个成员,可用值如下:IS_NULLIS_LONGIS_DOUBLEIS_STRINGIS_ARRAYIS_OBJECTIS_BOOLIS_RESOURCEN/A对应value.lval对应value.dval对应value.str对应value.ht对应value.obj对应value.lval.对应value.lval
根据这个表格可以发现两个有意思的地方:首先是
PHP的数组其实就是一个HashTable,这就解释了为什么PHP能够支持关联数组了;其次,Resource就是一个long值,它里面存放的通常是个指针、一个内部数组的index或者其它什么只有创建者自己才知道的东西,可以将其视作一个handle。写复制(CopyonWrite)写复制PHP在修改一个变量以前,会首先查看这个变量的refcount,如果refcount大于1,PHP就会执行一个分离的例程,对于上面的代码,当执行到第三行的时候,PHP发现$var指向的zval的refcount大于1,那么PHP就会复制一个新的zval出来,将原zval的refcount减1,并修改symbol_table,使得$var和$var_dup分离(Separation)。这个机制就是所谓的copyonwrite(写时复制)。(1)
题外话:类操作
系统内核中,题外话:写时复制技术的一个比较有名的应用是在unix类操作系统内核中,当一个进程调用fork函数生成一个子进程的时候,父子进程拥有相同的地址空间内容,在老版本的系统中,函数生成一个子进程的时候,父子进程拥有相同的地址空间内容,在老版本的系统中,子进程是在fork个子进程的时候的时候就将父进程的地址空间中的内容都拷贝一份,的时候就将父进程的地址空间中的内容都拷贝一份,对于规模较大的程序这个过程可能会有着很大的开之后,执行另外一个程序,销,更崩溃的是,很多进程在fork之后,直接在子进程中调用exec执行另外一个程序,这样原来花了更崩溃的是,大量时间从父进程复制的地址空间都还没来得及碰一下就被新的进程地址空间代替,大量时间从父进程复制的地址空间都还没来得及碰一下就被新的进程地址空间代替,这显然是对资源的极大浪费,所以在后来的系统中,就使用了写时复制技术,之后,大浪费,所以在后来的系统中,就使用了写时复制技术,fork之后,子进程的地址空间还是简单的指向父进程的地址空间,只有当子进程需要写地址空间中的内容的时候才会单独分离一份(父进程的地址空间,只有当子进程需要写地址空间中的内容的时候,才会单独分离一份(一般以内存页为单位)给子进程,函数也没关系,单位)给子进程,这样就算子进程马上调用exec函数也没关系,因为根本就不需要从父进程的地址空间中拷贝内容,这样节约了内存同时又提高了速度。中拷贝内容,这样节约了内存同时又提高了速度。
写改变(changeonwrit)写改变开始在zval里面我们看到一个字段is_ref__gc,到底如何是怎样产生作用的呢?现在我们知道,当使用变量复制的时候,PHP内部并不是真正的复制,而是采用指向相同的结构来尽量节约开销。那么,对于PHP中的引用,那又是如何实现呢?这段代码结束以后,$var也会被间接的修改为1,这个过程称作(changeonwrite:写时改变)。那么ZE是怎么知道,这次的复制是不需要Separation的呢?这个时候就要用到zval中的is_ref字段了:对于上面的代码,当第二行执行以后,$var所代表的zval的refcount变为2,并且同时置is_ref为1。当使用引用时,php会把is_ref__gc即程序会如下判断该引用是否真实引用,PHP先检查var_ref代表的zval的is_ref__gc字段,如果为1,则不分离,大体逻辑示意如下:(2)is_ref||(*val)->refcount<2){
//不执行Separation...;//process}?>两种方式到底怎样使用,啥时候使用两种方式到底怎样使用,啥时候使用?对于上面的代码,存在一对copyonwrite的变量$var和$var_dup,又有一对changeonwrite机制的变量对$var和$var_ref,这个情况又是如何运作的呢?当第二行执行的时候,和前面讲过的一样,$var_dup和$var指向相同的zval,refcount为2。当执行第三行的时候,PHP发现要操作的zval的refcount大于1,则,PHP会执行Separation,将$var_dup分离出去,并将$var和$var_ref做changeonwrite关联。也就是,refcount=2,is_ref=1。(4)数值巨大变量处理当然如果我们在php中进行参数传递的时候,是否有必要对传递内容巨大的数组心存警惕,担心内存的大量流失?(3)例如上面这段统计一群人中有多少个中国国籍的时候,如果有一个10W的人的数组要传进去,你是否会担心被复制后传到函数里,导致内存占用瞬间翻倍?也许你会在参数那里加一个&;表示引用?php的
设计者在这里有一个很巧妙的设计,引入了一个copyonwrite的概念,在上面的函数中,如果你不去修改$perons对象的内容,并不会有复制行为发生,内存也不会double.但是如果我想在函数里面修改数据,便于函数后面的处理,这个时候内存会double吗?如下: