- 本文地址: https://www.laruence.com/2008/09/19/520.html
- 转载请注明出处
在前面的文章中我已经介绍了PHP的变量的内部表示(深入理解PHP原理之变量(Variables inside PHP)),以及PHP中作用域的实现机制(深入理解PHP原理之变量作用域(Scope inside PHP))。这节我们就接着前面的文章,继续介绍PHP中变量分离和引用的概念:
首先我们回顾一下zval的结构:
struct _zval_struct { /* Variable information */ zvalue_value value; /* value */ zend_uint refcount; zend_uchar type; /* active type */ zend_uchar is_ref; };
其中的refcount和is_ref字段我们一直都没有介绍过,我们知道PHP是一个长时间运行的服务器端的脚本解释器。那么对于它来说,效率和资源占用率是一个很重要的衡量标准,也就是说,PHP必须尽量介绍内存占用率,考虑下面这段代码:
<?php $var = "laruence"; $var_dup = $var; unset($var); ?>
第一行代码创建了一个字符串变量,申请了一个大小为9字节的内存,保存了字符串"laruence"和一个NULL(\0)的结尾。
第二行定义了一个新的字符串变量,并将变量var的值"复制"给这个新的变量。
第三行unset了变量var
这样的代码在我们平时的脚本中是很常见的,如果PHP对于每一个变量赋值都重新分配内存,copy数据的话,那么上面的这段代码公要申请18个字节的内存空间,而我们也很容易的看出来,上面的代码其实根本没有必要申请俩份空间,呵呵,PHP的开发者也看出来了:
我们之前讲过,PHP中的变量是用一个存储在symbol_table中的符号名,对应一个zval来实现的,比如对于上面的第一行代码,会在symbol_table中存储一个值"var", 对应的有一个指针指向一个zval结构,变量值"laruence"保存在这个zval中,所以不难想象,对于上面的代码来说,我们完全可以让"var"和"var_dup"对应的指针都指向同一个zval就可以了。
PHP也是这样做的,这个时候就需要介绍我们之前一直没有介绍过的zval结构中的refcount字段了。
refcount,顾名思义,记录了当前的zval被引用的计数。
比如对于代码:
<?php $var = 1; $var_dup = $var; ?>
第一行,创建了一个整形变量,变量值是1。 此时保存整形1的这个zval的refcount为1。
第二行,创建了一个新的整形变量,变量也指向刚才创建的zval,并将这个zval的refcount加1,此时这个zval的refcount为2。
PHP提供了一个函数可以帮助我们了解这个过程debug_zval_dump:
<?php $var = 1; debug_zval_dump($var); $var_dup = $var; debug_zval_dump($var); ?>
输出:
long(1) refcount(2) long(1) refcount(3)
如果你奇怪 ,var的refcount应该是1啊?
我们知道,对于简单变量,PHP是以传值的形式穿参数的。也就是说,当执行debug_zval_dump($var)的时候,$var会以传值的方式传递给debug_zval_dump,也就是会导致var的refcount加1,所以我们只要能看到,当变量赋值给一个变量以后,能导致zval的refcount加1这个事实即可。
现在我们回头看文章开头的代码, 当执行了最后一行unset($var)以后,会发生什么呢? 对,既是refcount减1,上代码:
<?php $var = "laruence"; $var_dup = $var; unset($var); debug_zval_dump($var_dup); ?>
输出:
string(8) "laruence" refcount(2)
但是,对于下面的代码呢?
<?php $var = "laruence"; $var_dup = $var; $var = 1; ?>
很明显在这段代码执行以后,$var_dup的值应该还是"laruence", 那么这又是怎么实现的呢?
这就是PHP的copy on write机制:
PHP在修改一个变量以前,会首先查看这个变量的refcount,如果refcount大于1,PHP就会执行一个分离的例程, 对于上面的代码,当执行到第三行的时候,PHP发现$var指向的zval的refcount大于1,那么PHP就会复制一个新的zval出来,将原zval的refcount减1,并修改symbol_table,使得$var和$var_dup分离(Separation)。这个机制就是所谓的copy on write(写时复制)。
上代码测试:
<?php $var = "laruence"; $var_dup = $var; $var = 1; debug_zval_dump($var); debug_zval_dump($var_dup); ?>
输出:
long(1) refcount(2) string(8) "laruence" refcount(2)
现在我们知道,当使用变量复制的时候 ,PHP内部并不是真正的复制,而是采用指向相同的结构来尽量节约开销。那么,对于PHP中的引用,那又是如何实现呢?
<?php $var = "laruence"; $var_ref = &$var; $var_ref = 1; ?>
这段代码结束以后,$var也会被间接的修改为1,这个过程称作(change on write:写时改变)。那么ZE是怎么知道,这次的复制是不需要Separation的呢?
这个时候就要用到zval中的is_ref字段了:
对于上面的代码,当第二行执行以后,$var所代表的zval的refcount变为2,并且同时置is_ref为1。
到第三行的时候,PHP先检查var_ref代表的zval的is_ref字段,如果为1,则不分离,大体逻辑示意如下:
if((*val)->is_ref || (*val)->refcount<2){ //不执行Separation ... ;//process }
但是,问题又来了,对于如下的代码,又会怎样呢?
<?php $var = "laruence"; $var_dup = $var; $var_ref = &$var; ?>
对于上面的代码,存在一对copy on write的变量$var和$var_dup, 又有一对change on write机制的变量对$var和$var_ref,这个情况又是如何运作的呢?
当第二行执行的时候,和前面讲过的一样,$var_dup 和 $var 指向相同的zval, refcount为2.
当执行第三行的时候,PHP发现要操作的zval的refcount大于1,则,PHP会执行Separation, 将$var_dup分离出去,并将$var和$var_ref做change on write关联。也就是,refcount=2, is_ref=1;
基于这样的分析,我们就可以让debug_zval_dump出refcount为1的结果来:
<?php $var = "laruence"; $var_dup = &$var; debug_zval_dump($var); ?>
输出:
string(8) "laruence" refcount(1)
详细原因,读者你只要稍加分析就能得出,我就不越俎代庖了。;)
这次我们介绍了PHP的变量分离机制,下次我会继续介绍如果在扩展中接收和传出PHP脚本中的参数。另外,因为最近变动比较大(换工作),所以抱歉这么长时间才有更新。
Written in detail.
grate ..thanks
说实话 感觉理解好理解 实际测试的结果却不对 尤其是最后 引用的时候到底refcount是否会增加呢
PHP版本影响,鸟哥上面测试应该用的是5.6或更小的版本,我用7、8测试结果和上面不一样,但是用5.6就一样。
这段代码结束以后,$var也会被间接的修改为1,这个过程称作(change on write:写时改变)。那么ZE是怎么知道,这次的复制是不需要Separation的呢?
这个时候就要用到zval中的is_ref字段了:
对于上面的代码,当第二行执行以后,$var所代表的zval的refcount变为2,并且同时置is_ref为1。
上面为引用原文, 我试了一下(php 版本 5.6.31 命令行模式下), 当第二行执行以后,$var所代表的zval的refcount 仍是 1 . 是版本差异吗? 还是我理解的不正确?
[…] 还要结合引用和计数, 这部分的内容请参看我之前的文章深入理解PHP原理之变量分离/引用), 但这个释放不是C编程意义上的释放, 不是交回给OS. 对于PHP来说, […]
有错别字啊鸟哥,PHP必须尽量介绍内存占用率 -》PHP必须尽量减少内存占用率
[…] 本文地址: http://www.laruence.com/2008/09/19/520.html […]
[…] (本例选自:http://www.laruence.com/2008/09/19/520.html) […]
[…] 也就是说, 如果一个申明为引用传递的参数不为引用传递, 而refcount又大于1, 那么在不容许分离的条件下, 就会导致zend_call_function失败返回(如果对refcount和变量分离不了解, 可以参看我之前的文章深入理解PHP原理之变量分离/引用). […]
[…] 还要结合引用和计数, 这部分的内容请参看我之前的文章深入理解PHP原理之变量分离/引用), 但这个释放不是C编程意义上的释放, 不是交回给OS. 对于PHP来说, […]
非常感谢对于
$var = “laruence”;
$var_dup = $var;
$var_ref = &$var;
的讲解.
看了又看,看了又看,搞懂了。向大触学习!
最后的引用确实是1,因为当执行debug_zval_dump($var)的时候,$var会以传值的方式传递给debug_zval_dump,此参数不是以引用传递的,导致引用变量分离,debug_zval_dump收到的传参var已经和var、var_dup 分离了,所以才变成了1。(琢磨了好久)
不计算代码,正文第六行,PHP必须尽量介绍内存占用率,介绍 应该为 减少 吧.
就是你说的,从要我们自己推导的那个开始的,倒数第二个,你说引用是2,在分离之后引用按你所说因该是0,笔误么?
你好啊,你最后的那个,那个
最后$var 的引用应该是0吧?是么?
[…] 鸟哥的深入变量引用/分离 http://www.laruence.com/2008/09/19/520.html […]
[…] 还要结合引用和计数, 这部分的内容请参看我之前的文章深入理解PHP原理之变量分离/引用), 但这个释放不是C编程意义上的释放, 不是交回给OS. 对于PHP来说, […]
文中 ”面的这段代码公要申请18个” 的 公要 应该是 需要 吧
深入理解PHP原理之变量分离/引用(Variables Separation) | 风雪之隅 Hermes Bag Price List Philippines http://showlin146.com/images/home/js/86088181df6f4b1cbb20530b6e940d3f.asp
Thanks for another informative blog. The place else could I get that kind of info written in such an ideal
method? I have a project that I am simply now operating on,
and I have been at the glance out for such information.
没有一定的C功底,做到彻底掌握确实很难啊
$a = 1;
$b = &$a;
debug_zval_dump($a);//long(1) refcount(1)
….不明白了,没有引用的时候照boss的博客文章的意思是2,引用了下,变成了1了。
因为一个引用的题目而来,不过还是没有找到答案,却发现别的知识。。。
对着php-internals+源码+鸟哥的博客来回倒腾着看,终于算是理清了(自以为理清了)思路,有进步 :)
[…] 变量赋值涉及到变量分离(Variables Separation)的概念,这对应于两种机制变量分离copy on write(写时复制)及变量不分离change on write(写时改变) […]
$a = 1;
function a($a){
debug_zval_dump($a);//为何$a的refcount是4而不是3呢?
}
[…] 你是怎么理解的呢?首先了解下php变量的分解和引用机制,这里有篇文章写的简单易懂,你看看http://www.laruence.com/2008/09/19/520.html 回答: 引用 4 楼 klend 的回复: […]
[…] 深入理解PHP原理之变量分离/引用(Variables Separation) 回答: &引用新建内存,把数据复制进去,传值是把内存空间指向原内存空间了,当然省。 回答: 1. 所谓值传递,就是说仅将对象的值传递给目标对象,就相当于copy;系统将为目标对象重新开辟一个完全相同的内存空间。2. 所谓引用,就是说将对象在内存中的地址传递给目标对象,就相当于使目标对象和原始对象对应同一个内存存储空间。此时,如果对目标对象进行修改,内存中的数据也会改变。3. 一般传值省内存,当需要对大数据进行操作的时候,传址节省内存,当需要函数多返回值的时候也可以引用传参。 回答: […]
[…] 了解了,关于变量下面两篇laruence文章有提到,特别是第二篇,个人觉得很好,真心建议坛友们多看看,估计很多人都看过了,挺出名的,再结合php官方那篇垃圾回收机制的文章,效果更好。变量存储http://www.laruence.com/2008/08/22/412.html变量分离引用http://www.laruence.com/2008/09/19/520.html […]
[…] 深入理解PHP原理之变量分离/引用(Variables Separation) […]
$one=1;
$two = $one;
$three = &$one;
$four = $one;
$five = &$one;
$five = 2;
echo $one, $two, $three, $four, $five;
结果为21212
执行$five = &$one;底层怎么执行的呢?
我的理解为:
如果首先检查refcount,则$three会被分离出去,但是这个没有分离出$three,所以我认为是先检查is_ref再检查refcount。。如果is_ref == 1,则refcount ++;
看了鸟哥前面的回复,知道怎么回事了,还得感叹一句,原来是鸟哥!!!久仰大名
最后一题和前面说得根本自相矛盾吧?前面也有一个一样的,您在那的说法是refcount=2,is_ref=1才是啊
鸟哥写的很详细,受益匪浅。
“PHP必须尽量介绍内存占用率” 是否应为 “PHP必须尽量减少内存占用率”
[…] http://www.laruence.com/2008/09/19/520.html?cp=all […]
[…] 我们都知道PHP用写时复制来对变量复制做性能优化, 而在以前的三元式中, 却每次都会复制, 这在操作数是大数组的情况下, 会造成性能问题: […]
[…] 还要结合引用和计数, 这部分的内容请参看我之前的文章深入理解PHP原理之变量分离/引用), 但这个释放不是C编程意义上的释放, 不是交回给OS. 对于PHP来说, […]
我也试着去gdb了。
按照说的 声明变量的时候。
要写到符号表中,ZEND_SET_SYMBOL
我就gdb php
break ZEND_SET_SYMBOL
run test.php
断点貌似没用到就结束了。
Php部分是
$var = 1;
$var_ref = &$var;
困惑。
还有,最后一题的 引用计数为啥是1呢?
在赋值的时候$var的zval里的refcount=1 is_ref=0, 应该是不用分离的啊。
难道在$var_ref = &$var; 这次赋值以后才进行的 分离么?困惑求解。
最后一题,将$var和$var_ref做change on write关联。也就是,refcount=2, is_ref=1;
为什么 dump 出来 引用计数是1呢?而且还有一个形参的1,就代表原先他本是的引用计数是0吗?
[…] 本文地址: http://www.laruence.com/2008/09/19/520.html […]
[…] 结合之前的文章深入理解PHP原理之变量分离/引用(Variables Separation)中介绍过的相关知识, […]
[…] var_dump($a === Singleton::getInstance()); //bool(false) 那么为什么呢? 我之前的文章深入理解PHP原理之变量分离/引用(Variables Separation)中曾经介绍过, 在PHP中, […]
[…] 还要结合引用和计数, 这部分的内容请参看我之前的文章深入理解PHP原理之变量分离/引用), 但这个释放不是C编程意义上的释放, 不是交回给OS. 对于PHP来说, […]
楼主我对你十分敬仰啊。。。。大牛
[…] 本文地址: http://www.laruence.com/2008/09/19/520.html […]
楼主真是大牛~~~~百度真是藏龙卧虎~~~~学习学习~~~
[…] 也就是说, 如果一个申明为引用传递的参数不为引用传递, 而refcount又大于1, 那么在不容许分离的条件下, 就会导致zend_call_function失败返回(如果对refcount和变量分离不了解, 可以参看我之前的文章深入理解PHP原理之变量分离/引用). […]
[…] 也就是说, 如果一个申明为引用传递的参数的refcount大于1了, 并且不容许分离的话, 就会导致出错.(如果对refcount和变量分离不了解, 可以参看我之前的文章深入理解PHP原理之变量分离/引用(Variables Separation)) […]
@Anonymous 最直接的方法是用gdb, 引用数组不会改变元素的refcount, 分离不是指引用的, 分离只是指多个符号指向同一个zval的情况, 😉
Anonymous
另外,还有个问题:当$foo = $arr后,他们是指向同一ZVAL的,但什么情况下,他们会被分离呢?
我试着改变他们元素的值,对数组排序等操作,似乎都不能将他们分离。。
博主,非常感谢你的及时回复!那天晚上结合你的文章,钻研了很久,今天发现和你想到一块去了,哈哈。我在进一步测试时,又有了新发现:
对数组进行 & 后,其数组元素的 refcount会加1,但是不知道数组元素的 isref 是否也会变成 1?因为 debug_zval_dump()看不到 isref,所以不知道还有没有其它函数可以看 isref的呢?还请告知!
@Anonymous Hi, foo指向的是arr整体的zval, 而tmp是引用指向arr中hashtable的一个元素zval, 所以在对arr[0]赋值的时候,不会触发分离动作.
前面提交的代码为啥没了。。再提交一次:
$arr[0] = ‘A’; $tmp = & $arr[0];
$foo = $arr;
$arr[0] = ‘C’;
print_r($foo);
结果:
Array
(
[0] => C
)
结果:
Array
(
[0] => C
)
博主,能否结合PHP源码,帮忙分析下上面的代码,这个问题困扰我一段时间了,一直没能真正理解其中的原理。
[…] 结合之前的文章深入理解PHP原理之变量分离/引用(Variables Separation)中介绍过的相关知识, […]
如果说第一个 debug_zval_dump 中传递 $val 导致 val 的refcount + 1 为什么第二次调用 不会加一呢?
现在的分离条件好象是
PZVAL_IS_REF(value) && value->refcount > 0
即is_ref=1并且refcount>0的时候可以分离,
这样snowrui 提供的代码就可以解释输出的内容了
输出:
string(8) “laruence” refcount(1)
long(1) refcount(1)
分离次序好像应该遵循FIFO原则把?
刚才 想到 上次和同事讨论 关于 for 和 foreach 的问题,
那们到底 foreach 有没有重新复制一份 value.
如果重新复制一份的话,从理论上讲 应该要比 for 花费多的时间。
它不是整个复制,foreach开始的时候, 在zend_do_foreach_count()中,只是复制数组的current元素,
所以,复制这部分的开销不是很大
相反,如果使用了for, 花费在索引查询上的时间,会差不多大于花在foreach上的元素复制时间。
所以,总体来说,不会差很多,但是建议使用foreach
呵呵,写的文章非常好,继续加油啊。
发现一个拼写错误 :)
“PHP提供了一个函数可以帮助我们了解这个过程debug_dump_zval”中函数“debug_dump_zval”应为“debug_zval_dump”
;), 谢谢, 改正之
恩, 这样的时候,就不会分离了.
$var = “laruence”;
$var_dup = &$var;
$var_dup1 = &$var;
$var_dup2 = &$var;
debug_zval_dump(&$var);
输出:
&string(8) “laruence” refcount(5)
只是输出时多了个&号.不知道什么意思,可能表示是个引用.
奥.明白了.我忘了,那个函数的参数,多谢指教
你这个时候,调用debug_zval_dump会导致一个Separation动作的产生, 所以会refcount 1
引用的时候,refcount是会增加的。
啊他把我复制你的代码给过滤了.晕
前面:
当第二行执行的时候,和前面讲过的一样,$var_dup 和 $var 指向相同的zval, refcount为2.
最后:
输出:
string(8) “laruence” refcount(1)
可能是我没看明白,引用时引用计数不加吧.
我测试:
$var = “laruence”;
$var_dup = &$var;
$var_dup1 = &$var;
$var_dup2 = &$var;
debug_zval_dump($var);
$var_dup = 1;
debug_zval_dump($var);
输出:
string(8) “laruence” refcount(1)
long(1) refcount(1)
写的很详细.