指令周期即可完成当然Delphi编译器仍然会把诸如 *2 之类的运算优化为shl 1 这也不坏不是吗
临时子界类型才揭过子界类型的短又来说它的妙用像以下的语句 if ((x>=0) and (x
10)) or ((x>=20) and (x
30)) then ... 可以改写为 if x in [0..10,20..30] then ... 子界数越多优化效果越明显,不过天下可没有
免费馅饼这回的代价是占用一个临时寄存器 movzx 与xor/mov 这是读入小于32位数据的两种不同方法后者在PII以前更具优势而前者在PII上因其乱序执行的特性而
显得更有效率编译器对此的取舍规则似乎很复杂必要时还是自己用嵌入汇编好了
大整数运算对付大整数超过32 位的你有四种武器为什么不是七种?问Borland 别来问我--int64 comp double 和extended 其中除了64 位整数类型int64外其余都是浮点数其运算都是由FPU指令实现的这其中的comp类型存储结构同int64一模一样按照Borland的官方说法comp 类型已经过时应当被int64所取代理由很简单--整数运算总比浮点快吧然而根据一项在PII上进行的测试int64 除了在加减运算中具有无可比拟的优势外在乘除方面竟比浮点数还慢好在还有老当益壮的comp 只是稍有些繁琐首先将变量声明为int64 并声明两个辅助变量。
var
a,b,c,d,e: int64;
ca:comp absolute a;
cc:comp absolute c;
//加减法不用变除法就如下处理
c:=trunc(ca/b); //is faster than c:= a div b
乘法这么来
e:=round(ca*b+cc*d); //is faster than e:=a*b+c*d;
浮点优化
警惕 Extendedextended很大(10字节,如果代码对齐就有12字节),读写运算都很慢,是优化的大敌。且
Delphi2-4对extended的代码对齐有bug。因此,若非必要,不要用extended。
同时,在混合浮点类型的运算中,编译器为了不丢失精度,临时变量以extended类型存储,所以要避免混合浮点运算。
还有,用const定义的常量,如不加指明,则也默认为extended类型。解决办法是,配合$J指示字,定义指明类型常量(typed constand)。
改变FPU控制字默认的FPU控制字令除法运算和PII/PIII上的平方根运算慢而精确,当无须得到这样的结果时,可用Set8087CW让FPU“偷懒”。
对于Single类型:Set8087CW(Default8087CW and $FCFF)
对于Double类型:Set8087CW((Default8087CW and $FCFF) or $0200)
对于extended类型:Set8087CW(Default8087CW or $0300)
多用RoundTrunc会读写FPU指令字,而Round不会,所以可以的话,尽量用Round。
传送实参对于返回浮点值的函数,入口和出口处会有附加的压栈退栈,对形如:
function func(x : SomeType): SomeFloat;
不妨改写为:
procedure func(x : SomeType; var fp : SomeFloat);
对于在过程中未修改的浮点形参,没必要用const修饰,因为那除了增加一个编译期检查外,别无用处。相应的对策是用var修饰为实参,强制传址。
自己动手,丰衣足食Delphi本身不对浮点运算作任何优化,因此很多时候,还得自己用汇编来解决。
值得注意的是,Delphi中浮点异常的触发,不是在出错之后,而是在下一条浮点指令之前。因此,通常的作法是,在一次浮点操作完毕后,加一条FWAIT指令。
减少除法除法,即多次的减法,其代价是相当昂贵的,因而有必要减少除法的次数。
另外,对于简单除法(如:a/5),编译器不一定(?
!)会将其变为乘法(a*0.2),比如:
fp:=fp*3*4/5+3*4/2;
在Delphi 4中,会被编译为:
fp:=fp*3*4/5+6;
而只有:
fp:=3*4/5*fp+3*4/2;
才会被编译为:
fp:=2.4*fp+6;
鉴于编译器的繁复规则,建议这一步优化自己完成。
浮点零的检查检查一个浮点数是否为零,如果简单的“Afloat=0”,会把0转换为浮点零。而更好的办法是这样:
对于Single类型:
(D
word(pointer(Asingle))shl 1) =0
对于Double类型:
type
DoubleData=record lo,hi:Dword end;
Var
ADoub