分类归档: Programming

编程编程编程。。。

PHP中的面向对象编程（OOP）

这里介绍了在PHP中的面向对象编程(OOP，Object Oriented Programming)。将向你演示如何通过使用一些OOP的概念和PHP的技巧来减少编码和提高质量。祝你好运！
面向对象编程的概念：
不同的作者之间说法可能不一样，但是一个OOP语言必须有以下几方面：

抽象数据类型和信息封装
继承
多态

在PHP中是通过类来完成封装的：

代码:

<?php
class Something {
// 在OOP类中，通常第一个字符为大写
var $x;
function setX($v) {
// 方法开始为小写单词，然后使用大写字母来分隔单词，例如getValueOfArea()
$this->x=$v;
}
function getX() {
return $this->x;
}
}
?>

　　当然你可以按自已的喜好进行定义，但最好保持一种标准，这样会更有效。

　　数据成员在类中使用"var"声明来定义，在给数据成员赋值之前，它们是没有类型的。一个数据成员可以是一个整数，一个数组，一个相关数组(associative array)或者是一个对象。

　　方法在类中被定义成函数形式，在方法中访问类成员变量时，你应该使用$this->name，否则对一个方法来说，它只能是局部变量。

　　使用new操作符来创建一个对象：

　　$obj=new Something;

　　然后你可以使用成员函数通过：

　　$obj->setX(5);
$see=$obj->getX();

　　在这个例子中，setX成员函数将5赋值给对象的成员变量x(不是类的)，然后getX返回它的值5。

　　你可以象：$obj->x=6那样通过类引用方式来存取数据成员，这不是一个很好的OOP习惯。我强烈建议通过方法来存取成员变量。如果你把成员变量看成是不可处理的，并且只通过对象句柄来使用方法，你将是一个好的OOP程序员。不幸的是，PHP不支持声明私有成员变量，所以不良代码在PHP中也是允许的。

　　继承在PHP中很容易实现，只要使用extend关键字。

代码:

<?php
class Another extends Something {
var $y;
function setY($v) {
$this->y=$v;
}
function getY() {
return $this->y;
}
}
?>

　　"Another"类的对象现在拥有了父类(Something)的全部的数据成员及方法，而且还加上了自已的数据成员和方法。

你可以使用

代码:

$obj2=new Something;
$obj2->setX(6);
$obj2->setY(7);

PHP现在还不支持多重继承，所以你不能从两个或两个以上类派生出新的类来。

你可以在派生类中重定义一个方法，如果我们在"Another"类中重定义了getX方法，我们就不能使用"Something"中的getX方法了。如果你在派生类中声明了一个与基派同名的数据成员，那么当你处理它时，它将“隐藏”基类的数据成员。

你可以在你的类中定义构造函数。构造函数是一个与类名同名的方法，当你创建一个类的对象时会被调用，例如：

代码:

<?php
class Something {
var $x;
function Something($y) {
$this->x=$y;
}
function setX($v) {
$this->x=$v;
}
function getX() {
return $this->x;
}
}
?>

　　所以你可以创建一个对象，通过：

　　$obj=new Something(6);

　　构造函数会自动地把6赋值给数据变量x。构造函数和方法都是普通的PHP函数，所以你可以使用缺省参数。

　　function Something($x="3",$y="5")

　　接着：

　　$obj=new Something(); // x=3 and y=5
$obj=new Something(8); // x=8 and y=5
$obj=new Something(8,9); // x=8 and y=9

　　缺省参数使用C++的方式，所以你不能忽略Y的值，而给X一个缺省参数，参数是从左到右赋值的，如果传入的参数少于要求的参数时，其作的将使用缺省参数。

　　当一个派生类的对象被创建时，只有它的构造函数被调用，父类的构造函数没被调用，如果你想调用基类的构造函数，你必须要在派生类的构造函数中显示调用。可以这样做是因为在派生类中所有父类的方法都是可用的。

代码:

<?php
function Another() {
$this->y=5;
$this->Something();
//显示调用基类构造函数
}
?>

　　OOP的一个很好的机制是使用抽象类。抽象类是不能实例化，只能提供给派生类一个接口。设计者通常使用抽象类来强迫程序员从基类派生，这样可以确保新的类包含一些期待的功能。在PHP中没有标准的方法，但是：

　　如果你需要这个特性，可以通过定义基类，并在它的构造函数后加上"die" 的调用，这样就可以保证基类是不可实例化的，现在在每一个方法(接口)后面加上"die" 语句，所以，如果一个程序员在派生类中没有覆盖方法，将引发一个错误。而且因为PHP 是无类型的，你可能需要确认一个对象是来自于你的基类的派生类，那么在基类中增加一个方法来实义类的身份（返回某种标识id），并且在你接收到一个对象参数时校验这个值。当然，如果一个邪恶不好的程序员在派生类中覆盖了这个方法，这种方法就不起作用了，不过一般问题多发现在懒惰的程序员身上，而不是邪恶的程序员。

　　当然，能够让基类对程序员无法看到是很好的，只要将接口打印出来做他们的工作就可以了。

　　在PHP中没有析构函数。

　　重载（与覆盖不同）在PHP中不支持。在OOP中，你可以重载一个方法来实现两个或重多的方法具有相同的名字，但是有不同数量或类型的参数（这要看语言）。PHP 是一种松散类型的语言，所以通过类型重载不起作用，然而通过参数的个数不同来重载也不起作用。

　　有时在OOP中重载构造函数非常好，这样你可以通过不同的方法创建对象（传递不同数量的参数）。在PHP
中实现它的技巧是：

代码:

<?php
class Myclass {
function Myclass() {
$name="Myclass".func_num_args();
$this->$name();
//注意$this->name()一般是错误的，但是在这里$name是一个将被调用方法的名字
}
function Myclass1($x) {
code;
}
function Myclass2($x,$y) {
code;
}
}
?>

　　通过在类中的额外的处理，使用这个类对用户是透明的：

　　$obj1=new Myclass(´1´); //将调用Myclass1

　　$obj2=new Myclass(´1´,´2´); //将调用Myclass2

　　有时这个非常好用。

多态
多态是对象的一种能力，它可以在运行时刻根据传递的对象参数，决定调用哪一个对象的方法。例如，如果你有一个figure的类，它定义了一个draw的方法。并且派生了circle和rectangle 类，在派生类中你覆盖了draw方法，你可能还有一个函数，它希望使用一个参数x，并且可以调用$x->draw() 。如果你有多态性，调用哪个draw方法就依赖于你传递给这个函数的对象类型。

　　多态性在象PHP这样的解释语言（想象一下一个C++编译器生成这样的代码，你应该调用哪一个方法？你也不知道你拥有的对象是什么类型的，好，这不是重点）是非常容易和自然的。所以PHP当然支持多态性。

代码:

<?php
function niceDrawing($x) {
//假设这是Board类的一个方法
$x->draw();
}
$obj=new Circle(3,187);
$obj2=new Rectangle(4,5);
$board->niceDrawing($obj);
//将调用Circle的draw方法
$board->niceDrawing($obj2);
//将调用Rectangle的draw方法
?>

用PHP进行面向对象编程
一些"纯化论者(purists)"可能会说PHP不是一个真正的面向对象的语言，这是事实。PHP 是一个混合型语言，你可以使用OOP，也可以使用传统的过程化编程。然而，对于大型项目，你可能想/需要在PHP 中使用纯的OOP去声明类，而且在你的项目只用对象和类。

　　随着项目越来越大，使用OOP可能会有帮助，OOP代码很容易维护，容易理解和重用。这些就是软件工程
的基础。在基于web的项目中应用这些概念就成为将来网站成功的关键。

　　PHP的高级OOP技术
在看过基本的OOP概念后，我就可以向你展示更高级的技术：

序列化(Serializing)
PHP不支持永久对象，在OOP中永久对象是可以在多个应用的引用中保持状态和功能的对象，这意味着拥有将对象保存到一个文件或数据库中的能力，而且可以在以后装入对象。这就是所谓的序列化机制。PHP 拥有序列化方法，它可以通过对象进行调用，序列化方法可以返回对象的字符串表示。然而，序列化只保存了对象的成员数据而不包话方法。

　　在PHP4中，如果你将对象序列化到字符串$s中，然后释放对象，接着反序列化对象到$obj，你可以继续使用对象的方法！我不建议这样去做，因为(a)文档中没有保证这种行为在以后的版本中仍然可以使用。(b)这个可能导致一种误解，在你把一个序列化后的版本保存到磁盘并退出脚本时。当以后运行这个脚本时，你不能期待着在反序列化一个对象时，对象的方法也会在那里，因为字符串表示根本就不包括方法。

　　总而言之，PHP 进行序列化对于保存对象的成员变量非常有用。（你也可以将相关数组和数组序列化到一个文件中）。

例子 :

代码:

<?php
$obj=new Classfoo();
$str=serialize($obj);
//几个月以后
//从磁盘中装入str
$obj2=unserialize($str)
?>

　　你恢复了成员数据，但是不包括方法（根据文档所说）。这导致了只能通过类似于使用$obj2->x来存取成员变量（你没有别的方法！）的唯一办法，所以不要在家里试它。

　　有一些办法可以解决这个问题，我把它留着，因为对这篇简洁的文章来说，他们太不好。

　　使用类进行数据存储
对于PHP和OOP一件非常好的事情就是，你可以很容易地定义一个类来操作某件事情，并且无论何时你想用的时候都可以调用相应的类。假设你有一个HTML表单，用户可以通过选择产品ID号来选择一个产品。在数据库中有产品的信息，你想把产品显示出来，显示它的价格等等。你拥有不同类型的产品，并且同一个动作可能对不同的产品具有不同的意思。例如，显示一个声音可能意味着播放它，但是对于其它种类的产品可能意味着显示一个存在数据库中的图片。你可以使用OOP或PHP来减少编码并提高质量：

　　定义一个产品的类，定义它应该有的方法（例如：显示），然后定义对每一种类型的产品的类，从产品类派后出来（SoundItem类，ViewableItem类，等等），覆盖在产品类中的方法，使它们按你的想法动作。

　　根据数据库中每一种产品的类型(type)字段给类命名，一个典型的产品表可能有(id, type, price, description, 等等字段)…然后在处理脚本中，你可以从数据库中取出type值，然后实例化一个名为type的对象：

代码:

<?php
$obj=new $type();
$obj->action();
?>

　　这是PHP的一个非常好的特性，你可以不用考虑对象的类型，调用$obj的显示方法或其它的方法。使用这个技术，你不需要修改脚本去增加一个新类型的对象，只是增加一个处理它的类。

　　这个功能很强大，只要定义方法，而不去考虑所有对象的类型，在不同的类中按不同的方法实现它们，然后在主脚本中对任意对象使用它们，没有if…else，也不需要两个程序员，只有高兴。

　　现在你同意编程是容易的，维护是便宜的，可重用是真的吗？

　　如果你管理一组程序员，分配工作就是很简单的了，每个人可能负责一个类型的对象和处理它的类。

　　可以通过这个技术实现国际化，根据用户所选的语言字段应用相应的类就可以了，等等。

拷贝和克隆
当你创建一个$obj的对象时，你可以通过$obj2=$obj来拷贝对象，新的对象是$obj的一个拷贝（不是一个引用），所以它具有$obj在当时的状态。有时候，你不想这样，你只是想生成一个象obj类一样的一个新的对象，可以通过使用new语句来调用类的构造函数。在PHP中也可以通过序列化，和一个基类来实现，但所有的其它类都要从基类派生出来。

进入危险区域
当你序列化一个对象，你会得到某种格式的字符串，如果你感兴趣，你可以调究它，其中，字符串中有类的名字（太好了！），你可以把它取出来，象：

代码:

<?php
$herring=serialize($obj);
$vec=explode(´:´,$herring);
$nam=str_replace(""",´´,$vec[2]);
?>

　　所以假设你创建了一个"Universe"的类，并且强制所有的类都必须从universe扩展，你可以在universe中定义一个clone的方法，如下：

代码:

<?php
class Universe {
function clone() {
$herring=serialize($this);
$vec=explode(´:´,$herring);
$nam=str_replace(""",´´,$vec[2]);
$ret=new $nam;
return $ret;
}
}
//然后
$obj=new Something();
//从Universe扩展
$other=$obj->clone();
?>

你所得到的是一个新的Something类的对象，它同使用new方法，调用构造函数创建出的对象一样。我不知道这个对你是否有用，但是Universe类可以知道派生类的名字是一个好的经验。想象是唯一的限制。

[转]你对PHP6认识多少？

去年在巴黎举行的PHP开发者大会中，PHP6开发的消息开始流传开来，
于PHP大会讨论的PHP6，将有很大幅度的变化，但这只是草案阶段，
并不代表所有会议的机率都会随着PHP6的发布而包含记录中所有的变更
也就是说，在发布PHP6之前，还是会有异动的情形，但是可以确定的是
下面所列的数项变化，将会随着PHP6一同面世（当然不是百分百乐，

）
赶快来看看这些新特性吧

1.支持Unicode
支持Unicode是有其必然，虽然Unicode占用较多的空间，但Unicode带来
的便利性，远超过占用空间的缺点，尤其在国际化的今天，硬件设备越来
越强大，网速也大幅度的提升，这么一点小小的缺点是可以忽略的。另外
一点，PHP也可以在.ini文件中设定是否开启支持Unicode，决定权在你自己，
这是一个不错的点子，关掉Unicode的支持，PHP的性能并不会有大幅度的
提升，主要的影响在于需要引用字符串的函数。

2.Register Globals 将被移除
这是一个重要的决定，说多新进的PHP开发者会觉得Register Globals满
方便的，但是却忽略了Register Globals会带来程序上安全性的隐患，大
多数的主机上此项功能是关闭的，印象中从PHP4.3.x版开始时，此项默认
设置值即是关闭状态，PHP6正式移除Register Globals也代表着如果程序
是由PHP3时代的产物，将完全无法使用，除了改写一途外，别无他法。相
信现在的PHP世界里，仍使用PHP3时代所产生的程序应该是少之又少。

3.Magic Quotes 将消失
Magic Quotes主要是自动转义需要转义的字符，此项功能移除叶符合大多
数PHP开发者的心声。

4.Safe Mode 取消
老实说，这个模式不知道哪里不好，取消就取消吧，反正也用不到

5.’var’ 别名为 ‘public’
在类中的var声明变成public的别名，相信是为了兼容PHP5而作的决定，
PHP6现在也可以称作为OO语言了。

6.通过引用返回将出错
现在透过引用返回编译器将会报错例如$a =& new b()、function &c()，
OO语言默认就是引用，所以不需要再使用&了。

7.zend.ze1 compatbility mode 将被移去
Zend.ze1相容模式将被移去，PHP5是为兼容旧有PHP4，所以在.ini中可选择是否
开启相容模式，原因在于PHP5使用的是第二代解析引擎，但是相容模式并不是百
分之百能解析PHP4语法，所以旧时代的产物，移除。

8.Freetype 1 and GD 1 support 将不见
这两个是很久的Libs，所以不再支持，GD1早已被现在的GD2取代了。

9.dl() 被移到 SAPI 中
dl()主要是让设计师加载extension Libs，现在被移到 SAPI 中

10.Register Long Array 去除
从PHP5起默认是关闭，再PHP6中正式移除。

11.一些Extension的变更
例如 XMLReader 和 XMLWriter 将不再是以Extension的方式出现，他们将被移入
到PHP的核心之中，并且默认是开启，ereg extension将被放入PECL，代表着它将
被移出PHP核心，这也是为了让路给新的正则表达式extension，
此外，Fileinfo extension 也将被导入PHP的核心之中。

12.APC将被导入核心
这是一个提高PHP性能的功能，现在它将被放入PHP核心中，并且可以选择是否启用APC

13.告别ASP风格的起始标签
原来是为了取悦ASP开发者转向使用PHP，现今已经不再需要这种做法了，

最后，别期望PHP6的性能可以全面超过PHP5，有可能的是PHP6的执行效率会比
PHP5还要来的慢的，但是可以预期的是，PHP开发小组将会努力的完善PHP5，超
越PHP5。
那么，对PHP6有兴趣的朋友现在可以到PHP官方网站上下载，试试这些功能是否真的已经
在PHP6中体现出来了，下载地址http://snaps.php.net/

JavaScript 不只是脚本

发一篇关于JavaScript的文章，因为JS或者说这中界面技术太有用了。Hoho

JavaScript似乎一直都当作是解析型的脚本语言，程序开发人员往往对此不懈一顾。认为一个脚本也没有太多的难度，那似乎为不懂程序的人专门设计的东西，不值得真正搞开发的去研究和应用。

从LiveScript 到JavaScript，在大量的时间JS都只是作为一种Script脚本在应用。更多的开发者只有在前端表单验证、以及诸如应用飘浮、移动、下拉联动菜单等网页特效或者必须通过界面才能得到的东西，比如客户端的时间、分辨率、以及一些在当前窗口操作的事件时才用得到它。于是JavaScript成了网页特效语言，专门用来给页面加上各种酷炫的效果了。JS似乎只能做些华而不实界面效果，甚至用户还可以随时屏蔽，一些浏览器工具条自动把 JavaScript给屏蔽了……

程序员对JavaScript的不重视，直接导致了JavaScript被忽视；而大量互联网特效应用，加速了JS被地当作一种脚本。而直到Jesse James Garrett 把JavaScript XMLhttp DOM等组合在一起正式提出Ajax后，JavaScript才忽然地炙手可热起来。加上Google、Yahoo、Microsoft等大型公司在Ajax方面的大量应用，JavaScript随着Ajax也越来越受到关注。

Ajax是一种新瓶装老酒的技术组合，或者说Ajax不是一种技术，而是一种概念。可正是这种能给互联网应用带来革新的概念让大家产生浓厚兴趣，原因不仅在于技术组合本身，也在于互联网应用技术模式的发展趋势。RIA的发展趋势需要新的技术和方法来配合，Ajax在现阶段正好满足了丰富互联网应用的部分发展要求，而重新利用上和定位JavaScript将是一种较好实现 RIA的选择。Ajax(或者说目前最佳丰富互联网技术应用)中真正的核心应当是JavaScript，目前的趋势是需要用JavaScript这种程序语言来重构网页、用JavaScript来格式化数据。而XMLhttp是一种传输数据的桥梁和协议，与原来GET和POST相类似，而XMLhttp很好地为JavaScript服务罢了。

实际上JavaScript就像世界上最被误解的语言（http://www.crockford.com/javascript/javascript.html）里描述的JavaScript是世界上使用人数最多的编程语言之一，除了后缀是-script让人起疑之外，其他各种计算、流程控制、数组、函数一应俱全，与Java、C等等也很像。

当然也会程序员说，JavaScript不能操作文本(操作本地也不安全)、无法生成图像、也没有面向对象、没有类、没有继承、无法Debug，无法通过网络传输数据。所以，JavaScript不是一门真正意义上的程序语言。于是这样JavaScript就被忽略为在仅在页面设计当中使用的脚本了。但是，当看到JSON这样面向对象的JS应用、JS集合、3D图形、Prototype里类和继承，再加上XMLhttp异步传递网络数据，这时候还能说JavaScirpt仅仅是简单的脚本吗？

几年前就有先见者指明JavaScript是世界上最被误解的语言，幸好，今天我们已经认识到JS的重要性，不会一直再误会下去。

看到诸如
http://www.netvibes.com/
http://developer.yahoo.com/yui/
http://www.backbase.com/
http://www.meebo.com/
http://www.miniajax.com/
http://www.protopage.com/

http://www.google.com/
http://www.a9.com/
http://www.live.com/
http://www.snap.com/
http//www.ask.com/
http://dojotoolkit.org/
http://www.ask.com/

这些应用时，JavaScript就不会只是被当成脚本语言了。JavaScript具有面向对象的概念，也可以继承类和抛出异常。正因为这些，也就是现下为何Ajax框架层出不穷，并且如此火爆的原因了。程序开发者已经意识到JavaScript语言的重要性，以及重新认识它之后给网页开发带来的变革，对于无论是前端还是后台开发人员，JavaScript都不只是从前所认为的那样—–只是简单的脚本。

在一个项目当中，尤其网页开发项目，JavaScript几乎是必不可少的语言，它不要编译器，也不需要专门的解析器。只要客户端机器上有浏览器，只要把开源的JavaScript 引擎加入浏览器中(几乎所有的浏览器都支持，所有的电脑都有浏览器 )，不管是电脑还是手机，JavaScript都将很好地被支持。

而使用JavaScript，至少有下面这几点好处：
1，增加交互动态应用，丰富界面应用，提高用户体验
2，节省后台开发成本，减少后台开发量，显示HTML/XHTML和格式化数据交给JS处理
3，节省网络带宽，让浏览速度更快，减轻服务器压力，XMLhttp 减少刷新数据
4，体现RIA，B/S模式的利器，通过JS可以达到C/S模式的效果
5，WEB版软件最好的界面实现者，Flash，Applet也还不错，不过目前JavaScrip是最好的
6，……

浏览器的兼容性或者用户屏蔽JS虽然是个头疼的问题，但绝大多数浏览器都在遵循ECMAScript1.5标准，大多数用户是不会禁用JS的，因为关闭JS使用互联网几乎是件困难的事。

虽然还有安全、开发和维护成本等等的不利因素在里面，但如果把JavaScript很好地与后台结合起来，JavaScript将是网页开发非常重要的一门语言，甚至不亚于Java。现在利用Java、php做后台的网站越来越多，而再有效结合JavaScript，利用JavaScript来t处理和显示页面，这样，丰富互联网应用、提高用户体验将成为可能。

JavaScript被程序员忽视这么久后，终于踏着RIA的步伐迎来了春天，不管怎么说，软件程序从桌面走向网络、走向浏览器将是必然的趋势。不是说要取代桌面应用，而是丰富互联网应用有太多的路要走。

而其中，桌面还是互联网应用其后台是很类似的，都可以用Java，C，C#等等。而在前台，在互联网软件应用上，JavaScript将会很好地担任界面开发程序语言的角色。

毕竟，JavaScript不再仅仅是脚本，而是一门可以面向对象的程序语言。当然了，要想真正利用好JavaSript这门语言，精通一门后台语言必不可少，而也只有这样JavaScript才不会是仅仅是脚本。

这里我说了大量JavaScript有利的一面，当然JS依然存在着这样那样的问题，但我想RIA发展是个趋势，B/S模式也是一个趋势，JavaScript也还在一直向前发展(新的版本也在研究)。我相信随着WEB2.0这种用户与网站以及用户之间的彼此交互应用越来越多，也随着网络带宽越来越快，RIA将会有一个很好的发展，而JavaScript在RIA中也将发挥越来越重要的作用。

ASP,PHP与.NET伪造HTTP-REFERER方法及防止伪造REFERER方法探讨

HTTP-REFERER这个变量已经越来越不可靠了，完全就是可以伪造出来的东东。

以下是伪造方法：

ASP:

dim http
set http=server.createobject("MSXML2.XMLHTTP") ‘//MSXML2.serverXMLHTTP也可以
Http.open "GET",url,false
Http.setRequestHeader "Referer","http://www.dc9.cn/"
Http.send()

PHP(前提是装了curl):

$ch = curl_init();
curl_setopt ($ch, CURLOPT_URL, "http://www.dc9.cn/xxx.asp");
curl_setopt ($ch, CURLOPT_REFERER, "http://www.dc9.cn/");
curl_exec ($ch);
curl_close ($ch);

PHP(不装curl用sock)

$server = ‘www.dc9.cn’;
$host     = ‘www.dc9.cn’;
$target   = ‘/xxx.asp’;
$referer = ‘http://www.dc9.cn/’;     // Referer
$port     = 80;
$fp = fsockopen($server, $port, $errno, $errstr, 30);
if (!$fp)
{
    echo "$errstr ($errno)<br />n";
}
else
{
         $out = "GET $target HTTP/1.1rn";
         $out .= "Host: $hostrn";
         $out .= "Cookie: ASPSESSIONIDSQTBQSDA=DFCAPKLBBFICDAFMHNKIGKEGrn";
         $out .= "Referer: $refererrn";
         $out .= "Connection: Closernrn";
         fwrite($fp, $out);
         while (!feof($fp))
         {
                 echo fgets($fp, 128);
         }
         fclose($fp);
}

VB.NET/C#.NET

Dim oXMLHttp As MSXML2.XMLHTTP30 = New MSXML2.XMLHTTP30()
或者
MSXML2.XMLHTTP30 oXMLHttp = new MSXML2.XMLHTTP30();
oXMLHttp.open(….
oXMLHttp.setRequestHeader(…
oXMLHttp.send(..

javascript

xmlHttp.setRequestHeader("Referer", "http://URL");//???呵呵~假的~
JS不支持^_^

原理都是sock构造http头来senddata。其他语言什么的比如perl也可以,

目前比较简单的防御伪造referer的方法是用验证码（Session）。

现在有一些能防盗链软件的商业公司比如UUDOG，linkgate，VirtualWall什么的，都是开发的应用于IIS上面的dll。
有的是采用cookies验证、线程控制，有的是能随机生成文件名然后做URL重写。有的方法能的确达到不错的效果.

不过道高一尺，魔高一丈，这些雕虫小技终归是有破解方法的。

Hash 算法及其应用

什么是 Hash
Hash 的重要特性
Hash 函数的实现
主要的 Hash 算法
Hash 算法的安全问题
Hash 算法的应用
结论

Hash，一般翻译做“散列”，也有直接音译为"哈希"的，就是把任意长度的输入（又叫做预映射， pre-image），通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，而不可能从散列值来唯一的确定输入值。

数学表述为：h = H(M) ，其中H( )–单向散列函数，M–任意长度明文，h–固定长度散列值。

在信息安全领域中应用的Hash算法，还需要满足其他关键特性：

第一当然是单向性(one-way)，从预映射，能够简单迅速的得到散列值，而在计算上不可能构造一个预映射，使其散列结果等于某个特定的散列值，即构造相应的M=H-1(h)不可行。这样，散列值就能在统计上唯一的表征输入值，因此，密码学上的 Hash 又被称为"消息摘要(message digest)"，就是要求能方便的将"消息"进行"摘要"，但在"摘要"中无法得到比"摘要"本身更多的关于"消息"的信息。

第二是抗冲突性(collision-resistant)，即在统计上无法产生2个散列值相同的预映射。给定M，计算上无法找到M’，满足H(M)=H(M’) ，此谓弱抗冲突性；计算上也难以寻找一对任意的M和M’，使满足H(M)=H(M’) ，此谓强抗冲突性。要求"强抗冲突性"主要是为了防范所谓"生日攻击(birthday attack)"，在一个10人的团体中，你能找到和你生日相同的人的概率是2.4%，而在同一团体中，有2人生日相同的概率是11.7%。类似的，当预映射的空间很大的情况下，算法必须有足够的强度来保证不能轻易找到"相同生日"的人。

第三是映射分布均匀性和差分分布均匀性，散列结果中，为 0 的 bit 和为 1 的 bit ，其总数应该大致相等；输入中一个 bit 的变化，散列结果中将有一半以上的 bit 改变，这又叫做"雪崩效应(avalanche effect)"；要实现使散列结果中出现 1bit 的变化，则输入中至少有一半以上的 bit 必须发生变化。其实质是必须使输入中每一个 bit 的信息，尽量均匀的反映到输出的每一个 bit 上去；输出中的每一个 bit，都是输入中尽可能多 bit 的信息一起作用的结果。

Damgard 和 Merkle 定义了所谓“压缩函数(compression function)”，就是将一个固定长度输入，变换成较短的固定长度的输出，这对密码学实践上 Hash 函数的设计产生了很大的影响。Hash函数就是被设计为基于通过特定压缩函数的不断重复“压缩”输入的分组和前一次压缩处理的结果的过程，直到整个消息都被压缩完毕，最后的输出作为整个消息的散列值。尽管还缺乏严格的证明，但绝大多数业界的研究者都同意，如果压缩函数是安全的，那么以上述形式散列任意长度的消息也将是安全的。这就是所谓 Damgard/Merkle 结构：

在下图中，任意长度的消息被分拆成符合压缩函数输入要求的分组，最后一个分组可能需要在末尾添上特定的填充字节，这些分组将被顺序处理，除了第一个消息分组将与散列初始化值一起作为压缩函数的输入外，当前分组将和前一个分组的压缩函数输出一起被作为这一次压缩的输入，而其输出又将被作为下一个分组压缩函数输入的一部分，直到最后一个压缩函数的输出，将被作为整个消息散列的结果。

MD5 和 SHA1 可以说是目前应用最广泛的Hash算法，而它们都是以 MD4 为基础设计的。

1) MD4
MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年设计的，MD 是 Message Digest 的缩写。它适用在32位字长的处理器上用高速软件实现–它是基于 32 位操作数的位操作来实现的。它的安全性不像RSA那样基于数学假设，尽管 Den Boer、Bosselaers 和 Dobbertin 很快就用分析和差分成功的攻击了它3轮变换中的 2 轮，证明了它并不像期望的那样安全，但它的整个算法并没有真正被破解过，Rivest 也很快进行了改进。

下面是一些MD4散列结果的例子：

MD4 ("") = 31d6cfe0d16ae931b73c59d7e0c089c0
MD4 ("a") = bde52cb31de33e46245e05fbdbd6fb24
MD4 ("abc") = a448017aaf21d8525fc10ae87aa6729d
MD4 ("message digest") = d9130a8164549fe818874806e1c7014b
MD4 ("abcdefghijklmnopqrstuvwxyz") = d79e1c308aa5bbcdeea8ed63df412da9
MD4 ("ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789") = 043f8582f241db351ce627e153e7f0e4
MD4 ("12345678901234567890123456789012345678901234567890123456789012345678901234567890") = e33b4ddc9c38f2199c3e7b164fcc0536

2) MD5
MD5(RFC 1321)是 Rivest 于1991年对MD4的改进版本。它对输入仍以512位分组，其输出是4个32位字的级联，与 MD4 相同。它较MD4所做的改进是：

1) 加入了第四轮
2) 每一步都有唯一的加法常数；
3) 第二轮中的G函数从((X ∧ Y) ∨ (X ∧ Z) ∨ (Y ∧ Z)) 变为 ((X ∧ Z) ∨ (Y ∧ ～Z))以减小其对称性；
4) 每一步都加入了前一步的结果，以加快"雪崩效应"；
5) 改变了第2轮和第3轮中访问输入子分组的顺序，减小了形式的相似程度；
6) 近似优化了每轮的循环左移位移量，以期加快"雪崩效应"，各轮的循环左移都不同。
尽管MD5比MD4来得复杂，并且速度较之要慢一点，但更安全，在抗分析和抗差分方面表现更好。

消息首先被拆成若干个512位的分组，其中最后512位一个分组是“消息尾+填充字节(100…0)+64 位消息长度”，以确保对于不同长度的消息，该分组不相同。64位消息长度的限制导致了MD5安全的输入长度必须小于264bit，因为大于64位的长度信息将被忽略。而4个32位寄存器字初始化为A=0x01234567，B=0x89abcdef，C=0xfedcba98，D=0x76543210，它们将始终参与运算并形成最终的散列结果。

接着各个512位消息分组以16个32位字的形式进入算法的主循环，512位消息分组的个数据决定了循环的次数。主循环有4轮，每轮分别用到了非线性函数

F(X, Y, Z) = (X ∧ Y) ∨ (～X ∧ Z)
G(X, Y, Z) = (X ∧ Z) ∨ (Y ∧ ～Z)
H(X, Y, Z) =X +Y + Z
I(X, Y, Z) = X + (Y ∨ ～Z)
这4 轮变换是对进入主循环的512位消息分组的16个32位字分别进行如下操作：将A、B、C、D的副本a、b、c、d中的3个经F、G、H、I运算后的结果与第4个相加，再加上32位字和一个32位字的加法常数，并将所得之值循环左移若干位，最后将所得结果加上a、b、c、d之一，并回送至ABCD，由此完成一次循环。

所用的加法常数由这样一张表T来定义，其中i为1…64，T是i的正弦绝对值之4294967296次方的整数部分，这样做是为了通过正弦函数和幂函数来进一步消除变换中的线性性。

当所有512位分组都运算完毕后，ABCD的级联将被输出为MD5散列的结果。下面是一些MD5散列结果的例子：

MD5 ("") = d41d8cd98f00b204e9800998ecf8427e
MD5 ("a") = 0cc175b9c0f1b6a831c399e269772661
MD5 ("abc") = 900150983cd24fb0d6963f7d28e17f72
MD5 ("message digest") = f96b697d7cb7938d525a2f31aaf161d0
MD5 ("abcdefghijklmnopqrstuvwxyz") = c3fcd3d76192e4007dfb496cca67e13b
MD5 ("ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789") = d174ab98d277d9f5a5611c2c9f419d9f
MD5 ("12345678901234567890123456789012345678901234567890123456789012345678901234567890") = 57edf4a22be3c955ac49da2e2107b67a
参考相应RFC文档可以得到MD4、MD5算法的详细描述和算法的C源代码。

3) SHA1 及其他
SHA1是由NIST NSA设计为同DSA一起使用的，访问http://www.itl.nist.gov/fipspubs可以得到它的详细规范–"FIPS PUB 180-1 SECURE HASH STANDARD"。它对长度小于264的输入，产生长度为160bit的散列值，因此抗穷举(brute-force)性更好。SHA-1 设计时基于和MD4相同原理,并且模仿了该算法。因为它将产生160bit的散列值，因此它有5个参与运算的32位寄存器字，消息分组和填充方式与MD5 相同，主循环也同样是4轮，但每轮进行20次操作，非线性运算、移位和加法运算也与MD5类似，但非线性函数、加法常数和循环左移操作的设计有一些区别，可以参考上面提到的规范来了解这些细节。下面是一些SHA1散列结果的例子：

SHA1 ("abc") = a9993e36 4706816a ba3e2571 7850c26c 9cd0d89d
SHA1 ("abcdbcdecdefdefgefghfghighijhijkijkljklmklmnlmnomnopnopq") = 84983e44 1c3bd26e baae4aa1 f95129e5 e54670f1
其他一些知名的Hash算法还有MD2、N-Hash、RIPE-MD、HAVAL等等。上面提到的这些都属于"纯"Hash算法。还有另2类Hash算法，一类就是基于对称分组算法的单向散列算法，典型的例子是基于DES的所谓Davies-Meyer算法，另外还有经IDEA改进的Davies- Meyer算法，它们两者目前都被认为是安全的算法。另一类是基于模运算/离散对数的，也就是基于公开密钥算法的，但因为其运算开销太大，而缺乏很好的应用前景。

没有通过分析和差分攻击考验的算法，大多都已经夭折在实验室里了，因此，如果目前流行的Hash算法能完全符合密码学意义上的单向性和抗冲突性，就保证了只有穷举，才是破坏Hash运算安全特性的唯一方法。为了对抗弱抗冲突性，我们可能要穷举个数和散列值空间长度一样大的输入，即尝试2128或2160个不同的输入，目前一台高档个人电脑可能需要1025年才能完成这一艰巨的工作，即使是最高端的并行系统，这也不是在几千年里的干得完的事。而因为"生日攻击"有效的降低了需要穷举的空间，将其降低为大约1.2*264或1.2*280，所以，强抗冲突性是决定 Hash算法安全性的关键。

在NIST新的 Advanced Encryption Standard (AES)中，使用了长度为128、192、256bit 的密钥，因此相应的设计了 SHA256、SHA384、SHA512，它们将提供更好的安全性。

Hash算法在信息安全方面的应用主要体现在以下的3个方面：

1) 文件校验
我们比较熟悉的校验算法有奇偶校验和CRC校验，这2种校验并没有抗数据篡改的能力，它们一定程度上能检测并纠正数据传输中的信道误码，但却不能防止对数据的恶意破坏。

MD5 Hash算法的"数字指纹"特性，使它成为目前应用最广泛的一种文件完整性校验和(Checksum)算法，不少Unix系统有提供计算md5 checksum的命令。它常被用在下面的2种情况下：

第一是文件传送后的校验，将得到的目标文件计算 md5 checksum，与源文件的md5 checksum 比对，由两者 md5 checksum 的一致性，可以从统计上保证2个文件的每一个码元也是完全相同的。这可以检验文件传输过程中是否出现错误，更重要的是可以保证文件在传输过程中未被恶意篡改。一个很典型的应用是ftp服务，用户可以用来保证多次断点续传，特别是从镜像站点下载的文件的正确性。

更出色的解决方法是所谓的代码签名，文件的提供者在提供文件的同时，提供对文件Hash值用自己的代码签名密钥进行数字签名的值，及自己的代码签名证书。文件的接受者不仅能验证文件的完整性，还可以依据自己对证书签发者和证书拥有者的信任程度，决定是否接受该文件。浏览器在下载运行插件和java小程序时，使用的就是这样的模式。

第二是用作保存二进制文件系统的数字指纹，以便检测文件系统是否未经允许的被修改。不少系统管理/系统安全软件都提供这一文件系统完整性评估的功能，在系统初始安装完毕后，建立对文件系统的基础校验和数据库，因为散列校验和的长度很小，它们可以方便的被存放在容量很小的存储介质上。此后，可以定期或根据需要，再次计算文件系统的校验和，一旦发现与原来保存的值有不匹配，说明该文件已经被非法修改，或者是被病毒感染，或者被木马程序替代。TripWire就提供了一个此类应用的典型例子。

更完美的方法是使用"MAC"。"MAC" 是一个与Hash密切相关的名词，即信息鉴权码(Message Authority Code)。它是与密钥相关的Hash值，必须拥有该密钥才能检验该Hash值。文件系统的数字指纹也许会被保存在不可信任的介质上，只对拥有该密钥者提供可鉴别性。并且在文件的数字指纹有可能需要被修改的情况下，只有密钥的拥有者可以计算出新的散列值，而企图破坏文件完整性者却不能得逞。

2) 数字签名
Hash 算法也是现代密码体系中的一个重要组成部分。由于非对称算法的运算速度较慢，所以在数字签名协议中，单向散列函数扮演了一个重要的角色。

在这种签名协议中，双方必须事先协商好双方都支持的Hash函数和签名算法。

签名方先对该数据文件进行计算其散列值，然后再对很短的散列值结果–如Md5是16个字节，SHA1是20字节，用非对称算法进行数字签名操作。对方在验证签名时，也是先对该数据文件进行计算其散列值，然后再用非对称算法验证数字签名。

对 Hash 值，又称"数字摘要"进行数字签名，在统计上可以认为与对文件本身进行数字签名是等效的。而且这样的协议还有其他的优点：

首先，数据文件本身可以同它的散列值分开保存，签名验证也可以脱离数据文件本身的存在而进行。

再者，有些情况下签名密钥可能与解密密钥是同一个，也就是说，如果对一个数据文件签名，与对其进行非对称的解密操作是相同的操作，这是相当危险的，恶意的破坏者可能将一个试图骗你将其解密的文件，充当一个要求你签名的文件发送给你。因此，在对任何数据文件进行数字签名时，只有对其Hash值进行签名才是安全的。

3) 鉴权协议
如下的鉴权协议又被称作"挑战–认证模式：在传输信道是可被侦听，但不可被篡改的情况下，这是一种简单而安全的方法。

需要鉴权的一方，向将被鉴权的一方发送随机串（“挑战”），被鉴权方将该随机串和自己的鉴权口令字一起进行 Hash 运算后，返还鉴权方，鉴权方将收到的Hash值与在己端用该随机串和对方的鉴权口令字进行 Hash 运算的结果相比较（“认证”），如相同，则可在统计上认为对方拥有该口令字，即通过鉴权。

POP3协议中就有这一应用的典型例子：

S: +OK POP3 server ready <[email protected]>
C: APOP mrose c4c9334bac560ecc979e58001b3e22fb
S: +OK maildrop has 1 message (369 octets)
在上面的一段POP3协议会话中，双方都共享的对称密钥（鉴权口令字）是tanstaaf，服务器发出的挑战是< [email protected]>，客户端对挑战的应答是MD5("< [email protected]>tanstaaf") = c4c9334bac560ecc979e58001b3e22fb，这个正确的应答使其通过了认证。

散列算法长期以来一直在计算机科学中大量应用，随着现代密码学的发展，单向散列函数已经成为信息安全领域中一个重要的结构模块，我们有理由深入研究其设计理论和应用方法。

（金诺 · Panzer）

Hessian's Blog

记录生活点滴，见证成长历程。