中国科学技术大学


继续教育学院课程设计


论文报告










论文题目:MD5报文摘要算法实现
学员姓名:邱冬生
学    号:TB04039126
专    业:计算机科学与技术
指导教师: 
日    期:2006年12月25日











MD5报文摘要算法实现



[摘要] MD5(Message-Digest Algorithm 5)90年代初由MIT Laboratory for computer science和RSA Data Security inc的Ronald L.Rivest开发出来,经MD2、MD3和MD4发展而来。 本文描述了MD5加密算法的原理及程序设计过程与程序实现,在参考RFC1321的基础上,把加密程序做成可视化窗口形式,以方便使用。

[关键词] MD5加密 设计 实现 应用







1. 引言
    MD (Message Digest)意为报文摘要。由Ron Riverst 于1990年作为RFC提出,1992年[RFC 1320,1321]公布了MD5算法的细节。其功能是对不定长的报文作出定长的“报文摘要”。
1.1 编写目的
    本文描述了怎样实现MD5报文摘要算法的方法。
    MD5有这样一个性质,杂凑码中的每一个比特都是所有输入比特的函数,因此获得了很好的混淆效果,从而不可能随机选择两个具有相同杂凑码的报文。
    此算法将对输入的任意长度的信息进行计算,产生一个128位长度的“指纹”或“报文摘要”。

1.2 安全性分析
    找出两个具有相同杂凑码的报文需要执行O(264)次运算;而寻找具有给定杂凑码的一个报文,要执行O(2128)次运算。
    从密码分析的角度来看,要破解MD5运算结果,若用穷尽搜索方法,需进行O(264) 次运算,但用第Ⅱ类生日攻击,分析所需时间要短得多。因此认为MD5易受第Ⅱ类生日攻击的威胁。

1. 3 术语与符号
    实现中,一个“字”是32位,一个“字节”是8位。一系列位串可看成是一系列字节的普通形式,其中的连续的8位看成一个字节,高位在前,同理一系列字节串可看成是一系列32位的字,其中每个连续的4个字节当作一个字,低位在前。“当前文件”或“当前文档”指在当前MD5加密程序窗口打开的文件
    程序假定一个int型变量占一个“字”的内存空间,一个char型变量占一个“字节”的内存空间。


2. 程序说明
2.1 程序描述
    本程序实现了MD5加密技术,对打开的文件或当前编辑的文件进行加密。程序主要通过菜单选项进行操作。


2.2 功能说明(功能模块结构)

2.3 算法说明

    MD5加密算法对文件中的内容进行摘要运算,摘要的执行分为以下几个步骤:
第一步,补位:
    MD5算法先对输入的数据进行补位,使得数据的长度(以byte为单位)对64求余的结果是56。即数据扩展至LEN=K*64+56个字节,K为整数。
    补位方法:补一个1,然后补0至满足上述要求。相当于补一个0x80的字节,再补值为0的字节。这一步里总共补充的字节数为0~63个。
第二步,附加数据长度:
    用一个64位的整数表示数据的原始长度(以bit为单位),将这个数字的8个字节按低位的在前,高位在后的顺序附加在补位后的数据后面。这时,数据被填补后的总长度为: LEN = K*64+56+8=(K+1)*64 Bytes。
第三步,初始化MD5参数:
    有四个32位整数变量 (A,B,C,D) 用来计算信息摘要,每一个变量被初始化成以下以十六进制数表示的数值,低位的字节在前面。
    word A: 01 23 45 67
    word B: 89 ab cd ef
    word C: fe dc ba 98
    word D: 76 54 32 10
    低位的字节在前面指的是Little Endian平台上内存中字节的排列方式,而在程序中书写时,要写成:
     A=0x67452301
     B=0xefcdab89
     C=0x98badcfe
     D=0x10325476

第四步,定义四个MD5基本的按位操作函数:
    X,Y,Z为32位整数。
    F(X,Y,Z) = (X and Y) or (not(X) and Z)
    G(X,Y,Z) = (X and Z) or (Y and not(Z))
    H(X,Y,Z) = X xor Y xor Z
    I(X,Y,Z) = Y xor (X or not(Z))
    再定义四个分别用于四轮变换的函数。设Mj表示消息的第j个子分组(从0到15),<<S表示循环左移S位,则四种操作为:
    FF(a,b,c,d,Mj,s,ti)表示a=b+((a+(F(b,c,d)+Mj+ti)<<s)
    GG(a,b,c,d,Mj,s,ti)表示a=b+((a+(G(b,c,d)+Mj+ti)<<s)
    HH(a,b,c,d,Mj,s,ti)表示a=b+((a+(H(b,c,d)+Mj+ti)<<s)
    I I(a,b,c,d,Mj,s,ti)表示a=b+((a+(I(b,c,d)+Mj+ti)<<s)

第五步,对输入数据作变换。
    处理数据,N是总的字节数,以64个字节为一组,每组作一次循环,每次循环进行四轮操作。要变换的64个字节用16个32位的整数数组M[0 ...15]表示。而数组T[1 ... 64]表示一组常数, T为4294967296*abs(sin(i))的32位整数部分,i的单位是弧度,i的取值从1到64。具体过程如下:
/* 设置主循环变量 */
For (i = 0;i< =N/16-1;i++ )
{
/*每循环一次,把数据原文存放在16个元素的数组X中. */
For( j = 0;j<=15 ;j++)
Set X[j] to M[i*16+j].
AA = A
BB = B
CC = C
DD = D
/* 第1轮*/
/* 以 [abcd k s i]表示如下操作
a = b + ((a + F(b,c,d) + X[k] + T) << s) */

/*做以下运算*/
[ABCD 0 7 1] [DABC 1 12 2] [CDAB 2 17 3] [BCDA 3 22 4]
[ABCD 4 7 5] [DABC 5 12 6] [CDAB 6 17 7] [BCDA 7 22 8]
[ABCD 8 7 9] [DABC 9 12 10] [CDAB 10 17 11] [BCDA 11 22 12]
[ABCD 12 7 13] [DABC 13 12 14] [CDAB 14 17 15] [BCDA 15 22 16]

/* 第2轮 */
[ABCD 1 5 17] [DABC 6 9 18] [CDAB 11 14 19] [BCDA 0 20 20]
[ABCD 5 5 21] [DABC 10 9 22] [CDAB 15 14 23] [BCDA 4 20 24]
[ABCD 9 5 25] [DABC 14 9 26] [CDAB 3 14 27] [BCDA 8 20 28]
[ABCD 13 5 29] [DABC 2 9 30] [CDAB 7 14 31] [BCDA 12 20 32]

/* 第3轮*/
[ABCD 5 4 33] [DABC 8 11 34] [CDAB 11 16 35] [BCDA 14 23 36]
[ABCD 1 4 37] [DABC 4 11 38] [CDAB 7 16 39] [BCDA 10 23 40]
[ABCD 13 4 41] [DABC 0 11 42] [CDAB 3 16 43] [BCDA 6 23 44]
[ABCD 9 4 45] [DABC 12 11 46] [CDAB 15 16 47] [BCDA 2 23 48]

/* 第4轮*/
[ABCD 0 6 49] [DABC 7 10 50] [CDAB 14 15 51] [BCDA 5 21 52]
[ABCD 12 6 53] [DABC 3 10 54] [CDAB 10 15 55] [BCDA 1 21 56]
[ABCD 8 6 57] [DABC 15 10 58] [CDAB 6 15 59] [BCDA 13 21 60]
[ABCD 4 6 61] [DABC 11 10 62] [CDAB 2 15 63] [BCDA 9 21 64]

/* 然后进行如下操作 */
A = A + AA
B = B + BB
C = C + CC
D = D + DD
}
第六步,测试结果。

3. 程序设计
3.1 新建文件
    在程序初始化时创建子窗口,含有一个空白文档,并带有滚动条。可以在窗口中进行文本编辑。
static HWND hwndEdit ;
hwndEdit = CreateWindow (TEXT ("edit"), NULL,
WS_CHILD | WS_VISIBLE |WS_HSCROLL | WS_VSCROLL |WS_BORDER| ES_LEFT | ES_MULTILINE | ES_NOHIDESEL | ES_AUTOHSCROLL | ES_AUTOVSCROLL, 0, 0, 0, 0, hwnd, (HMENU) EDITID, hInst, NULL);

    设置两个变量用来存放当前文件的路径与文件名。新建文件时把当前文件的内容置为空,并把当前文档的路径、文件名置为空值。便相当于创建了一人个新文档。
static TCHAR szFileName[MAX_PATH], szTitleName[MAX_PATH] ;

SetWindowText (hwndEdit, TEXT ("\0")) ;
szFileName[0] = '\0' ;
szTitleName[0] = '\0' ;

    在对当前文档进行置空之前还必须先询问是否保存当前文件,根据用户选项进行保存或放弃保存操作。
short AskAboutSave (HWND hwnd, TCHAR * szTitleName);

3.2 打开文件
    当打开一个文件时,先要初始化一个OPENFILENAME结构(全局或静态),用于存储打开、保存文件时的一些信息。程序中这个结构在创建窗口时对其进行初始化。
static OPENFILENAME ofn ;

void PopFileInitialize (HWND hwnd)
{
static TCHAR szFilter[] = TEXT ("Text Files (*.TXT)\0*.txt\0")\
TEXT ("ASCII Files (*.ASC)\0*.asc\0") \
TEXT ("All Files (*.*)\0*.*\0\0") ;
ofn.lStructSize = sizeof (OPENFILENAME) ;
ofn.hwndOwner = hwnd ;
ofn.hInstance = NULL ;
ofn.lpstrFilter = szFilter ;
ofn.lpstrCustomFilter = NULL ;
ofn.nMaxCustFilter = 0 ;
ofn.nFilterIndex = 0 ;
ofn.lpstrFile = NULL ; // Set in Open and Close functions
ofn.nMaxFile = MAX_PATH ;
ofn.lpstrFileTitle = NULL ;// Set in Open and Close functions
ofn.nMaxFileTitle = MAX_PATH ;
ofn.lpstrInitialDir = NULL ;
ofn.lpstrTitle = NULL ;
ofn.Flags = 0 ; // Set in Open and Close functions
ofn.nFileOffset = 0 ;
ofn.nFileExtension = 0 ;
ofn.lpstrDefExt = TEXT ("txt") ;
ofn.lCustData = 0L ;
ofn.lpfnHook = NULL ;
ofn.lpTemplateName = NULL ;
}
    结构中各数据项在调用打开/保存文件对话框时进行设置。要打开一个文件,首先调用“打开文件”对话框函数PopFileOpenDlg(),获取用户输入的文件路径与文件名。程序对文件进行读入操作,并把打开的文件名写入标题栏。然后把文件内容写入到当前窗口中。
if (PopFileOpenDlg (hwnd, szFileName, szTitleName))
{
if (!PopFileRead (hwndEdit, szFileName))
  {
    OkMessage (hwnd, TEXT ("Could not read file %s!"),
      szTitleName) ;
      szFileName[0] = '\0' ;
      szTitleName[0] = '\0' ;
  }
}
DoCaption (hwnd, szTitleName) ;

3.3 保存文件
    程序用了一个变量来指示当前文档内容是否有改动,文档的内容进行了改动则bNeedSave置为TRUE。
        static BOOL bNeedSave = FALSE ;
    保存文件时调用“保存文件”对话框函数PopFileSaveDlg()获取保存路径与文件名。调用PopFileWrite()函数把文本内容写入硬盘。
if (PopFileSaveDlg (hwnd, szFileName, szTitleName))
{
  DoCaption (hwnd, szTitleName) ;
  if (PopFileWrite (hwndEdit, szFileName))
  {
    bNeedSave = FALSE ;
    return 1 ;
  }
  else
  {
    OkMessage (hwnd, TEXT ("Could not write file %s"),
      szTitleName) ;
      return 0 ;
  }
}

3.4 文件加密
    文件加密技术实现是本程序的核心。加密工作由MDFile()函数完成。首先获取当前文件内容长度(字节数),然后申请堆空间,把文本内容读入堆空间。
    length = GetWindowTextLength (hwndEdit);
    pstrBuffer = (POINTER) malloc ((length + 1) * sizeof (unsigned char));
    GetWindowText (hwndEdit, pstrBuffer, length + 1);
    但在本程序中只能显示纯文本格式的文件,而打开其它格式(如EXE、RAR等文件)的文件时不能正确显示,所以可以从硬盘中把原文件读入进行加密,即使文件不能在当前窗口显示,但仍可以对其进行加密。
if (INVALID_HANDLE_VALUE == (hFile= CreateFile (pstrFileName, GENERIC_READ, FILE_SHARE_READ,NULL, OPEN_EXISTING, 0, NULL)))
{
OkMessage (hwnd, TEXT("could not open file %s"), pstrFileName);
exit(1);
}
length = GetFileSize (hFile, NULL) ;
if((pstrBuffer = (POINTER) malloc (length + 2)) == NULL)
{
 OkMessage (hwnd, TEXT("could not get memory"),NULL);
 exit(1);
}
ReadFile (hFile, pstrBuffer, length, &dwBytesRead, NULL) ;
CloseHandle (hFile) ;
pstrBuffer[length] = '\0' ;
pstrBuffer[length + 1] = '\0';
    此时,把菜单中的“保存”选项变成不可用的灰色,以免有误操作。
    EnableMenuItem(hMenu,IDM_FILE_SAVE,MF_GRAYED);
    然后用2.3节描述的算法对文本进行加密,结果存入digest (unsigned char digest[16])数组中。然后把结果按十六进制形式写入文件(用户选择保存路径)。
MD5Init() //初始化MD缓冲区,对应2.3节第三步。
void MD5Init (MD5_CTX *context)
{
context->count[0] = context->count[1] = 0;
context->state[0] = 0x67452301;
context->state[1] = 0xefcdab89;
context->state[2] = 0x98badcfe;
context->state[3] = 0x10325476;
}
    MD5Update()调用杂凑函数HashFunct()对数据进行变换、加密。对于不足512位的数据,则交给MD5Final()函数补位后再作变换。这里只对64字节整倍数的数据进行变换,尾部不足512位的交给MD5Final()函数处理。
void MD5Update (MD5_CTX *context, POINTER input,unsigned int inputLen)
{
 unsigned int i, index, partLen;
 index = (unsigned int)((context->count[0] >> 3) & 0x3F); //模64
 if ((context->count[0]+=((unsigned long)inputLen << 3))
< ((unsigned long)inputLen<<3)) //输入字符的长度
  context->count[1]++;
 context->count[1] += ((unsigned long)inputLen >> 29);
 partLen = 64 - index;
 if (inputLen >= partLen)
 {
 memcpy ((POINTER)&context->buffer[index], (POINTER)input, partLen);
 HashFunct (context->state, context->buffer); //作变换
 for (i = partLen; i + 63 < inputLen; i += 64) //对所有分组进行变换
   HashFunct (context->state, &input[i]);
   index = 0;
 }
 else
  i = 0;
memcpy ((POINTER)&context->buffer[index], (POINTER)&input[i],inputLen-i);
}

    HashFunct()对输入的64字节(512位)数据进行四轮64次变换,对应2.3节第五步。
    HashFunct (unsigned long state[4], unsigned char block[64]);
    MD5Final()函数对数据进行补位后再调用HashFunct()函数作变换加密处理。
void MD5Final (unsigned char digest[16],MD5_CTX *context)
{
unsigned char bits[8];
unsigned int index, padLen;
Decompose(bits, context->count, 8);
index = (unsigned int)((context->count[0] >> 3) & 0x3f);
padLen = (index < 56) ? (56 - index) : (120 - index);
MD5Update (context, BUFFER, padLen);
MD5Update (context, bits, 8);
Decompose(digest, context->state, 16);
ClearBuff ((POINTER)context, 0, sizeof (*context));
}

4. 程序测试
    MD5 ("") = d41d8cd98f00b204e9800998ecf8427e
    MD5 ("a") = 0cc175b9c0f1b6a831c399e269772661
    MD5 ("abc") = 900150983cd24fb0d6963f7d28e17f72
    MD5 ("message digest") = f96b697d7cb7938d525a2f31aaf161d0
    MD5 ("abcdefghijklmnopqrstuvwxyz") = c3fcd3d76192e4007dfb496cca67e13b
    MD5("ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789") =d174ab98d277d9f5a5611c2c9f419d9f
    MD5("12345678901234567890123456789012345678901234567890123456789012345678901234567890") = 57edf4a22be3c955ac49da2e2107b67a

总结
    MD5是一种信息摘要算法,它可以对文件产生一个唯一的MD5验证码。MD5比MD4稍微慢一些,但却更为安全。MD5的典型应用是对一段信息(message)产生信息摘要(message-digest),以防止被篡改。
    MD5广泛用于网络传输中,以确认文件的完整性。MD5还可以应用于数字签名中。MD5还广泛用于加密和解密技术上,用MD5加密技术以确认密码是否正确。

5. 软件下载演示
点击下载MD5报文摘要软件

6. 参考文献
1. Kernighan “The C programming language ”(Second Edition) 机械工业出版社;
2. Charles Petzold “Windows 程序设计” 北京大学出版社;
3. R. Rivest (RFC1321——The MD5 Message-Digest Algorithm)

注:此论文是我在《计算机网络安全》课程学习时的课程设计论文。
 

中国科学技术大学继续教育学院 © 版权所有, 联系我们
School of Distance Learning and Continuing Education of USTC © Copyright 2006, All Rights Reserved