在本文中,将探讨如何创建一个既快速又节省内存的文件差异比较工具。这个工具的目标是能够展示Grid1.html和Grid2.html文件之间的差异。在开发过程中,提交了一个名为MeanFileCompare的C++版本,但发现C#版本更具挑战性,因为似乎无论如何都会分配大量的内存。目标是尽可能地减少内存使用,并实现快速的运行时间。接下来,将详细解释所使用的内存优化技术。
通过技术,能够在首次运行时将差异时间控制在30到50毫秒之间,而在所有JIT(即时编译)完成后的第二次运行中,差异时间可以缩短到4到10毫秒。
为了能够显示行号和文本,采用了逐字节比较的方法来进行差异比较。以下是文件比较的主循环:
public void CompareFiles(string file1, string file2)
{
try
{
_compareFile1 = new CompareFile(file1);
_compareFile2 = new CompareFile(file2);
}
catch (FileNotFoundException ex)
{
_output.Append(ex.Message);
return;
}
while (true)
{
if (_compareFile1._buffer[_compareFile1._currentBufferIndex] == _compareFile2._buffer[_compareFile2._currentBufferIndex])
{
if (_compareFile1._buffer[_compareFile1._currentBufferIndex] == '\n')
{
_compareFile1._currentLineNumber++;
_compareFile2._currentLineNumber++;
_compareFile1._startOfLine = _compareFile1._currentBufferIndex + 1;
_compareFile2._startOfLine = _compareFile2._currentBufferIndex + 1;
}
_compareFile1._currentBufferIndex++;
_compareFile2._currentBufferIndex++;
if (_compareFile1._currentBufferIndex == _compareFile1._totalBytesInBuffer)
{
_compareFile1.ReadMoreData();
}
if (_compareFile2._currentBufferIndex == _compareFile2._totalBytesInBuffer)
{
_compareFile2.ReadMoreData();
}
if (_compareFile1._fileCompletelyRead || _compareFile2._fileCompletelyRead)
{
if (_compareFile1.EndOfFile || _compareFile2.EndOfFile)
{
if (!_compareFile1.EndOfFile || !_compareFile2.EndOfFile)
{
FindDifferences();
}
break;
}
}
}
else
{
_compareFile1.ReadMoreData();
_compareFile2.ReadMoreData();
FindDifferences();
if (_compareFile1.EndOfFile && _compareFile2.EndOfFile)
{
break;
}
}
}
_compareFile1.CloseFile();
_compareFile2.CloseFile();
}
为了保持程序的“精简”和“高效”,分配了一个2K的缓冲区,并以块的形式读取数据来进行比较。虽然直接读取整个文件并使用全部187,731字节进行比较会更容易,但认为这并不符合“精简”的精神。如果需要增加缓冲区大小以比较超过2K大小限制的行,或者比较的差异超出了限制,会以2K的块增加缓冲区大小,直到行或比较满足为止。
[DllImport("kernel32.dll", SetLastError = true)]
public static extern unsafe bool ReadFile(IntPtr handle, IntPtr buffer, UInt32 numberOfBytesToRead, out UInt32 numberOfBytesRead, IntPtr overlapped);
unsafe bool ReadBytes(int offset, UInt32 bytesToRead, ref UInt32 bytesRead)
{
fixed (byte* pBuffer = _buffer)
{
IntPtr p = (IntPtr)(pBuffer + offset);
if (ReadFile(_fileHandle, p, bytesToRead, out bytesRead, IntPtr.Zero))
{
return true;
}
return false;
}
}