高效的文件差异比较工具

在本文中,将探讨如何创建一个既快速又节省内存的文件差异比较工具。这个工具的目标是能够展示Grid1.html和Grid2.html文件之间的差异。在开发过程中,提交了一个名为MeanFileCompare的C++版本,但发现C#版本更具挑战性,因为似乎无论如何都会分配大量的内存。目标是尽可能地减少内存使用,并实现快速的运行时间。接下来,将详细解释所使用的内存优化技术。

通过技术,能够在首次运行时将差异时间控制在30到50毫秒之间,而在所有JIT(即时编译)完成后的第二次运行中,差异时间可以缩短到4到10毫秒。

使用代码

为了能够显示行号和文本,采用了逐字节比较的方法来进行差异比较。以下是文件比较的主循环:

public void CompareFiles(string file1, string file2) { try { _compareFile1 = new CompareFile(file1); _compareFile2 = new CompareFile(file2); } catch (FileNotFoundException ex) { _output.Append(ex.Message); return; } while (true) { if (_compareFile1._buffer[_compareFile1._currentBufferIndex] == _compareFile2._buffer[_compareFile2._currentBufferIndex]) { if (_compareFile1._buffer[_compareFile1._currentBufferIndex] == '\n') { _compareFile1._currentLineNumber++; _compareFile2._currentLineNumber++; _compareFile1._startOfLine = _compareFile1._currentBufferIndex + 1; _compareFile2._startOfLine = _compareFile2._currentBufferIndex + 1; } _compareFile1._currentBufferIndex++; _compareFile2._currentBufferIndex++; if (_compareFile1._currentBufferIndex == _compareFile1._totalBytesInBuffer) { _compareFile1.ReadMoreData(); } if (_compareFile2._currentBufferIndex == _compareFile2._totalBytesInBuffer) { _compareFile2.ReadMoreData(); } if (_compareFile1._fileCompletelyRead || _compareFile2._fileCompletelyRead) { if (_compareFile1.EndOfFile || _compareFile2.EndOfFile) { if (!_compareFile1.EndOfFile || !_compareFile2.EndOfFile) { FindDifferences(); } break; } } } else { _compareFile1.ReadMoreData(); _compareFile2.ReadMoreData(); FindDifferences(); if (_compareFile1.EndOfFile && _compareFile2.EndOfFile) { break; } } } _compareFile1.CloseFile(); _compareFile2.CloseFile(); }

为了保持程序的“精简”和“高效”,分配了一个2K的缓冲区,并以块的形式读取数据来进行比较。虽然直接读取整个文件并使用全部187,731字节进行比较会更容易,但认为这并不符合“精简”的精神。如果需要增加缓冲区大小以比较超过2K大小限制的行,或者比较的差异超出了限制,会以2K的块增加缓冲区大小,直到行或比较满足为止。

[DllImport("kernel32.dll", SetLastError = true)] public static extern unsafe bool ReadFile(IntPtr handle, IntPtr buffer, UInt32 numberOfBytesToRead, out UInt32 numberOfBytesRead, IntPtr overlapped); unsafe bool ReadBytes(int offset, UInt32 bytesToRead, ref UInt32 bytesRead) { fixed (byte* pBuffer = _buffer) { IntPtr p = (IntPtr)(pBuffer + offset); if (ReadFile(_fileHandle, p, bytesToRead, out bytesRead, IntPtr.Zero)) { return true; } return false; } }
沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485