IT 工具箱:面向 IT 专业人员的新产品

如果您需要在多组文件中快速查找重复文件或执行基于模式的搜索,本月推荐的工具可以助您一臂之力。

Greg Steen

Fast Duplicate File Finder:Free Edition

您知道会发生以下情况。您的用户之一通过电子邮件向其他人员发送 PDF 或 Word 文档,每个人都会保存自己的副本。您的网络附加存储 (NAS) 最终会包含同一文档的 100 份副本。在您的个人系统上也有可能发生同样的情况。别忘了您一直想整理但从未实施的所有照片。现在每张您曾保存的 JPG 都有四份副本。

有多种平台(如 SharePoint)能够创建可访问的文档储存库,还有其他工具能够帮助解决此类问题,但并不是在人们开始为已经备份的相同数据保存副本时就加以解决。如今,空间价格可能较低,但实际上并非那样低廉 — 尤其是在考虑电源、备份和热量的成本之后。一种能够帮助解决这种问题的实用工具是重复查找工具,如来自 Mindgems Inc. 的 Fast Duplicate File Finder。

要运行首次重复扫描,只需添加要扫描的目标文件夹,然后单击“Start Scan”(开始扫描)即可。在默认设置的情况下,Fast Duplicate File Finder 将会比较具有相同扩展名的文件是否 100% 相同。您还可以根据相似度的百分比来比较文件。甚至可以选择忽略文件扩展名。

如果您要扫描一个巨大的文件集,则可保存您的重复查找项目,然后注销、休眠、待机或关闭计算机。通过将您的重复搜索组织到项目中,可以轻松地重复使用该模板对相同的目标文件夹集合进行定期检查。其他选项包括跳过零字节文件、扫描开始后自动最小化应用程序、使其保护并避开系统文件和文件夹,以及为扫描选择处理优先级。最后一个选项非常有用,可以用于避免该工具占用所有系统资源,或者为其提供最大资源访问权限以使其更快完成。

扫描完成后,Fast Duplicate File Finder 可以提供多个不同选项。可以让它根据时间戳自动检查可能的重复。还可根据时间戳、扩展名或通配符模式排除不应标记为重复的文件。可以让该程序将重复文件自动迁移(保留文件夹结构)到备用位置。这使您可以对重复文件进行存档,以防万一。如果您对结果感到满意,只需删除重复即可。您还可以让它删除找到的所有空文件夹。

该程序将在主窗口中显示比较结果,包括文件名、文件夹、大小、时间戳、相似度百分比以及重复组编号。这些数据可以帮助您确定哪些文件确实可以删除。还有一个预览窗格,用于显示文件详细信息,如文本文件的内容和图像。通过这种方法,在验证重复时仍可留在该应用程序中。您还可以右键单击某一项目,以查看其标准关联程序。这对本身不适用于快速预览的二进制文件很有帮助。

默认情况下,Fast Duplicate File Finder 将会核对要删除的重复项目。您可选择或取消选择自己的项目。这些项目将以其他颜色突出显示,以使您能在确认迁移或删除操作前轻松找到您更改过的项目。

Fast Duplicate File Finder 是免费的,并且可在几乎所有版本的 Windows 操作系统上运行。您可以从网站上直接下载该工具。还有一个付费版本,名为 Fast Duplicate File Finder Professional,售价 39.95 美元。付费版本添加了一些不同的有趣功能。您可以查找“相似”文件,如亮度已经提高的图像,或者包含额外段落的文本文件。您可以筛选搜索结果,以便按大小或日期排除文件类型和目录或候选文件。借助 Professional 版本,还可将结果导出到 CSV 或 XML,并可通过命令行运行。

下次,您就可以尝试释放部分空间,尝试使用诸如 Fast Duplicate File Finder 这样的工具回收被浪费的空间。

PowerGREP

查找一个文件或一组文件可能相对较为容易,但如果您要查找这些文件中的某一特定字符串或图案该怎么办呢?这可能非常繁琐,尤其是如果涉及大量文件或者分散于不同计算机上的文件时更是如此。来自 Just Great Software Co. Ltd. 的 PowerGREP 工具致力于帮助您精确查找您要寻找的内容。

顾名思义,该程序为您提供了 Linux 或 Unix“grep”外壳命令基于正则表达式进行搜索的强大功能。您可通过易于使用的 Windows GUI 跨越网络或本地文件系统搜索文件。还有很多其他与 Windows 相似的功能。您可以从命令行(如 Windows PowerShell 脚本)运行该程序。此外,像 grep 一样,您不仅可以查找文件中的文本,还可以轻松替换使您的图案与其他内容相匹配的文本。

PowerGREP 使此功能更进一步,除了基本的搜索、替换或列出结果意外,还允许您采用多种不同操作。您可选择以下操作:

  • “Data collection”(数据收集)可将匹配的文本聚合到一个新文件中
  • “Rename files”(重命名文件)允许您根据搜索/替换模式对文件进行批量重命名
  • “Merge files”(合并文件)可以获取所有文件匹配并将它们合并到一个文件中
  • “Split files”(拆分文件)可以使用替换文本语法指定如何将目标文件拆分为多个部分

您可以对操作序列编制脚本,并保存这些脚本以备将来使用。PowerGREP 的另一项出色功能是内置的“Assistant”(助手)窗格。它可为您提供有关功能和界面元素的简洁、有用的提示。只需在该应用程序中单击进入这些功能或界面元素或者悬浮在它们上方即可,而不必使用标准帮助菜单选项。

PowerGREP 具有详尽的帮助指南,包括各个组件的说明以及很多有关正则表达式的示例、参考和教程。还有一个脚本库,其中包含很多有用的正则表达式,如查找电子邮件地址、拆分 Web 日志文件、替换 HTML 属性或标记、替换文件名,当然还有替换或查找文件集中的文本。当您准备好执行操作或操作序列后,即可将其指定到目标路径,然后执行搜索。如果您要进行替换或编辑操作,PowerGREP 还会保留“撤消”历史记录,以免犯错。

在您实际确认更改到文件之前,可以预览结果。还可进行多种操作,如排序、分组、合计以及突出显示,以便轻松验证希望更改的数据。此外,您不必离开程序即可轻松查看尝试 grep 的结果。您可以从命令行运行 PowerGREP,这对批处理文件、外部工具和计划任务(如自动日志文件拆分或“出错警报”类日志文件解析)非常有用。

一份 PowerGREP 许可证的价格为 159 美元。随着购买数量增加会有折扣。PowerGREP 还提供三个月内不满意退款保证。还可从产品网站上下载有限免费试用版。

Greg Steen

Greg Steen是一位技术专家和企业家,酷爱钻研技术。他热衷于
搜罗新工具,帮助 IT 专业人员更轻松地进行操作、解答疑难及开发。

相关内容