Trang chủ Phần mềm Tiện ích DocFetcher: Tìm nội dung tiếng Việt trong hàng loạt file văn bản

DocFetcher: Tìm nội dung tiếng Việt trong hàng loạt file văn bản

DocFetcher là ứng dụng mã nguồn mở cho Windows và Linux, giúp bạn tìm kiếm tập tin, thư mục hay nội dung bên trong file, email Outlook nhanh hơn bao giờ hết. Đặc biệt hỗ trợ tìm nội dung tiếng Việt.

Tải tại: http://docfetcher.sourceforge.net/en/download.html
Tương thích: Windows XP/Vista/7/8 (32-bit và 64-bit)
Yêu cầu: Java

Sau khi tải về, bạn kích đôi vào tập tin thực thi để tiến hành cài đặt, hoặc giải nén và chạy ngay chương trình nếu tải bản portable.

Để sử dụng DocFetcher tìm kiếm nội dung file, việc đầu tiên bạn cần làm là thiết lập chỉ mục cho các thư mục chứa file muốn tìm kiếm. Tại mục Document Types bạn chọn vào các định dạng tập tin muốn tìm kiếm như là HTML, CHM, DOC, XLS, ODS… Sau đó, tại khung Search Scope, bạn nhấn phải chuột chọn Create Index From > Folder, chỉ đường dẫn đến thư mục muốn tạo chỉ mục, DocFetcher sẽ tự tạo ra một chỉ số cho tất cả các tài liệu có trong thư mục đó.

Lưu ý, lúc bạn chọn các định dạng ở phía trên, bên trong mỗi định dạng đó còn bao gồm nhiều định dạng con chẳng hạn như là MS Word 2007 (docx, docm), HTML (html, htm…). Để loại bỏ định dạng tập tin bất kỳ, bạn kích chọn vào biểu tượng dấu cộng ở trường Exclude files/detect mime type. Ví dụ để loại trừ các tập tin Microsoft Excel, tại cột Pattern (regex) bạn sửa lại thành .*\.xls là được.

Cuối cùng nhấn Run để chương trình bắt đầu lập chỉ mục, thời gian để hoàn tất việc này sẽ tùy thuộc vào số lượng và kích thước tập tin.

Bây giờ, để tìm kiếm một tập tin hay nội dung văn bản bất kỳ, bạn chỉ cần nhập từ khóa vào khung tìm kiếm phía trên (có thể nhập vào các từ khóa liên tục với nhau mà không cần dấu phẩy) rồi nhấn Search. Các kết quả trả về sẽ hiển thị ở khung nhỏ bên dưới thanh công cụ tìm kiếm, bạn nhấn tập tin bất kỳ để xem nội dung bên trong. Chương trình hỗ trợ tìm kiếm tốt các tập tin có nội dung bằng tiếng Việt.

Trịnh Nguyễn Minh Hoàng (eChip)

- Advertisement -
Huỳnh Mai Anh Kiệthttps://www.mangbinhdinh.vn
Anh là một người đam mê công nghệ. Hiện tại anh là một lập trình viên tại Quy Nhơn.

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

BÀI VIẾT MỚI

Cách tùy chỉnh công cụ tìm kiếm trong Firefox

Bạn có thể sử dụng bất kỳ công cụ tìm kiếm nào mà bạn thích trong trình duyệt web của mình. Và bạn cũng...

12 cách khắc phục con trỏ chuột không hiển thị trong Windows 10

Con trỏ chuột đã trở thành một phần không thể thiếu trong quá trình chúng ta tương tác với máy tính. Vì vậy, hãy...

Facebook sập mạng toàn thế giới gần 30 phút trong sáng ngày 09/04/2021

Trong khoảng thời gian từ 4:30 tới 4:55 sáng ngày 09/04/2021, tất cả phương thức truy cập Facebook đều bị tê liệt trên toàn...

Twitter đưa tính năng phòng trò chuyện thoại Spaces lên phiên bản web trên máy tính

Spaces là một tính năng mới của Twitter. Đây là tính năng giúp người dùng Twitter trên iOS và Andoid có thể trò chuyện...

Hướng dẫn từng bước tạo ứng dụng cho Shopify

Ngày nay, Shopify cung cấp cho hơn 1.000.000 doanh nghiệp trên toàn thế giới. Nếu bạn chưa từng sử dụng Shopify nhưng đã quen...

BẠN XEM CHƯA

Facebook bị kiện vì thu thập tin nhắn người dùng trái phép

Facebook một lần nữa gặp rắc rối về sự riêng tư của người dùng. Facebook phải đối mặt với một vụ kiện ở Bắc...

Khám phá đầm Thị Nại

Ngay ở Quy Nhơn, có rất nhiều điểm đến để bạn vừa thực hiện chuyến nghỉ dưỡng của mình, vừa khám phá cuộc sống...

Google công bố mã nguồn trình phân tích tập tin robots.txt

Google tuyên bố rằng Robots Exclusion Protocol (REP) là một tiêu chuẩn không chính thức trong 25 năm qua. Nó mang lại nhiều nghi...

Tạo lịch năm mới theo phong cách cá nhân

Bạn nhàm chán với những mẫu lịch có sẵn trên thị trường và muốn tạo cho mình những tấm lịch với những hình ảnh...

Cơm chiên năm nào…

Tối nay lại thức đêm cùng... dự án rồi chợt thấy đói bụng nên vào bếp lục cơm chiên ăn. Bất chợt nhớ lại...