Gần đây tôi gặp 1 tình huống củ khoai. Chuyện là sếp yêu cầu làm 1 cái landing page bằng WordPress. Mọi chuyện chắc cũng bình thường nếu như tôi không phải là 1 thằng hoàn toàn không biết gì về WordPress.
May sao, 1 em gái xinh đẹp trong team có kinh nghiệm build theme WordPress trước đó. Mặc dù khả năng code của em có hạn nhưng vẫn tin tưởng giao em xây dựng website này. Tự phụ với cái trình PHP tự vọc tự vạch chắc cũng không có vấn đề gì về quản lý 1 website đã chạy.
Nhưng mà đời thì không như mơ, demo chả sao, deploy production 6h chiều 8h tối site bị hack tè le hột me. Đau khổ mất 1 phút rồi lại ngồi restone và chặn các PHP functions nguy hiểm lại.
Anh PM hôm sau, than trời nội dung vừa đẩy cả chiều hôm trước hôm sau die hết. Liệu lần này có bị nữa không. Nói thật, bản thân mình cũng ko dám chắc để trả lời. Bài toán đặt ra: Làm sao để kiểm soát được cái source này đây?
Hóc búa 1
Về bản chất, WordPress là open-source, nghĩa là mọi ngóc ngách, plugins của nó, đường dẫn tập tin, thư mục, nội dung như nào đã nằm tơ hơ trên mạng rồi. Bản thân lại không có kinh nghiệm quản lý WordPress và CHMOD nó. Nên bài toán đặt ra: Làm sao bảo toàn được các file source-code mà không bị ai can thiệp kể cả thằng đó là thằng dev cùng mình?
Sau vài đêm ôm gối nằm mơ thỉnh giáo các cao nhân, có vài cách khả dĩ như sau
Quản lý file dựa trên checkSum
Như anh em đã biết, mỗi 1 file đều có 1 cái checkSum riêng biệt, cái hash này là unique cho các tập tin. Vậy thì kịch bản khả dĩ như sau:
- Dựng 1 lệnh quét toàn bộ file trong hệ thống (đương nhiên các tập tin source thôi)
- Tính toán checkSum của từng file. Cái này đầy thư viện có sẵn (tham khảo: https://www.php.net/manual/en/function.md5-file.php)
- Tạo 1 cái SQLite DB -> chạy và insert vào đây. Tập tin này cần cấp quyền chỉ đọc và không được ghi, không được xóa
- Viết 1 file checkSum.php chẳng hạn, định kì chạy file này, tính toán checkSum của từng tập tin rồi so sánh với bản checkSum ban đầu -> ghi log.
Đến đây thì coi như là có công cụ giám sát rồi. Tuy nhiên thì nó vẫn chưa triệt để lắm. Thằng nào up mã độc lên đám source thì sao. Làm sao để quét cả nghìn tập tin bây giờ?
Nghĩ ngợi mất cả ngày. Tình cờ, thấy thằng VirusTotal cung cấp API, khá đủ tính năng. Ngồi ngâm cứu mất trọn 3 tiếng trong lúc đã hết 1 gói mì hảo hảo chua cay. Kịch bản có vẻ ổn hơn
- Viết command lấy danh sách tất cả các file (recursive) trong thư mc5
- Chạy vòng lặp lần lượt gọi tới API scan và getReport của VirusTotal
- Phân tích response_code của API trả về. Nếu đã có kết quả -> check thời gian lần cuối báo cáo. Hoặc nếu muốn thì reScan luôn
- getReport từ API report của VirusTotal
- Lấy dữ liệu từ API Report -> check xem có thằng nào warning không -> gửi email đến system admin hoặc dev tùy
- Set cho hệ thống tự chạy vào thời điểm nào ít người truy cập
- Tận hưởng thành quả
Okay, đến đây có vẻ đã xây được 1 con monitor ngon lành rồi. Phần còn lại dưới đây là source-code full không che mà mình đã build thành 1 thư viện hoàn chỉnh, có thể sử dụng composer để build: https://packagist.org/packages/nguyenanhung/dr-virus
Cách hướng dẫn sử dụng được viết chi tiết trong link packages.
Nguyễn An Hưng