Đầu tháng 10 này Facebook cho biết họ vừa đệ đơn kiện 2 công ty tại Mỹ về tội đã sử dụng phương pháp cạo (scraping) trên website để thực hiện việc thu thập dữ liệu trên phạm vi toàn cầu. Thông tin này khiến người ta nhớ lại ngày xưa thường dùng chữ “nghề cạo giấy” để chỉ những người làm việc bàn giấy trong công sở. Hóa ra xưa có “nghề cạo giấy”, còn nay có “nghề cạo web”.
Thế nào là web scraping?
Web scraping hay Data scraping là một thuật ngữ công nghệ thường
được giới chuyên môn ở Việt Nam dịch là “quét dữ liệu” từ các trang web, tuy
nhiên nếu dịch sát nghĩa hơn và cũng mô tả đúng bản chất công việc hơn thì nên
là “cạo dữ liệu” từ các trang web.