Thứ Hai, 16 tháng 6, 2014

Chìm trong biển thông tin

Chưa bao giờ chúng ta chìm ngập trong một biển thông tin mênh mông như trong thời buổi phát triển Internet này. Lượng thông tin ấy lớn như thế nào, và chúng ta phải ứng xử ra sao?

Hàng tỷ GB dữ liệu được tạo ra mỗi ngày

Người ta ước tính rằng trong năm 2013 toàn thế giới tạo ra 1.000 exabyte dữ liệu. Một exabyte bằng 1.000 petabyte, một petabyte bằng 1.000 terabyte, và một terabyte bằng 1.000 gigabyte. Nghĩa là một exabyte bằng một tỷ gigabyte. Tức là năm 2013 toàn thế giới tạo ra một ngàn tỷ GB dữ liệu. Tính trung bình mỗi ngày chúng ta sản sinh ra gần 2,5 tỷ GB dữ liệu. Nếu tính dân số thế giới là 7 tỷ người, thì đổ đồng mỗi người từ em bé mới sinh tới người già sắp chết trong năm 2013 được chia phần 143 GB dữ liệu! Thế nhưng một người dù có tỉ mỉ tẳn mẳn suốt ngày ngồi đọc web thì cả cuộc đời chỉ có thể nuốt trôi được 2GB dữ liệu văn bản thôi.

Còn theo Eric Schmidt (CEO của Google) thì:

-          Cả năm 2003 thế giới tạo ra 5 tỷ GB dữ liệu.
-          Đến năm 2010 thế giới chỉ mất có 2 ngày để tạo ra 5 tỷ GB dữ liệu.
-          Và năm 2014, chỉ trong 10 phút thế giới đã tạo ra 5 tỷ GB dữ liệu.

(như vậy theo Eric Schmidt thì con số 2,5 tỷ GB dữ liệu tạo ra mỗi ngày đạt được từ năm 2010 chứ không phải 2013!)

Chúng ta như con thuyền bé tẹo ngập trong biển thông tin

Do đâu mà lượng dữ liệu tạo ra lớn như vậy?

Trước kia, mỗi người, mỗi doanh nghiệp làm việc trên máy tính riêng của mình và dữ liệu được đưa lên đấy. Hiện nay, với sự phát triển đến mức trở nên thông dụng của Internet, sự bùng nổ của mạng xã hội và điện toán đám mây, người ta đưa vô số dữ liệu lên mạng Internet.

Chính việc mọi thứ đều được số hóa (đặc biệt là ảnh, video vốn có dung lượng lớn) và đưa lên mây khiến cho thế giới sinh ra một lượng dữ liệu khổng lồ. Người ta gọi đó là big-data.

Hệ quả của big data

Với lượng dữ liệu khổng lồ như vậy, mỗi người chúng ta như ngập chìm trong biển dữ liệu. Trong điều kiện như vậy, chọn lọc và tìm kiếm dữ liệu cần thiết để lấy ra đúng dữ liệu đáp ứng nhu cầu của mình là điều vô cùng quan trọng. Đó là lý do tại sao các công cụ tìm kiếm phát triển mạnh mẽ , trong đó nổi bật là Google.

Mặt khác, việc tổng hợp và phân tích lượng dữ liệu lớn cũa là một khía cạnh đang được quan tâm.

Việc phân tích đó sẽ đưa big-data trở thành smart-data (dữ liệu thông minh), khi đó big-data sẽ trở thành một công cụ mạnh mẽ giúp chúng ta nghiên cứu thói quen, tâm lý và đặc biệt những tương tác xã hội phức tạp của con người. Nếu như big-data có thể chứa thông tin về nhu cầu người dùng, thì smart-data có khả năng đề xuất giải pháp giúp người dùng quyết định hành vi của mình.

Google có thể giúp dự đoán việc bùng phát bệnh dịch dựa trên những từ khoá người dùng tìm kiếm; ngành y có thể dựa trên nền tảng big-dat để chẩn đoán và đưa ra phương pháp điều trị; các hãng hàng không có thể dự báo thời gian cao điểm của mỗi chuyến bay và đưa ra những giải pháp phù hợp nhằm tối ưu hiệu quả kinh doanh. Không những vậy, Boeing còn phát triển một hệ thống giúp máy bay có thể tự gửi thông tin về những sự cố máy bay sẽ gặp phải cho sân bay, nhằm rút ngắn thời gian máy bay phải nằm chờ kiểm tra và sửa chữa.

Sử dụng thông tin người dùng từ Google, Facebook, Twitter, nhóm vận động tranh cử của Tổng thống Barack Obama đã tạo ra một framework giúp dự đoán khả năng thắng cử 48 lần/ngày (cứ nửa tiếng/lần), đồng thời đưa ra thông tin “những ai đang bầu cho ai” và “những ai chưa biết bầu cho ai”, từ đó có chiến lược tác động lên những người chưa biết bầu cho ai, góp phần giúp Obama đắc cử lần thứ 2.

Thậm chí, dựa trên những dữ liệu về quy luật thị trường chứng khoán, đã có người có thể tạo ra thuật toán giúp dự báo chính xác tình trạng của từng cổ phiếu.

Cần sự tỉnh táo của người dùng

Các hướng phân tích big-data để đưa vào ứng dụng là lĩnh vực nghiên cứu mới mẻ của các chuyên gia, chúng ta chỉ đóng vai trò người đóng góp dữ liệu và thừa hưởng kết quả nghiên cứu chứ không đóng vai trò chủ động.

Đối với người dùng bình thường thì có lẽ việc lớn nhất là sử dụng công cụ tìm kiếm (Google, Bing, Yahoo…) để tìm ra thông tin cần thiết. Cần chú ý rằng các công cụ tìm kiếm ấy đều có những kỹ thuật tìm kiếm để đạt được kết quả hợp lý nhất mà nhiều người chưa biết. Vì thế nên tìm hiểu để tiết giảm thời gian và công sức của mình trong việc tìm kiếm.

Bên cạnh đó, có một vấn đề không liên quan gì lắm đến công nghệ mà mỗi người chúng ta cần phải lưu tâm. Đó là dữ liệu tuy nhiều nhưng không phải tất cả đều đúng. Càng nhiều thông tin thì càng dễ dẫn đến sự nhiễu thông tin. Do đó người dùng cần có sự tỉnh táo để nhận định xem thông tin nào là đúng mà sử dụng cho hiệu quả, tránh bị sai lệch trong việc tiếp thu chúng.


Phạm Hoài Nhân
LĐĐN - 16/06/2014

Không có nhận xét nào:

Đăng nhận xét