Chưa
bao giờ chúng ta chìm ngập trong một biển thông tin mênh mông như trong thời
buổi phát triển Internet này. Lượng thông tin ấy lớn như thế nào, và chúng ta
phải ứng xử ra sao?
Hàng tỷ GB dữ liệu
được tạo ra mỗi ngày
Người ta ước tính rằng trong năm 2013 toàn thế giới tạo ra
1.000 exabyte dữ liệu. Một exabyte bằng 1.000 petabyte, một petabyte bằng 1.000
terabyte, và một terabyte bằng 1.000 gigabyte. Nghĩa là một exabyte bằng một tỷ gigabyte. Tức là năm 2013 toàn thế giới tạo
ra một ngàn tỷ GB dữ liệu. Tính trung bình mỗi ngày chúng ta sản sinh ra gần
2,5 tỷ GB dữ liệu. Nếu tính dân số thế giới là 7 tỷ người, thì đổ đồng mỗi
người từ em bé mới sinh tới người già sắp chết trong năm 2013 được chia phần
143 GB dữ liệu! Thế nhưng một người dù có tỉ mỉ tẳn mẳn suốt ngày ngồi đọc web
thì cả cuộc đời chỉ có thể nuốt trôi được 2GB dữ liệu văn bản thôi.
Còn theo Eric Schmidt (CEO của Google) thì:
-
Cả năm 2003 thế giới tạo ra 5 tỷ GB dữ liệu.
-
Đến năm 2010 thế giới chỉ mất có 2 ngày để tạo ra 5 tỷ
GB dữ liệu.
-
Và năm 2014, chỉ trong 10 phút thế giới đã tạo ra 5 tỷ
GB dữ liệu.
(như vậy theo Eric Schmidt thì con số 2,5 tỷ GB dữ liệu tạo
ra mỗi ngày đạt được từ năm 2010 chứ không phải 2013!)
Chúng ta như con
thuyền bé tẹo ngập trong biển thông tin
Do đâu mà lượng dữ
liệu tạo ra lớn như vậy?
Trước kia, mỗi người, mỗi doanh nghiệp làm việc trên máy
tính riêng của mình và dữ liệu được đưa lên đấy. Hiện nay, với sự phát triển
đến mức trở nên thông dụng của Internet, sự bùng nổ của mạng xã hội và điện toán
đám mây, người ta đưa vô số dữ liệu lên mạng Internet.
Chính việc mọi thứ đều được số hóa (đặc biệt là ảnh, video
vốn có dung lượng lớn) và đưa lên mây
khiến cho thế giới sinh ra một lượng dữ liệu khổng lồ. Người ta gọi đó là big-data.
Hệ quả của big data
Với lượng dữ liệu khổng lồ như vậy, mỗi người chúng ta như
ngập chìm trong biển dữ liệu. Trong điều kiện như vậy, chọn lọc và tìm kiếm dữ
liệu cần thiết để lấy ra đúng dữ liệu đáp ứng nhu cầu của mình là điều vô cùng
quan trọng. Đó là lý do tại sao các công cụ tìm kiếm phát triển mạnh mẽ , trong
đó nổi bật là Google.
Mặt khác, việc tổng hợp và phân tích lượng dữ liệu lớn cũa
là một khía cạnh đang được quan tâm.
Việc phân tích đó sẽ đưa big-data trở thành smart-data (dữ
liệu thông minh), khi đó big-data sẽ trở thành một công cụ mạnh mẽ giúp chúng
ta nghiên cứu thói quen, tâm lý và đặc biệt những tương tác xã hội phức tạp của
con người. Nếu như big-data có thể chứa thông tin về nhu cầu người dùng, thì
smart-data có khả năng đề xuất giải pháp giúp người dùng quyết định hành vi của
mình.
Google có thể giúp dự đoán việc bùng phát bệnh dịch dựa trên
những từ khoá người dùng tìm kiếm; ngành y có thể dựa trên nền tảng big-dat để
chẩn đoán và đưa ra phương pháp điều trị; các hãng hàng không có thể dự báo
thời gian cao điểm của mỗi chuyến bay và đưa ra những giải pháp phù hợp nhằm
tối ưu hiệu quả kinh doanh. Không những vậy, Boeing còn phát triển một hệ thống
giúp máy bay có thể tự gửi thông tin về những sự cố máy bay sẽ gặp phải cho sân
bay, nhằm rút ngắn thời gian máy bay phải nằm chờ kiểm tra và sửa chữa.
Sử dụng thông tin người dùng từ Google, Facebook, Twitter,
nhóm vận động tranh cử của Tổng thống Barack Obama đã tạo ra một framework
giúp dự đoán khả năng thắng cử 48 lần/ngày (cứ nửa tiếng/lần), đồng thời đưa ra
thông tin “những ai đang bầu cho ai” và “những ai chưa biết bầu cho ai”, từ đó
có chiến lược tác động lên những người chưa biết bầu cho ai, góp phần giúp
Obama đắc cử lần thứ 2.
Thậm chí, dựa trên những dữ liệu về quy luật thị trường
chứng khoán, đã có người có thể tạo ra thuật toán giúp dự báo chính xác tình
trạng của từng cổ phiếu.
Cần sự tỉnh táo của
người dùng
Các hướng phân tích big-data để đưa vào ứng dụng là lĩnh vực
nghiên cứu mới mẻ của các chuyên gia, chúng ta chỉ đóng vai trò người đóng góp
dữ liệu và thừa hưởng kết quả nghiên cứu chứ không đóng vai trò chủ động.
Đối với người dùng bình thường thì có lẽ việc lớn nhất là sử
dụng công cụ tìm kiếm (Google, Bing, Yahoo…) để tìm ra thông tin cần thiết. Cần
chú ý rằng các công cụ tìm kiếm ấy đều có những kỹ thuật tìm kiếm để đạt được
kết quả hợp lý nhất mà nhiều người chưa biết. Vì thế nên tìm hiểu để tiết giảm
thời gian và công sức của mình trong việc tìm kiếm.
Bên cạnh đó, có một vấn đề không liên quan gì lắm đến công
nghệ mà mỗi người chúng ta cần phải lưu tâm. Đó là dữ liệu tuy nhiều nhưng
không phải tất cả đều đúng. Càng nhiều thông tin thì càng dễ dẫn đến sự nhiễu
thông tin. Do đó người dùng cần có sự tỉnh táo để nhận định xem thông tin nào
là đúng mà sử dụng cho hiệu quả, tránh bị sai lệch trong việc tiếp thu chúng.
Phạm Hoài Nhân
LĐĐN - 16/06/2014
Không có nhận xét nào:
Đăng nhận xét