Thứ Ba, 18 tháng 4, 2017

Bước vào kỷ nguyên mới của Thời đại dữ liệu

Tập đoàn Dữ liệu Quốc tế (IDC) vừa giới thiệu sách trắng Thời đại Dữ liệu 2025, một tài liệu phân tích và dự báo tình hình phát triển dữ liệu của thế giới cho đến năm 2025. Tài liệu này do ba nhà phân tích của Tập đoàn dữ liệu quốc tế IDC là David Reinsel, John Gantz và John Rydning, biên soạn trong tháng 3-2017 với sự bảo trợ của Seagate Technology. Trong tài liệu, các nhà phân tích cho rằng loài người đang đến rất gần một kỷ nguyên mới của Thời đại Dữ liệu (Data Age).

Bìa sách Data Age 2025


Những con số về tình hình phát triển dữ liệu

Năm 2013 đánh dấu một cột mốc lịch sử khi người ta thống kê rằng trong năm này toàn thế giới đã tạo ra 1.000 exabyte dữ liệu. Con số này lớn tới cỡ nào? 1 exabyte = 1.000 petabytes. 1 petabyte = 1.000 terabytes. 1 terabytes = 1.000 GB. Như vậy 1.000 exabytes bằng một ngàn tỷ GB dữ liệu.

Nếu vẫn chưa hình dung ra độ lớn của con số này, xin đọc số liệu minh họa sau đây: Vào cuối thập niên 1980, khi máy vi tính mới bắt đầu xuất hiện tại Việt Nam thì nó chủ yếu được dùng để xử lý văn bản và lưu trữ số liệu. Trong văn bản, mỗi ký tự tương ứng với 1 byte, còn trung bình mỗi con số tương ứng với 4 bytes. Khi ấy, với 1 đĩa mềm 1,2 hay 1,44 MB (1 MB = 1 triệu byte) người ta tha hồ mà chứa dữ liệu của mình. Rồi tình hình phát triển dần lên, người ta dùng đĩa cứng (HDD) có dung lượng vài chục MB, lên đến vài trăm MB rồi vài GB (Gigabyte = 1.000 MB hay 1 tỷ bytes), vài trăm GB và bây giờ những máy tính, laptop đắt tiền đã có HDD lên tới 1 TB (1 terabyte = 1.000 GB). Dung lượng khổng lồ 1 TB này thật ra chỉ bằng một phần tỷ của con số 1.000 exabytes dữ liệu thế giới tạo ra trong một năm!

Một hình ảnh minh họa khác: Hàng ngày ta vẫn đọc báo, đọc tin tức trên mạng. Nếu một người ngồi đọc liên tục không nghỉ suốt đời thì số dữ liệu văn bản được đưa vào đầu chỉ tương đương với 2 GB mà thôi!

Nếu đã kinh ngạc với con số 1.000 exabytes dữ liệu được tạo ra năm 2013 thì bạn sẽ kinh ngạc hơn nữa khi biết rằng năm 2016 (tức chỉ 3 năm sau) số dữ liệu mà con người tạo ra là 16,1 zettabytes. 1 zettabyte = 1.000 exabytes. 16,1 zettabytes chính là 16,1 ngàn tỷ GB, tức là gấp 16 lần so với năm 2013!

Chưa hết, các nhà phân tích còn dự báo rằng đến năm 2025 lượng dữ liệu mà con người tạo ra trong một năm sẽ là 163 zettabytes, tức gấp hơn 10 lần hiện nay.

Chính vì vậy, bản phân tích của IDC nói rằng loài người đang tiến ngày càng nhanh tới một kỷ nguyên mới của Thời đại Dữ liệu (Data Age).

Vì sao phát sinh nhiều dữ liệu như vậy?

Văn bản hay số liệu không chiếm nhiều dung lượng dữ liệu, nhưng việc phát triển công nghệ đã tạo nên nhiều dạng dữ liệu số khác: hình ảnh, âm thanh, video… Các loại hình này có kích thước file lớn hơn nhiều so với file văn bản. Thí dụ: file hình ảnh có kích thước từ vài trăm KB đến hàng chục MB, một bộ phim có kích thước đến vài GB. Có thể thấy việc chuyển từ truyền hình analog sang kỹ thuật số (được ghi với dạng dữ liệu số) cũng đã làm tăng lượng dữ liệu phát sinh lên rất nhiều.

Trước đây, dữ liệu số được tạo nên chủ yếu bằng máy tính và phục vụ chủ yếu cho kinh doanh, quản lý, quốc phòng. Bây giờ có quá nhiều thiết bị để tạo nên dữ liệu số, trong đó đáng kể nhất là điện thoại di động. Hầu như ai cũng có điện thoại di động, hàng ngày ta dùng chúng để chụp ảnh, quay phim, nhắn tin… Tất cả các động thái này đều tạo nên dữ liệu, và chiếc điện thoại di động như một miệng phễu chứa vô số loại dữ liệu khác nhau…

Điện thoại di động như một miệng phễu thu hút đủ loại dữ liệu

Một dạng công nghệ đang phát triển mạnh nữa là Internet của Vạn vật (IoT: Internet of Things). Với IoT, mỗi đồ vật, con người được cung cấp một định danh của riêng mình, và tất cả có khả năng truyền tải, trao đổi thông tin, dữ liệu qua một mạng duy nhất mà không cần đến sự tương tác trực tiếp giữa người với người, hay người với máy tính. Việc truyền tải thông tin này chắc chắn sẽ làm phát sinh lượng dữ liệu đáng kể.

Theo bản phân tích và ước tính của IDC, vào năm 2025, hơn 25% tổng dung lượng dữ liệu toàn cầu sẽ được hình thành trong thời gian thực (real-time, thí dụ như live video, theo dõi qua camera, trao đổi trực tiếp qua smartphone, hay IoT), trong đó dữ liệu IoT chiếm tới hơn 95% của số này.

Những vấn đề cần quan tâm

Bỏ qua những dữ liệu không quan trọng, mang tính giải trí (phim ảnh, ca nhạc, chuyện trò linh tinh…), có rất nhiều dữ liệu đóng vai trò quan trọng trong đời sống con người (các thông tin cá nhân, số liệu tài chính, tài khoản ngân hàng…). Với sự bùng nổ dữ liệu, đặc biệt là IoT, những dữ liệu quan trọng ngày càng nhiều hơn nữa. Nói cách khác, con người lệ thuộc ngày càng nhiều vào thiết bị, các thiết bị này vận hành bởi những dữ liệu, do đó dữ liệu đóng vai trò quan trọng trong cuộc sống con người.

Bản phân tích của IDC nhận định: “Dữ liệu đã trở nên một phần tất yếu đối với tất cả mọi khía cạnh của cuộc sống con người trong vòng 30 năm qua. Nó đã thay đổi cách chúng ta được giáo dục và giải trí. Nó thông tin cách chúng ta trải nghiệm với con người, công việc và thế giới rộng hơn chung quanh mình. Chỉ trong vòng 10 năm qua, xã hội loài người đã chứng kiến sự chuyển đổi từ analog lên digital. Trong thập niên tới đây, sức mạnh của dữ liệu hầu như không có giới hạn.”

Theo ước tính của IDC, gần 20% tổng dung lượng dữ liệu toàn cầu sẽ có tầm mức quan trọng sống còn đối với cuộc sống hàng ngày của chúng ta, và gần 10% trong số đó là “cực kỳ sống còn” (hypercritical).

Trong bối cảnh đó bảo mật thông tin, an toàn dữ liệu là vấn đề vô cùng quan trọng. Theo IDC, hiện nay có khoảng 50% dữ liệu cần được đảm bảo an toàn thông tin ở một mức độ nào đó, đến năm 2025, con số này sẽ là 87%. Mặc dù vậy hiện nay các giải pháp bảo mật, đảm bảo an toàn thông tin chỉ mới đáp ứng được 50% nhu cầu cần thiết.


Phạm Hoài Nhân
LĐĐN - 17/04/2017

Không có nhận xét nào:

Đăng nhận xét