Tập đoàn Dữ liệu Quốc tế (IDC) vừa giới thiệu sách trắng Thời đại Dữ liệu 2025, một tài liệu phân
tích và dự báo tình hình phát triển dữ liệu của thế giới cho đến năm 2025. Tài
liệu này do ba nhà phân tích của Tập đoàn dữ liệu quốc tế IDC là David Reinsel,
John Gantz và John Rydning, biên soạn trong tháng 3-2017 với sự bảo trợ của
Seagate Technology. Trong tài liệu, các nhà phân tích cho rằng loài người đang đến
rất gần một kỷ nguyên mới của Thời đại Dữ liệu (Data Age).
Bìa sách Data Age 2025
Những con số về tình
hình phát triển dữ liệu
Năm 2013 đánh dấu một cột mốc lịch sử khi người ta thống kê
rằng trong năm này toàn thế giới đã tạo ra 1.000
exabyte dữ liệu. Con số này lớn tới cỡ nào? 1 exabyte = 1.000 petabytes. 1
petabyte = 1.000 terabytes. 1 terabytes = 1.000 GB. Như vậy 1.000 exabytes bằng
một ngàn tỷ GB dữ liệu.
Nếu vẫn chưa hình dung ra độ lớn của con số này, xin đọc số
liệu minh họa sau đây: Vào cuối thập niên 1980, khi máy vi tính mới bắt đầu
xuất hiện tại Việt Nam thì nó chủ yếu được dùng để xử lý văn bản và lưu trữ số
liệu. Trong văn bản, mỗi ký tự tương ứng với 1 byte, còn trung bình mỗi con số
tương ứng với 4 bytes. Khi ấy, với 1 đĩa mềm 1,2 hay 1,44 MB (1 MB = 1 triệu
byte) người ta tha hồ mà chứa dữ liệu của mình. Rồi tình hình phát triển dần
lên, người ta dùng đĩa cứng (HDD) có dung lượng vài chục MB, lên đến vài trăm
MB rồi vài GB (Gigabyte = 1.000 MB hay 1 tỷ bytes), vài trăm GB và bây giờ
những máy tính, laptop đắt tiền đã có HDD lên tới 1 TB (1 terabyte = 1.000 GB).
Dung lượng khổng lồ 1 TB này thật ra chỉ bằng một phần tỷ của con số 1.000
exabytes dữ liệu thế giới tạo ra trong một năm!
Một hình ảnh minh họa khác: Hàng ngày ta vẫn đọc báo, đọc
tin tức trên mạng. Nếu một người ngồi đọc liên tục không nghỉ suốt đời thì số
dữ liệu văn bản được đưa vào đầu chỉ tương đương với 2 GB mà thôi!
Nếu đã kinh ngạc với con số 1.000 exabytes dữ liệu được tạo
ra năm 2013 thì bạn sẽ kinh ngạc hơn nữa khi biết rằng năm 2016 (tức chỉ 3 năm
sau) số dữ liệu mà con người tạo ra là 16,1
zettabytes. 1 zettabyte = 1.000 exabytes. 16,1 zettabytes chính là 16,1
ngàn tỷ GB, tức là gấp 16 lần so với năm 2013!
Chưa hết, các nhà phân tích còn dự báo rằng đến năm 2025
lượng dữ liệu mà con người tạo ra trong một năm sẽ là 163 zettabytes, tức gấp
hơn 10 lần hiện nay.
Chính vì vậy, bản phân tích của IDC nói rằng loài người đang
tiến ngày càng nhanh tới một kỷ nguyên mới của Thời đại Dữ liệu (Data Age).
Vì sao phát sinh
nhiều dữ liệu như vậy?
Văn bản hay số liệu không chiếm nhiều dung lượng dữ liệu,
nhưng việc phát triển công nghệ đã tạo nên nhiều dạng dữ liệu số khác: hình
ảnh, âm thanh, video… Các loại hình này có kích thước file lớn hơn nhiều so với
file văn bản. Thí dụ: file hình ảnh có kích thước từ vài trăm KB đến hàng chục MB,
một bộ phim có kích thước đến vài GB. Có thể thấy việc chuyển từ truyền hình
analog sang kỹ thuật số (được ghi với dạng dữ liệu số) cũng đã làm tăng lượng
dữ liệu phát sinh lên rất nhiều.
Trước đây, dữ liệu số được tạo nên chủ yếu bằng máy tính và
phục vụ chủ yếu cho kinh doanh, quản lý, quốc phòng. Bây giờ có quá nhiều thiết
bị để tạo nên dữ liệu số, trong đó đáng kể nhất là điện thoại di động. Hầu như
ai cũng có điện thoại di động, hàng ngày ta dùng chúng để chụp ảnh, quay phim,
nhắn tin… Tất cả các động thái này đều tạo nên dữ liệu, và chiếc điện thoại di
động như một miệng phễu chứa vô số loại dữ liệu khác nhau…
Điện thoại di động như
một miệng phễu thu hút đủ loại dữ liệu
Một dạng công nghệ đang phát triển mạnh nữa là Internet của
Vạn vật (IoT: Internet of Things). Với IoT, mỗi đồ vật, con người được cung cấp
một định danh của riêng mình, và tất cả có khả năng truyền tải, trao đổi thông
tin, dữ liệu qua một mạng duy nhất mà không cần đến sự tương tác trực tiếp giữa
người với người, hay người với máy tính. Việc truyền tải thông tin này chắc
chắn sẽ làm phát sinh lượng dữ liệu đáng kể.
Theo bản phân tích và ước tính của IDC, vào năm 2025, hơn 25%
tổng dung lượng dữ liệu toàn cầu sẽ được hình thành trong thời gian thực
(real-time, thí dụ như live video, theo dõi qua camera, trao đổi trực tiếp qua
smartphone, hay IoT), trong đó dữ liệu IoT chiếm tới hơn 95% của số này.
Những vấn đề cần quan
tâm
Bỏ qua những dữ liệu không quan trọng, mang tính giải trí
(phim ảnh, ca nhạc, chuyện trò linh tinh…), có rất nhiều dữ liệu đóng vai trò
quan trọng trong đời sống con người (các thông tin cá nhân, số liệu tài chính,
tài khoản ngân hàng…). Với sự bùng nổ dữ liệu, đặc biệt là IoT, những dữ liệu
quan trọng ngày càng nhiều hơn nữa. Nói cách khác, con người lệ thuộc ngày càng
nhiều vào thiết bị, các thiết bị này vận hành bởi những dữ liệu, do đó dữ liệu
đóng vai trò quan trọng trong cuộc sống con người.
Bản phân tích của IDC nhận định: “Dữ liệu đã trở nên một
phần tất yếu đối với tất cả mọi khía cạnh của cuộc sống con người trong vòng 30
năm qua. Nó đã thay đổi cách chúng ta được giáo dục và giải trí. Nó thông tin
cách chúng ta trải nghiệm với con người, công việc và thế giới rộng hơn chung
quanh mình. Chỉ trong vòng 10 năm qua, xã hội loài người đã chứng kiến sự
chuyển đổi từ analog lên digital. Trong thập niên tới đây, sức mạnh của dữ liệu
hầu như không có giới hạn.”
Theo ước tính của IDC, gần 20% tổng dung lượng dữ liệu toàn
cầu sẽ có tầm mức quan trọng sống còn đối với cuộc sống hàng ngày của chúng ta,
và gần 10% trong số đó là “cực kỳ sống còn” (hypercritical).
Trong bối cảnh đó bảo mật thông tin, an toàn dữ liệu là vấn
đề vô cùng quan trọng. Theo IDC, hiện nay có khoảng 50% dữ liệu cần được đảm
bảo an toàn thông tin ở một mức độ nào đó, đến năm 2025, con số này sẽ là 87%.
Mặc dù vậy hiện nay các giải pháp bảo mật, đảm bảo an toàn thông tin chỉ mới
đáp ứng được 50% nhu cầu cần thiết.
Phạm Hoài Nhân
LĐĐN - 17/04/2017
Không có nhận xét nào:
Đăng nhận xét