Gần đây tại Việt Nam trên không gian mạng xuất hiện nhiều phát ngôn kích động thù hận, làm tổn thương nhiều người và gây bức xúc trong xã hội, Bộ Thông tin & Truyền thông vừa ban hành Bộ quy tắc ứng xử trên mạng xã hội. Ở phạm vi toàn cầu, tình hình cũng tương tự như vậy. Các chuyên gia đã xác định rằng môi trường phát tán những ngôn từ thù hận này nhiều nhất là Facebook. Facebook đã và đang làm những gì để xử lý vấn nạn?
Bộ Tiêu chuẩn cộng đồng của Facebook
Giữ vai trò nền tảng trong việc quy định những điều gì người
dùng được làm và không được làm trên Facebook là Bộ tiêu chuẩn cộng đồng, tương
tự như Bộ quy tắc ứng xử trên mạng xã hội của Bộ Thông tin & Truyền thông.
Nó tương đương một bộ luật mà mọi người phải tuân theo khi sử dụng Facebook,
nếu không sẽ bị trừng phạt bằng cách cấm đăng một bài, cấm một thời gian hay cấm
vĩnh viễn. Facebook nêu lý do để đưa ra bộ Tiêu chuẩn cộng đồng như sau:
“Chúng tôi nhận thức rõ về tầm quan trọng của Facebook trong việc trở thành nơi mà mọi người cảm thấy có quyền giao tiếp. Chúng tôi rất nghiêm túc về vai trò của mình trong việc ngăn chặn hành vi lạm dụng dịch vụ của chúng tôi. Đó là lý do chúng tôi đã phát triển một bộ Tiêu chuẩn cộng đồng nêu ra những gì được phép và không được phép trên Facebook. Chính sách của chúng tôi dựa trên phản hồi từ cộng đồng Facebook và nội dung tư vấn của các chuyên gia trong những lĩnh vực như công nghệ, an toàn cộng đồng và nhân quyền. Để đảm bảo ý kiến của mọi người đều được xem trọng, chúng tôi đã cố gắng xây dựng chính sách bao hàm nhiều quan điểm và niềm tin khác nhau, nhất là quan điểm và niềm tin của những người, những cộng đồng yếu thế hoặc bị xem nhẹ”.
Đa số người sử dụng Việt Nam đều… không quan tâm đến bộ tiêu
chuẩn cộng đồng này, một phần vì nó quá dài, phần khác vì họ chỉ chú tâm đến việc
sử dụng Facebook mà thôi. Thế nhưng cần lưu ý rằng bộ tiêu chuẩn cộng đồng xác định
nghĩa vụ và quyền lợi của người dùng Facebook, do đó rất cần nắm rõ.
Một trong những vấn đề trọng tâm được nêu trong bộ tiêu chuẩn cộng đồng là “ngôn từ gây thù ghét” (hate speech).
Ngôn từ gây thù ghét là gì?
Facebook định nghĩa ngôn từ gây thù ghét (hate speech) là sự
công kích trực tiếp vào mọi người dựa trên những đặc điểm cần được bảo vệ:
chủng tộc, dân tộc, nguồn gốc quốc gia, tình trạng khuyết tật, thành phần tôn
giáo, đẳng cấp, thiên hướng tình dục, giới tính và bệnh tật nghiêm trọng. Sự
công kích được định nghĩa là ngôn từ bạo lực hoặc xúc phạm nhân phẩm, định kiến
có hại, lời lẽ nhục mạ, thể hiện sự khinh miệt, ghê tởm hoặc xua đuổi, chửi
thề, kêu gọi bài trừ hay cô lập. Ở mức độ nào đó những đặc điểm như nghề nghiệp
cũng được bảo vệ khi được nhắc đến cùng với một đặc điểm được bảo vệ khác.
Điều ngoại lệ là khi một người chia sẻ nội dung có ngôn từ
gây thù ghét của người khác nhằm mục đích lên án hoặc nâng cao nhận thức. Tuy
nhiên, người đó phải thể hiện rõ ý định của mình. Nếu ý định không rõ ràng thì Facebook
vẫn có thể gỡ nội dung.
Facebook đã liệt kê rất chi tiết những nội dung không được đăng
(kể cả trong dòng trạng thái lẫn trong nhận xét), nếu đăng tác giả sẽ bị xử lý
thích đáng. Mức khởi đầu là không cho đăng nội dung đó, nếu tái phạm sẽ khóa tài
khoản một thời gian hoặc vĩnh viễn. Dưới đây là ví dụ về một vài nội dung không
được đăng, vi phạm ở cấp độ 1 (cấp độ thấp nhất):
-
Lời nói hoặc thái độ ủng hộ bạo lực dưới dạng văn bản
hoặc hình ảnh
-
Lời nói hoặc hình ảnh xúc phạm nhân phẩm dưới dạng so
sánh, khái quát hóa hoặc tuyên bố chê trách về tư cách người hoặc tập thể với: Côn
trùng; động vật bị nhìn nhận về mặt văn hóa là thấp kém về trí tuệ hoặc thể
chất (heo, bò, lừa…), rác rưởi, vi khuẩn, bệnh và phân; kẻ lạm dụng tình dục; không
phải con người; tội phạm
-
Chế nhạo khái niệm, sự kiện hoặc nạn nhân của tội ác
thù ghét, ngay cả khi không có người thật nào được mô tả trong hình ảnh
-
Xem phụ nữ là đồ gia dụng hoặc nhắc đến phụ nữ như là
tài sản hoặc “đồ vật”
-
…
Làm sao phát hiện ra ngôn từ gây thù ghét?
Đây chính là vấn đề khó khăn nhất. Bởi vì mỗi ngày có hàng tỷ
nội dung được đưa lên Facebook với hàng trăm ngôn ngữ khác nhau. Phát hiện những
nội dung mang tính kích động thù hận để loại bỏ mà không nhầm lẫn với nội dung
lành mạnh là vô cùng khó khăn. Facebook dùng 2 phương pháp chính để thực hiện điều
này:
Giải pháp ban đầu và phổ biến nhất là dựa vào báo cáo của người
dùng. Khi đang sử dụng Facebook, nếu phát hiện ngôn từ gây thù ghét người dùng
sẽ báo cáo ngay cho Facebook bằng cách nhấp vào nút có dấu 3 chấm ở phần đầu đề
mục đó. Ví dụ:
Khi báo cáo được gửi đi thì đề mục đó chưa chắc sẽ bị xóa, mà
còn phải chờ sự xem xét của Facebook. Giải pháp này có những điều bất tiện là:
nội dung gây thù ghét tồn tại trên Facebook một thời gian rồi mới bị xóa vì phải
chờ đợi có người báo cáo và Facebook duyệt, nội dung gây thù ghét không hề bị
ai báo cáo và do đó vẫn nghiễm nhiên tồn tại – và ngược lại, có thể có những nội
dung không vi phạm mà vẫn bị ai đó báo cáo.
Giải pháp hữu hiệu hơn là dùng thuật toán để tự động phát hiện
những nội dung gây thù ghét. Điều này rất khó khăn, vì các nội dung đăng trên
Facebook thể hiện bằng hàng trăm ngôn ngữ khác nhau, và việc phát hiện nội dung
gây thù ghét trong những câu văn phức tạp là vô cùng khó khăn. Nó đòi hỏi máy tính
phải đọc và hiểu câu văn, đọn văn như con người bình thường để phát hiện ra những
điều cần biết, chứ không phải chỉ đơn thuần là tìm kiếm những từ ngữ đặc biệt nào
đó.
Trí tuệ nhân tạo phát hiện ngôn từ gây thù ghét
Trong thời gian gần đây, sự phát triển của công nghệ trí tuệ
nhân tạo (AI) đã giúp giải quyết vấn đề một cách hiệu quả. Biểu đồ sau đây thể
hiện số nội dung gây thù ghét trên Facebook bị phát hiện và xử lý mỗi quý, tính
từ quý 4-2017 đến quý 1-2021.
Quan sát biểu đồ, ta thấy số nội dung gây thù ghét tăng vọt
từ quý 2-2020. Điều này có thể bởi 2 lý do: Một là, số nội dung thù ghét được đưa
lên Facebook thực sự tăng vọt. Hai là, số nội dung thù ghét đưa lên Facebook bị
phát hiện nhiều hơn. Có cơ sở để tin rằng lý do thứ hai hợp lý hơn.
Facebook cho biết từ đầu năm 2020, do tình hình dịch bệnh
COVID-19 nên họ phải giảm số nhân viên làm việc tại chỗ và tăng cường nghiên cứu
áp dụng công nghệ để có thể xử lý công việc online. Công nghệ AI được ứng dụng
nhiều và sâu hơn để phát hiện nội dung gây thù ghét.
Trong báo cáo về kết quả thực thi Tiêu chuẩn cộng đồng quý
1-2021, công bố cuối tháng 5-2021 Facebook cho biết:
Tỷ lệ ngôn từ gây thù ghét trên Facebook tiếp tục giảm.
Trong quý 1, nó là 0,05 đến 0,06%, tức 5 đến 6 lượt xem trên 10.000 lượt xem,
giảm so với quý 4-2020 (0,07 – 0,08%) và quý 3-2020 (0,10 – 0,11%).
Những tiến bộ trong công nghệ AI đã cho phép Facebook xóa
nhiều ngôn từ gây thù ghét hơn trên Facebook theo thời gian và tìm thấy nhiều
ngôn từ hơn trước khi người dùng báo cáo cho họ. Khi lần đầu tiên Facebook bắt
đầu báo cáo các chỉ số về ngôn từ gây thù ghét (quý 4-2017), tỷ lệ phát hiện
chủ động là 23,6%, nghĩa là trong số ngôn từ gây thù ghét Facebook đã xóa thì 76,4%
là do người dùng báo cáo, chỉ 23,6% là do các thuật toán của Facebook tự tìm ra.
Đến quý 1-2021 thì 97% ngôn từ gây thù ghét mà Facebook xóa là do chính họ phát
hiện tự động bằng các thuật toán có hỗ trợ của công nghệ AI.
Phạm Hoài Nhân
Báo Đồng Nai - 21/06/2021
Không có nhận xét nào:
Đăng nhận xét