Đời sống Số: Facebook xử lý “ngôn từ gây thù ghét” như thế nào?

Gần đây tại Việt Nam trên không gian mạng xuất hiện nhiều phát ngôn kích động thù hận, làm tổn thương nhiều người và gây bức xúc trong xã hội, Bộ Thông tin & Truyền thông vừa ban hành Bộ quy tắc ứng xử trên mạng xã hội. Ở phạm vi toàn cầu, tình hình cũng tương tự như vậy. Các chuyên gia đã xác định rằng môi trường phát tán những ngôn từ thù hận này nhiều nhất là Facebook. Facebook đã và đang làm những gì để xử lý vấn nạn?

Bộ Tiêu chuẩn cộng đồng của Facebook

Giữ vai trò nền tảng trong việc quy định những điều gì người dùng được làm và không được làm trên Facebook là Bộ tiêu chuẩn cộng đồng, tương tự như Bộ quy tắc ứng xử trên mạng xã hội của Bộ Thông tin & Truyền thông. Nó tương đương một bộ luật mà mọi người phải tuân theo khi sử dụng Facebook, nếu không sẽ bị trừng phạt bằng cách cấm đăng một bài, cấm một thời gian hay cấm vĩnh viễn. Facebook nêu lý do để đưa ra bộ Tiêu chuẩn cộng đồng như sau:

“Chúng tôi nhận thức rõ về tầm quan trọng của Facebook trong việc trở thành nơi mà mọi người cảm thấy có quyền giao tiếp. Chúng tôi rất nghiêm túc về vai trò của mình trong việc ngăn chặn hành vi lạm dụng dịch vụ của chúng tôi. Đó là lý do chúng tôi đã phát triển một bộ Tiêu chuẩn cộng đồng nêu ra những gì được phép và không được phép trên Facebook. Chính sách của chúng tôi dựa trên phản hồi từ cộng đồng Facebook và nội dung tư vấn của các chuyên gia trong những lĩnh vực như công nghệ, an toàn cộng đồng và nhân quyền. Để đảm bảo ý kiến của mọi người đều được xem trọng, chúng tôi đã cố gắng xây dựng chính sách bao hàm nhiều quan điểm và niềm tin khác nhau, nhất là quan điểm và niềm tin của những người, những cộng đồng yếu thế hoặc bị xem nhẹ”.

Đa số người sử dụng Việt Nam đều… không quan tâm đến bộ tiêu chuẩn cộng đồng này, một phần vì nó quá dài, phần khác vì họ chỉ chú tâm đến việc sử dụng Facebook mà thôi. Thế nhưng cần lưu ý rằng bộ tiêu chuẩn cộng đồng xác định nghĩa vụ và quyền lợi của người dùng Facebook, do đó rất cần nắm rõ.

Một trong những vấn đề trọng tâm được nêu trong bộ tiêu chuẩn cộng đồng là “ngôn từ gây thù ghét” (hate speech).

Ngôn từ gây thù ghét là gì?

Facebook định nghĩa ngôn từ gây thù ghét (hate speech) là sự công kích trực tiếp vào mọi người dựa trên những đặc điểm cần được bảo vệ: chủng tộc, dân tộc, nguồn gốc quốc gia, tình trạng khuyết tật, thành phần tôn giáo, đẳng cấp, thiên hướng tình dục, giới tính và bệnh tật nghiêm trọng. Sự công kích được định nghĩa là ngôn từ bạo lực hoặc xúc phạm nhân phẩm, định kiến có hại, lời lẽ nhục mạ, thể hiện sự khinh miệt, ghê tởm hoặc xua đuổi, chửi thề, kêu gọi bài trừ hay cô lập. Ở mức độ nào đó những đặc điểm như nghề nghiệp cũng được bảo vệ khi được nhắc đến cùng với một đặc điểm được bảo vệ khác.

Điều ngoại lệ là khi một người chia sẻ nội dung có ngôn từ gây thù ghét của người khác nhằm mục đích lên án hoặc nâng cao nhận thức. Tuy nhiên, người đó phải thể hiện rõ ý định của mình. Nếu ý định không rõ ràng thì Facebook vẫn có thể gỡ nội dung.

Facebook đã liệt kê rất chi tiết những nội dung không được đăng (kể cả trong dòng trạng thái lẫn trong nhận xét), nếu đăng tác giả sẽ bị xử lý thích đáng. Mức khởi đầu là không cho đăng nội dung đó, nếu tái phạm sẽ khóa tài khoản một thời gian hoặc vĩnh viễn. Dưới đây là ví dụ về một vài nội dung không được đăng, vi phạm ở cấp độ 1 (cấp độ thấp nhất):

- Lời nói hoặc thái độ ủng hộ bạo lực dưới dạng văn bản hoặc hình ảnh

- Lời nói hoặc hình ảnh xúc phạm nhân phẩm dưới dạng so sánh, khái quát hóa hoặc tuyên bố chê trách về tư cách người hoặc tập thể với: Côn trùng; động vật bị nhìn nhận về mặt văn hóa là thấp kém về trí tuệ hoặc thể chất (heo, bò, lừa…), rác rưởi, vi khuẩn, bệnh và phân; kẻ lạm dụng tình dục; không phải con người; tội phạm

- Chế nhạo khái niệm, sự kiện hoặc nạn nhân của tội ác thù ghét, ngay cả khi không có người thật nào được mô tả trong hình ảnh

- Xem phụ nữ là đồ gia dụng hoặc nhắc đến phụ nữ như là tài sản hoặc “đồ vật”

- …

Làm sao phát hiện ra ngôn từ gây thù ghét?

Đây chính là vấn đề khó khăn nhất. Bởi vì mỗi ngày có hàng tỷ nội dung được đưa lên Facebook với hàng trăm ngôn ngữ khác nhau. Phát hiện những nội dung mang tính kích động thù hận để loại bỏ mà không nhầm lẫn với nội dung lành mạnh là vô cùng khó khăn. Facebook dùng 2 phương pháp chính để thực hiện điều này:

Giải pháp ban đầu và phổ biến nhất là dựa vào báo cáo của người dùng. Khi đang sử dụng Facebook, nếu phát hiện ngôn từ gây thù ghét người dùng sẽ báo cáo ngay cho Facebook bằng cách nhấp vào nút có dấu 3 chấm ở phần đầu đề mục đó. Ví dụ:

Bấm vào dấu Ba chấm để chọn Tìm hỗ trợ hoặc báo cáo bài viết, rồi chọn vấn đề Ngôn từ gây thù ghét, sau đó xác định loại ngôn từ gây thù ghét mà bạn nhận thấy.

Khi báo cáo được gửi đi thì đề mục đó chưa chắc sẽ bị xóa, mà còn phải chờ sự xem xét của Facebook. Giải pháp này có những điều bất tiện là: nội dung gây thù ghét tồn tại trên Facebook một thời gian rồi mới bị xóa vì phải chờ đợi có người báo cáo và Facebook duyệt, nội dung gây thù ghét không hề bị ai báo cáo và do đó vẫn nghiễm nhiên tồn tại – và ngược lại, có thể có những nội dung không vi phạm mà vẫn bị ai đó báo cáo.

Giải pháp hữu hiệu hơn là dùng thuật toán để tự động phát hiện những nội dung gây thù ghét. Điều này rất khó khăn, vì các nội dung đăng trên Facebook thể hiện bằng hàng trăm ngôn ngữ khác nhau, và việc phát hiện nội dung gây thù ghét trong những câu văn phức tạp là vô cùng khó khăn. Nó đòi hỏi máy tính phải đọc và hiểu câu văn, đọn văn như con người bình thường để phát hiện ra những điều cần biết, chứ không phải chỉ đơn thuần là tìm kiếm những từ ngữ đặc biệt nào đó.

Trí tuệ nhân tạo phát hiện ngôn từ gây thù ghét

Trong thời gian gần đây, sự phát triển của công nghệ trí tuệ nhân tạo (AI) đã giúp giải quyết vấn đề một cách hiệu quả. Biểu đồ sau đây thể hiện số nội dung gây thù ghét trên Facebook bị phát hiện và xử lý mỗi quý, tính từ quý 4-2017 đến quý 1-2021.

Biểu đồ thể hiện số nội dung gây thù ghét trên Facebook bị phát hiện và xử lý mỗi quý. Nguồn: Statista

Quan sát biểu đồ, ta thấy số nội dung gây thù ghét tăng vọt từ quý 2-2020. Điều này có thể bởi 2 lý do: Một là, số nội dung thù ghét được đưa lên Facebook thực sự tăng vọt. Hai là, số nội dung thù ghét đưa lên Facebook bị phát hiện nhiều hơn. Có cơ sở để tin rằng lý do thứ hai hợp lý hơn.

Facebook cho biết từ đầu năm 2020, do tình hình dịch bệnh COVID-19 nên họ phải giảm số nhân viên làm việc tại chỗ và tăng cường nghiên cứu áp dụng công nghệ để có thể xử lý công việc online. Công nghệ AI được ứng dụng nhiều và sâu hơn để phát hiện nội dung gây thù ghét.

Trong báo cáo về kết quả thực thi Tiêu chuẩn cộng đồng quý 1-2021, công bố cuối tháng 5-2021 Facebook cho biết:

Tỷ lệ ngôn từ gây thù ghét trên Facebook tiếp tục giảm. Trong quý 1, nó là 0,05 đến 0,06%, tức 5 đến 6 lượt xem trên 10.000 lượt xem, giảm so với quý 4-2020 (0,07 – 0,08%) và quý 3-2020 (0,10 – 0,11%).

Những tiến bộ trong công nghệ AI đã cho phép Facebook xóa nhiều ngôn từ gây thù ghét hơn trên Facebook theo thời gian và tìm thấy nhiều ngôn từ hơn trước khi người dùng báo cáo cho họ. Khi lần đầu tiên Facebook bắt đầu báo cáo các chỉ số về ngôn từ gây thù ghét (quý 4-2017), tỷ lệ phát hiện chủ động là 23,6%, nghĩa là trong số ngôn từ gây thù ghét Facebook đã xóa thì 76,4% là do người dùng báo cáo, chỉ 23,6% là do các thuật toán của Facebook tự tìm ra. Đến quý 1-2021 thì 97% ngôn từ gây thù ghét mà Facebook xóa là do chính họ phát hiện tự động bằng các thuật toán có hỗ trợ của công nghệ AI.

Phạm Hoài Nhân
Báo Đồng Nai - 21/06/2021

Đời sống Số

Chủ đề

Thứ Hai, 21 tháng 6, 2021

Facebook xử lý “ngôn từ gây thù ghét” như thế nào?

Không có nhận xét nào:

Đăng nhận xét