La Nacíon: Tờ báo 150 tuổi tiên phong về AI

Đối với những tòa soạn đang tìm hiểu về cách trí tuệ nhân tạo (AI) có thể được sử dụng như nào cho mục đích thu thập, sản xuất và phát hành tin tức, thì La Nacíon là một nơi đáng để học hỏi. Tờ báo của Argentina này dù đã 150 tuổi, song đang tiên phong trong việc ứng dụng công nghệ AI.

Sự khởi đầu ấn tượng

Các thử nghiệm của La Nacíon với AI bắt đầu bằng một cuộc điều tra về năng lượng tái tạo ở Argentina. Vào năm 2016, Tổng thống Argentina Mauricio Macri vào thời điểm đó đã khởi động một chương trình phát triển các nguồn năng lượng sạch của đất nước, phần lớn phụ thuộc vào nguồn đầu tư xã hội hóa và hợp tác quốc tế.

Lấy cảm hứng từ một sáng kiến lập bản đồ mọi tấm pin năng lượng mặt trời ở Mỹ, Florencia Coelho, chuyên gia truyền thông hàng đầu tại La Nacíon, đã đề xuất một dự án lập bản đồ tiến trình của chương trình này sau 4 năm kể từ khi nó được triển khai.

Nhóm dữ liệu của La Nacíon đã bắt đầu dự án với sự cộng tác của Mathias Felipe, một đối tác khách mời đến từ Đại học Navarra ở Tây Ban Nha. Nhóm đã sử dụng học máy (Machine Learning - ML) và thị giác máy tính (Computer Vision), đồng thời làm việc với phòng thí nghiệm của bên thứ ba chuyên về phân tích không gian địa lý và AI.

 Tòa soạn La Nacíon đang tiên phong trong việc học hỏi và áp dụng AI vào việc sản xuất tin bài. Ảnh: La Nacíon

Tòa soạn La Nacíon đang tiên phong trong việc học hỏi và áp dụng AI vào việc sản xuất tin bài. Ảnh: La Nacíon

Thuật toán của La Nacíon được huấn luyện để xác định hình dạng của các trang trại năng lượng mặt trời ở Argentina. Thị giác máy tính huấn luyện máy tính để phân tích và hiểu hình ảnh. 10.999 hình ảnh đã được sử dụng để huấn luyện thuật toán trước khi tổng số 7 triệu hình ảnh được xử lý và 2.780.400km² đất được phân tích. Kết quả là loạt bài giàu dữ liệu này cho thấy chương trình năng lượng sạch của Argentina khi đó đã không đạt được các mục tiêu được đề ra.

Hãy kiên nhẫn và hợp tác

Thực tế, dự án AI nói trên của La Nacíon đã phải đối mặt với nhiều thách thức. Truy cập hình ảnh vệ tinh rất tốn kém. Các trang trại năng lượng mặt trời trông rất giống như các trang trại nông nghiệp. Họ không có đủ hình ảnh về các trang trại năng lượng mặt trời ở Argentina vào năm 2019 để huấn luyện cho mô hình AI, nên phải lấy hình ảnh từ Chile.

Coelho chia sẻ thêm về một thách thức khác và phương hướng giải quyết: “Cơ sở hạ tầng và kỹ năng tòa soạn của La Nacíon chưa đủ để thực hiện đề tài này. Chúng tôi không có phần cứng lẫn sức mạnh tính toán cần thiết cho dự án, vì vậy đó là lý do tại sao chúng tôi hợp tác”.

Từ sự hợp tác ban đầu này, nhóm dữ liệu La Nacíon đã học được những lợi ích của sự hợp tác. Họ cũng học được rằng nếu sự hiểu biết về công nghệ AI chưa đủ, họ có thể xác định sai mục tiêu. Do đó, họ đã thiết lập một phòng thí nghiệm AI bao gồm các nhà báo, nhà phân tích dữ liệu… nhằm giúp La Nacíon đẩy nhanh quá trình nắm bắt công nghệ này.

Dự án đầu tiên của phòng thí nghiệm là phân tích lời bài hát của nhạc Trap, một thể loại nhạc Hip Hop có nguồn gốc từ miền Nam nước Mỹ vào cuối những năm 1990. Họ mất 7 tháng để hoàn thành. Nhóm đã sử dụng học máy, mô hình xử lý ngôn ngữ tự nhiên (NLP), API của Spotify… để xử lý 692 bài hát và tìm hiểu các chủ đề, xu hướng và thông điệp của thể loại nhạc ngày càng phổ biến ở Argentina này.

 La Nacíon đã sử dụng nhiều công nghệ AI để phân tích hình ảnh vệ tinh cho dự án lập bản đồ trang trại năng lượng mặt trời tại Argentina. Ảnh: La Nacíon

La Nacíon đã sử dụng nhiều công nghệ AI để phân tích hình ảnh vệ tinh cho dự án lập bản đồ trang trại năng lượng mặt trời tại Argentina. Ảnh: La Nacíon

Tuy nhiên, AI mà các nhà báo sử dụng phải giải quyết một số vấn đề về ngôn ngữ, bao gồm cả những từ mới xuất hiện trong các bài hát nhạc Trap, cũng như nhiều đặc điểm nổi bật khác của thể loại nhạc này. Các thử nghiệm của La Nacíon cũng cho thấy rằng AI gần như chỉ được xây dựng cho ngôn ngữ tiếng Anh. Bouret nói: “Mọi mô hình xử lý ngôn ngữ tự nhiên là được dành cho ngôn ngữ tiếng Anh. Chúng tôi rất khó tìm được các thư viện và quy trình giúp chúng tôi giải quyết vấn đề về với tiếng Tây Ban Nha”.

Một trong những thách thức lớn khác đối với các tòa soạn muốn triển khai các dự án AI là thời gian. “Có những dự án mất từ 5 đến 7 tháng - đó là những dự án dài hạn. Các tòa soạn rất khó hiểu vì họ luôn vội vàng. Bạn phải kiên nhẫn”, cô Bouret cho biết và chia sẻ thêm rằng: “Các nhà báo điều tra có thể dành cả năm để điều tra tham nhũng hoặc một sự kiện. Chúng tôi cũng vậy, chúng tôi là những nhà báo điều tra về công nghệ”.

Bởi vậy, nữ chuyên gia này cho biết rằng sự hợp tác, cho dù với các chuyên gia AI của bên thứ ba, các trường đại học hay nhà khoa học, sẽ giúp các tòa soạn đẩy nhanh quá trình và giảm chi phí trong việc nắm bắt công nghệ mới.

“Tất cả chúng ta đều phải học”

Theo kinh nghiệm của La Nacíon, sự hợp tác giữa các tổ chức báo chí với nhau cũng có thể thúc đẩy việc nắm bắt AI và khám phá được nhiều tài nguyên hơn. Nhóm AI của La Nacíon đã làm việc chung trên một công cụ theo dõi về sự khác biệt giới tính do chương trình JournalismAI Collab của Trường Kinh tế London tổ chức.

Họ đã áp dụng nó cho một số dự án cụ thể tại tòa soạn của La Nacíon, như việc làm thế nào để hiểu rõ hơn về thành kiến về giới tính trong các bài báo. Công việc này sẽ giúp phòng kinh doanh của tòa soạn đánh giá hiệu suất của các bài báo bị ảnh hưởng như thế nào bởi giới tính, kiểu như bài báo được viết bởi nam hoặc nữ sẽ ảnh hưởng thế nào đến độc giả, cũng như bởi các vấn đề khác.

Trong một phần mở rộng của dự án theo dõi giới tính, La Nacíon cũng tham gia vào một dự án AI mã nguồn mở để các tổ chức báo chí trên thế giới cùng hợp tác để phát hiện giới tính trên khuôn mặt. Bằng cách chia sẻ khoảng 50 bức chân dung người Argentina và Mỹ Latinh với nhóm huấn luyện, họ đã giúp mô hình AI này phát hiện thêm nhiều loại khuôn mặt khác nhau về màu da và sắc tộc hơn.

Điều đó cho thấy dù là với các công ty công nghệ hay giữa các tòa soạn với nhau, thì việc cộng tác trong các dự án AI là rất quan trọng với các tổ chức báo chí. “Các kỹ năng AI rất khó học nên tốt hơn là nên học lẫn nhau, thậm chí cả với các tờ báo đối thủ của mình”, Coelho đưa ra lời khuyên.

Cuối cùng, nữ chuyên gia này kêu gọi: “Chúng ta thực ra đang cạnh tranh với Google và Facebook để giành lại sự chú ý của độc giả. Thật không may khi chúng ta đã mất đến cả thập kỷ để hiểu ra điều này. Bởi vậy, báo chí chúng ta cần đẩy nhanh quá trình học hỏi và chia sẻ triệt để, đồng thời làm việc cùng nhau, thậm chí xuyên quốc gia. Tất cả chúng ta đều sẽ phải học, bởi AI là quá to lớn đối với chỉ một người”.

Bùi Huy

Nguồn Công Luận: https://congluan.vn/la-nacion-to-bao-150-tuoi-tien-phong-ve-ai-post252197.html