AI, muốn chạy, phải làm đường

Giấc mơ sử dụng trí tuệ nhân tạo (AI) để nhanh chóng giải quyết các vấn đề của xã hội là một giấc mơ tuyệt đẹp khi chỉ cần có chiếc đũa thần AI trong tay, mọi khúc mắc con người bó tay cứ giao cho máy. Ai cũng ước gì có các công cụ thông minh như trong phim khoa học viễn tưởng, cứ trò chuyện với máy, từ chuyện nhỏ như bắt nó tìm lộ trình ít kẹt xe nhất đến chuyện lớn như giải quyết bài toán ngập lụt, ô nhiễm, xử lý rác thải, phòng ngừa tội phạm.

Thế nhưng mơ màng là chuyện của các nhà văn. Các tổ chức, các doanh nghiệp đầu tư xây dựng các dạng AI đều đang phải khổ cực xây dựng nền móng cho nó trước khi yêu cầu nó phục vụ cho mình. Nền móng đó là hàng triệu, hàng tỉ đơn vị dữ liệu có liên quan để máy học, phân tích rồi tìm ra quy luật và giải các bài toán con người giao. Báo chí các nước thường có bài viết về các doanh nghiệp chuyên lo cung cấp dữ liệu loại này.

Như một công ty Phần Lan tổ chức thuê người đọc hàng trăm ngàn bài viết về doanh nghiệp thu thập từ Internet và dán nhãn để miêu tả chúng, ví dụ bài này là về hãng Apple sản xuất iPhone, bài kia là về doanh nghiệp xuất khẩu táo. Một doanh nghiệp khác ở Ấn Độ thuê người xem các video nội soi đại tràng tìm dấu vết các khối u có thể dẫn đến ung thư. Nhiều doanh nghiệp Trung Quốc tận dụng lao động giá còn rẻ để tổ chức các “nông trại dữ liệu”, công nhân không sản xuất gì chỉ mở file hình xem rồi dán nhãn cho chúng.

Dường như ở Việt Nam, người ta chỉ mơ màng đến chiếc đũa thần “AI” và sức mạnh của nó; ít ai lo đến chuyện thu thập dữ liệu cho AI.

Lấy một ví dụ trong ngành luật, tạm thời cứ đặt ra tiêu chí chúng ta muốn xây dựng một “luật sư người máy” có AI vượt bậc; hỏi “hãy cho biết có điều luật hay quy định nào trong hệ thống luật pháp Việt Nam cấm cha, mẹ là quan chức bổ nhiệm con cái vào các chức vụ trực thuộc bộ máy mình đang quản lý không”, máy nhanh chóng trả lời có hoặc không, nếu có thì đó là luật nào, nghị định nào, trải qua các chỉnh sửa nào... Thật ra đó chỉ là một tra vấn rất bình thường mà một cơ sở dữ liệu luật tốt đều có thể đáp ứng.

Rất tiếc chúng ta chưa làm tốt khâu chuẩn bị dữ liệu cho một cơ sở dữ liệu như thế: văn bản luật, nghị định đưa lên dưới dạng quét ảnh thành file PDF, tức không tìm kiếm được; văn bản luật trước một thời điểm nào đó dùng font khác với font Unicode phổ biến hiện nay; các liên kết tham chiếu chéo để biết ngay điều luật nào đã được chỉnh sửa, quy định nào đã bị thay thế hầu như không tồn tại. Vậy làm sao trông mong có một AI bên trong một luật sư người máy cho được?

Biết bao dữ liệu cần thiết cho các hệ thống AI tương lai đang nằm ngổn ngang như thức ăn chưa nấu chín làm sao nạp cho AI được. Để giải bài toán kẹt xe, ít nhất cũng phải có số liệu chính xác về hàng trăm biến số, như hàng ngày có bao nhiêu xe từ ngoại thành vào các quận nội thành, mỗi lần vào ở lại mấy tiếng, chở bao nhiêu người...

Để dùng AI vào khuyến khích sinh đẻ, ít nhất cũng phải biết vì sao phụ nữ ít chịu sinh con thứ hai, các biện pháp tài chính nào sẽ thúc đẩy họ...

Kỳ Thư

Nguồn Saigon Times: https://www.thesaigontimes.vn/294823/ai-muon-chay-phai-lam-duong-.html