Internet Archive thua giới xuất bản Mỹ: Nếu AI nhập cuộc?

Phán quyết dành cho Internet Archive trong vụ kiện với giới xuất bản Mỹ nêu bật những lo ngại cho giới AI, theo Dataconomy.

Internet Archive đã thua một trận chiến pháp lý quan trọng sau khi Tòa phúc thẩm Mỹ giữ nguyên phán quyết trong vụ các nhà xuất bản Mỹ kiện kho lưu trữ này. Theo đó, hoạt động số hóa và cho độc giả mượn sách đồng loạt của Internet Archive đã vi phạm luật bản quyền.

Vụ kiện bắt nguồn từ sáng kiến Thư viện khẩn cấp quốc gia của Internet Archive trong thời kỳ đại dịch Covid-19. Theo đó, thay vì bắt người mượn phải chờ đến lượt như các thư viện số thông thường, Internet Archive không hạn chế số lượng độc giả mượn sách trong cùng một thời điểm.

Chính sách này đã gây ra phản ứng dữ dội từ các nhà xuất bản và tác giả. 4 nhà xuất bản lớn, Hachette, HarperCollins, Penguin Random House và Wiley đã khởi kiện Internet Archive vi phạm tác quyền, nhấn mạnh vào hoạt động scan sách và cho mượn sách trực tuyến đồng loạt.

Biện hộ cho hành độngg của mình, Internet Archive đã viện tới “fair use” - nguyên tắc sử dụng hợp lý cho phép các đơn vị sử dụng tác phẩm có bản quyền cho một số mục đích như giáo dục hoặc đánh giá, phê bình mà không cần xin phép chủ sở hữu tác quyền.

Tuy nhiên, dù tòa án thừa nhận hoạt động của Internet Archive là phi lợi nhuận, họ vẫn bác bỏ biện hộ “fair use”.

 Internet Archive đã thua cuộc chiến pháp lý trước các ông lớn xuất bản Mỹ. Ảnh: Start Researching Genealogy.

Internet Archive đã thua cuộc chiến pháp lý trước các ông lớn xuất bản Mỹ. Ảnh: Start Researching Genealogy.

Như vậy, phán quyết này đã củng cố quyền kiểm soát của tác giả và nhà xuất bản đối với các tác phẩm của họ. Và câu hỏi đặt ra là trong khi Internet Archive hoạt động phi lợi nhuận mà còn không phù hợp với nguyên tắc “fair use” thì các công cụ AI có thu phí từ người dùng sẽ ra sao.

Cách giới AI dùng "fair use"

Trong các vụ kiện hiện tại giữa giới xuất bản và các công ty AI, biện hộ “fair use” đang được sử dụng theo cách AI khai thác dữ liệu từ sách và cung cấp thông tin, đặc điểm… của tác phẩm cho người dùng tùy theo nhu cầu. Từ đó, người dùng có thể phát triển tác phẩm cá nhân của mình. Điều này khác với việc Internet Archive trực tiếp sử dụng sách gốc, scan và phân phối chúng cho độc giả. Điều bị cho là đã tạo ra “tác phẩm phái sinh” và vi phạm tác quyền.

Tuy nhiên, trên thực tế, người dùng AI vẫn tiếp cận được các trích đoạn cụ thể nếu đưa ra một yêu cầu ban đầu đủ chi tiết. Với thực tế sử dụng như vậy thì dường như giới AI cũng đang tạo ra các “tác phẩm phái sinh” tương tự.

 ChatGPT đã cung cấp một trích đoạn trong cuốn The Great Gatsby cho người dùng. Ảnh: Dataconomy.

ChatGPT đã cung cấp một trích đoạn trong cuốn The Great Gatsby cho người dùng. Ảnh: Dataconomy.

Như vậy, phán quyết dành cho Internet Archive nêu bật những lo ngại đáng kể cho giới AI về kết quả tiềm năng của các vụ kiện đối với việc các mô hình dữ liệu lớn tiếp cận sách và các tác phẩm, đặc biệt là về vấn đề bản quyền.

Nếu tòa án muốn hạn chế hoạt động số hóa và việc sử dụng các tác phẩm có bản quyền khi chưa xin phép, các công ty AI có thể cần phải xin giấy phép để sử dụng các văn bản trong quá trình phát triển mô hình, điều làm tăng thêm tính phức tạp và chi phí tiềm ẩn cho người dùng cuối. Điều này cũng có thể hạn chế các mô hình AI trong việc truy cập nguồn dữ liệu đa dạng, chất lượng cao và cuối cùng ảnh hưởng đến sự phát triển và đổi mới của AI.

Thêm vào đó, khi giới tư pháp xem xét “fair use” trong diện hẹp, chỉ xét tới những điều cấu thành nên nguyên tắc sử dụng hợp lý (như mục đích thương mại, cách nội dung gốc đang được cung cấp,…), thì các nhà phát triển AI có thể phải đối mặt với nhiều hạn chế hơn nữa về cách họ sử dụng sách có bản quyền. Sự căng thẳng giữa việc bảo vệ quyền của tác giả và duy trì quyền truy cập mở đối với kiến thức có thể gây ra hệ lụy đáng kể cho các hoạt động đào tạo AI và việc sử dụng dữ liệu có đạo đức trong tương lai.

Biện pháp của giới AI?

Trong bối cảnh một số vụ kiện AI về vấn đề bản quyền vẫn chưa có phán quyết cuối thì hiện một số nhà xuất bản đã phát triển quan hệ đối tác với các công ty AI lớn, mở đường cho họ tiếp cận tài liệu gốc, có bản quyền.

 Khi nhà xuất bản "đi đêm" với giới AI, các tác giả bị gạt ra ngoài. Ảnh: Shutterstock.

Khi nhà xuất bản "đi đêm" với giới AI, các tác giả bị gạt ra ngoài. Ảnh: Shutterstock.

Gần đây nhất, nhà xuất bản học thuật Wiley đã tiết lộ việc ký kết thương vụ trị giá 44 triệu USD với giới AI. Trước đó, nhà xuất bản Taylor & Francis được cho là đã kiếm được hàng chục triệu USD từ các thỏa thuận AI. Tuy nhiên, đáng chú ý là các thỏa thuận này không có sự đồng thuận của giới tác giả và cũng không chi trả bất cứ khoản thanh toán bổ sung nào cho những người đã trực tiếp sáng tạo ra tác phẩm.

Trong vụ kiện với Internet Archive, giới xuất bản đã thắng kiện và được cho là thành công bảo vệ quyền lợi cho cả nhà xuất bản và tác giả. Nhưng trong trường hợp với giới AI, các thỏa thuận thương mại ban đầu cho thấy quyền lợi của các nhà xuất bản vẫn được bảo đảm, nhưng quyền lợi của tác giả thì đang là câu hỏi ngỏ.

Trong khi Internet Archive hoạt động phi lợi nhuận và khó có thể đưa ra những thỏa thuận chi trả chi phí cao cho các nhà xuất bản, thì giới AI, đang nhận được đầu tư và sự quan tâm mạnh mẽ, có thể làm được điều đó. Và câu hỏi đặt ra là khi không có sự tham gia của các nhà xuất bản, giới tác giả có tự đòi được quyền lợi cho mình trong cuộc đấu với AI hay không?

Minh Hoa

Nguồn Znews: https://znews.vn/internet-archive-thua-gioi-xuat-ban-my-neu-ai-nhap-cuoc-post1496130.html