AI viết lại mã nguồn mở, liệu có 'viết lại' được cả giấy phép?

Một thư viện mã nguồn mở phổ biến đã được viết lại hoàn toàn bằng AI, mang lại hiệu năng vượt trội nhưng cũng làm dấy lên tranh cãi pháp lý nảy lửa. Liệu mã nguồn do AI tạo ra có được coi là một tác phẩm mới hoàn toàn, cho phép thay đổi giấy phép từ LGPL nghiêm ngặt sang MIT cởi mở hơn?
AI thách thức quy trình phát triển phần mềm truyền thống
Trong ngành công nghệ, các kỹ sư và lập trình viên từ lâu đã dựa vào kỹ thuật dịch ngược (reverse engineering) như một phương pháp để sao chép chức năng của một chương trình máy tính mà không cần sao chép trực tiếp mã nguồn được bảo vệ bản quyền. Giờ đây, các công cụ lập trình bằng trí tuệ nhân tạo (AI) đang đặt ra những vấn đề mới về cách quy trình viết lại "phòng sạch" (clean room) này diễn ra, cả về mặt pháp lý, đạo đức và thực tiễn.
Những vấn đề này đã trở thành tâm điểm vào tuần trước với sự ra mắt phiên bản mới của chardet, một thư viện mã nguồn mở phổ biến của Python dùng để tự động phát hiện bảng mã ký tự. Kho mã nguồn này ban đầu được lập trình viên Mark Pilgrim viết vào năm 2006 và phát hành dưới giấy phép LGPL, một loại giấy phép đặt ra các giới hạn nghiêm ngặt về cách mã nguồn có thể được tái sử dụng và phân phối lại.
Cuộc "đại tu" bằng AI và tranh cãi nảy lửa
Dan Blanchard tiếp quản việc bảo trì kho mã nguồn này vào năm 2012 nhưng đã vướng vào tranh cãi khi phát hành phiên bản 7.0 của chardet vào tuần trước. Blanchard mô tả lần nâng cấp này là một "cuộc viết lại từ đầu với giấy phép MIT" cho toàn bộ thư viện, được xây dựng với sự trợ giúp của công cụ Claude Code để "nhanh hơn và chính xác hơn nhiều" so với phiên bản cũ.
Trao đổi với trang The Register, Blanchard cho biết ông từ lâu đã muốn đưa chardet vào thư viện chuẩn của Python nhưng không có thời gian để khắc phục các vấn đề về "giấy phép, tốc độ và độ chính xác" đang cản trở mục tiêu đó. Tuy nhiên, với sự trợ giúp của Claude Code, Blanchard nói rằng ông đã có thể đại tu toàn bộ thư viện "trong khoảng năm ngày" và đồng thời đạt được hiệu suất tăng gấp 48 lần.
Giấy phép gốc có còn hiệu lực?
Tuy nhiên, không phải ai cũng hài lòng với kết quả này. Một người dùng với tên Mark Pilgrim đã xuất hiện trên GitHub và cho rằng phiên bản mới này thực chất là một hành động cấp lại giấy phép bất hợp pháp cho mã nguồn gốc của Pilgrim dưới một giấy phép MIT thông thoáng hơn (loại giấy phép này cho phép sử dụng trong các dự án mã nguồn đóng).
Người này lập luận rằng, với tư cách là một bản sửa đổi từ mã nguồn gốc được cấp phép LGPL của mình, phiên bản mới của chardet cũng phải duy trì giấy phép LGPL tương tự. Cuộc tranh cãi này đã mở ra một chương mới về vai trò và giới hạn pháp lý của AI trong việc tái tạo các tác phẩm được bảo vệ bởi luật sở hữu trí tuệ.
Nguồn: Ars Technica AI

