DeAI: Giải pháp Web3 cho lo ngại về bản quyền của AI tập trung

ChatGPT và Gemini của Google đã nổi lên như những lực lượng hàng đầu trong cuộc đua phát triển các mô hình ngôn ngữ lớn. Rõ ràng rằng các nền tảng này đã thay đổi ngành công nghiệp AI. Tuy nhiên, cách họ thu thập thông tin và quản lý dữ liệu đã trở thành mối quan tâm đạo đức liên tục.

BeInCrypto đã trò chuyện với các dự án AI mới nổi trong Web3, bao gồm ChainGPT, Space ID, Sapien.io, Vanar Chain, O.XYZ, AR.IO, và Kindred, để thảo luận về những lo ngại hiện nay về quyền sở hữu trí tuệ, bản quyền và quyền sở hữu. Một điểm nổi bật là tiềm năng của trí tuệ nhân tạo phi tập trung (deAI) như một sự thay thế đáng giá.

Sự trỗi dậy của LLMs và vấn đề nan giải trong việc thu thập dữ liệu

Kể từ khi được tạo ra, các mô hình ngôn ngữ lớn (LLMs) đã nhanh chóng được sử dụng rộng rãi. Theo nhiều cách, các nền tảng như ChatGPT của OpenAI và Gemini của Google là lần tiếp xúc thực sự đầu tiên của công chúng với khả năng của trí tuệ nhân tạo (AI) và tiềm năng sử dụng không giới hạn của chúng.

Tuy nhiên, các công ty này cũng đã bị giám sát chặt chẽ về hoạt động của họ. Để duy trì tính cạnh tranh, các mô hình AI cần truy cập vào một lượng lớn dữ liệu. LLMs chỉ có thể tạo ra các phản hồi giống con người và hiểu các truy vấn phức tạp bằng cách xử lý một lượng lớn văn bản.

Để thực hiện điều này, các gã khổng lồ công nghệ hàng đầu như OpenAI, Google, Meta, Microsoft, Anthropic và Nvidia chủ yếu thu thập tất cả dữ liệu và thông tin có sẵn trên internet để đào tạo các mô hình AI của họ. Cách tiếp cận này đã đặt ra những câu hỏi nghiêm trọng về việc ai sở hữu đầu vào mà các nền tảng này thu thập và sau đó tái tạo dưới dạng đầu ra.

Mặc dù AI có tiềm năng đột phá, nhưng những lo ngại về quyền sở hữu trí tuệ đã dẫn đến các cuộc tranh cãi pháp lý gay gắt.

Được tài trợ

Các công ty AI có đang xây dựng đế chế từ nội dung bị đánh cắp không?

Việc áp dụng AI nhanh chóng đã làm dấy lên lo ngại về quyền sở hữu dữ liệu, quyền riêng tư và khả năng vi phạm bản quyền. Một điểm tranh cãi chính là việc sử dụng tài liệu có bản quyền để đào tạo các mô hình AI tập trung mà các tập đoàn lớn kiểm soát độc quyền.

“Các công ty AI đang xây dựng đế chế trên lưng của những người sáng tạo mà không xin phép hoặc chia sẻ lợi nhuận. Các tác giả, nghệ sĩ và nhạc sĩ đã dành nhiều năm để hoàn thiện kỹ năng của họ, chỉ để thấy tác phẩm của mình bị các mô hình AI tiêu thụ và tạo ra các phiên bản nhái trong vài giây,” Jawad Ashraf, CEO của Vanar Chain, nói với BeInCrypto.

Vấn đề này thực sự đã gây ra sự bất mãn rộng rãi. CEO của Vanar Chain cho biết OpenAI và các công ty khác đã công khai thừa nhận việc thu thập tài liệu có bản quyền, gây ra các vụ kiện và một cuộc đánh giá rộng hơn về đạo đức dữ liệu.

“Trọng tâm của vấn đề là bồi thường—các công ty AI cho rằng việc thu thập dữ liệu công khai là hợp pháp, trong khi những người sáng tạo coi đó là hành vi trộm cắp giữa ban ngày,” Ashraf nói.

Xác định ranh giới của công việc do AI tạo ra

The New York Times đã đệ đơn kiện OpenAI và Microsoft vào tháng 12/2023, cáo buộc vi phạm bản quyền và sử dụng trái phép tài sản trí tuệ của mình.

The Times cáo buộc Microsoft và OpenAI đã tạo ra một mô hình kinh doanh dựa trên “sao chép và sử dụng trái phép các tác phẩm có giá trị độc nhất của The Times.” Tờ báo cũng lập luận rằng các mô hình này “khai thác và, trong nhiều trường hợp, giữ lại các phần lớn của biểu hiện có thể được bảo vệ bản quyền chứa trong các tác phẩm đó.”

Bốn tháng sau, tám nhà xuất bản tin tức khác hoạt động tại sáu bang khác nhau của Mỹ đã kiện Microsoft và OpenAI về vi phạm bản quyền.

The Chicago Tribune, The Denver Post, The Mercury News ở California, New York Daily News, The Orange County Register ở California, Orlando Sentinel, Pioneer Press của Minnesota, và Sun Sentinel ở Florida – tất cả đều cáo buộc rằng hai công ty công nghệ này đã sử dụng bài viết của họ mà không được phép trong các sản phẩm AI và gán thông tin không chính xác cho họ.

“Các tòa án hiện đang bị buộc phải trả lời những câu hỏi không tồn tại vài năm trước: Nội dung do AI tạo ra có phải là tác phẩm phái sinh không? Các chủ sở hữu bản quyền có thể yêu cầu bồi thường khi dữ liệu của họ được sử dụng mà không có sự đồng ý không?” Trevor Koverko, đồng sáng lập Sapien.io, nói với BeInCrypto.

Bên cạnh các tổ chức báo chí, các nhà xuất bản, tác giả, nhạc sĩ và các nhà sáng tạo nội dung khác đã khởi kiện các công ty công nghệ này về thông tin có bản quyền.

Các cuộc chiến pháp lý trên nhiều ngành công nghiệp

Chỉ tuần trước, ba nhóm thương mại đã thông báo rằng họ sẽ kiện Meta tại tòa án Paris, cáo buộc Meta “sử dụng rộng rãi các tác phẩm có bản quyền mà không được phép” để đào tạo các trợ lý chatbot AI tạo sinh của mình, được sử dụng trên Facebook, Instagram và WhatsApp.

Trong khi đó, các nghệ sĩ hình ảnh Sarah Andersen, Kelly McKernan, và Karla Ortiz đã kiện các nhà tạo nghệ thuật AI Stability AI, DeviantArt, và Midjourney vì sử dụng tác phẩm của họ để đào tạo các mô hình AI.

“Không có hồi kết cho những lo ngại khi nói đến việc sử dụng dữ liệu và tài liệu sáng tạo không được kiểm soát bởi các công ty AI tập trung. Hiện tại, bất kỳ nghệ sĩ, tác giả, hoặc nhạc sĩ nào có tài liệu công khai đều có thể bị các thuật toán AI thu thập và học cách tạo ra nội dung gần như giống hệt—và kiếm lợi từ đó trong khi nghệ sĩ không nhận được gì,” Phil Mataras, người sáng lập AR.IO, lập luận.

OpenAI và Google đặc biệt cho rằng nếu luật pháp hạn chế quyền truy cập của họ vào tài liệu có bản quyền, Hoa Kỳ sẽ thua trong cuộc đua AI với Trung Quốc. Theo họ, các công ty ở Trung Quốc hoạt động với ít ràng buộc pháp lý hơn, mang lại cho đối thủ của họ một lợi thế quan trọng.

Những tập đoàn lớn này đang tích cực vận động chính phủ Mỹ để phân loại việc đào tạo AI trên dữ liệu có bản quyền là “sử dụng hợp lý”. Họ cho rằng việc AI xử lý nội dung có bản quyền tạo ra các sản phẩm mới khác biệt cơ bản so với tài liệu gốc.

Được tài trợ

Tuy nhiên, khi các công cụ AI tạo sinh ngày càng tạo ra văn bản, hình ảnh và giọng nói, nhiều ngành công nghiệp đang theo đuổi các thách thức pháp lý chống lại các tập đoàn này.

“Những người sáng tạo nội dung—dù là tác giả, nhạc sĩ hay nhà phát triển phần mềm—thường nói rằng tài sản trí tuệ của họ đang bị sử dụng theo cách vượt quá sử dụng hợp lý, đặc biệt khi các hệ thống AI sao chép hoặc tái tạo các khía cạnh của tác phẩm gốc của họ,” Ahmad Shadid, người sáng lập và CEO của O.XYZ cho biết.

Trong khi đó, trong Web3, các bên đang vận động cho một phương án thay thế cho cách tiếp cận phát triển LLM của các tập đoàn truyền thống.

DeAI nổi lên như một lựa chọn thay thế Web3

AI phi tập trung (deAI) là một lĩnh vực mới nổi trong Web3 khám phá việc sử dụng công nghệ blockchain và sổ cái phân tán để tạo ra các hệ thống AI dân chủ và minh bạch hơn.

“DeAI, tận dụng công nghệ blockchain và sổ cái phân tán, nhằm giải quyết các vấn đề về quyền sở hữu dữ liệu và bản quyền bằng cách tạo ra các hệ thống AI minh bạch hơn. Nó phân phối việc phát triển và kiểm soát các mô hình AI trên một mạng lưới toàn cầu, thiết lập các mô hình công bằng hơn cho việc đào tạo AI tôn trọng quyền của người sáng tạo nội dung. DeAI cũng nhằm cung cấp các cơ chế bồi thường công bằng cho những người sáng tạo có tác phẩm được sử dụng trong đào tạo AI, có thể giải quyết nhiều vấn đề liên quan đến các mô hình AI tập trung,” Max Giammario, CEO và người sáng lập Kindred giải thích.

Với sự nổi bật ngày càng tăng của AI trên toàn cầu, sự kết hợp của nó với blockchain hứa hẹn sẽ biến đổi cả hai lĩnh vực, tạo ra những con đường mới cho đổi mới và đầu tư tiền điện tử.

Đáp lại, các nhà phát triển trong ngành đã bắt đầu phát triển các dự án thành công kết hợp công nghệ AI và Web3.

Top AI Crypto Coins Performance. — Top AI Cryptocurrencies By Market Cap. Nguồn: CoinGecko

Không giống như các tập đoàn sản xuất các mô hình AI tập trung, deAI hướng tới việc hoàn toàn mã nguồn mở.

OpenAI trước đây đã lập luận rằng họ tuân thủ học thuyết sử dụng hợp lý của Mỹ mặc dù sử dụng tài liệu có bản quyền để đào tạo các mô hình AI của mình. Hơn nữa, ChatGPT, ứng dụng phổ biến nhất của họ, hoàn toàn miễn phí để sử dụng.

Harrison Seletsky, Giám đốc Phát triển Kinh doanh tại Space ID, đã nêu bật một mâu thuẫn trong lập luận của OpenAI.

“Vấn đề đạo đức rõ ràng là các tài liệu đang được sử dụng mà không có sự cho phép rõ ràng của người sáng tạo. Nếu chúng có bản quyền, phải được cấp phép và thường phải trả phí. Nhưng ngoài ra, ngay cả khi các LLM như ChatGPT sử dụng dữ liệu mã nguồn mở, các mô hình của OpenAI không phải là mã nguồn mở. Họ sử dụng tài liệu có sẵn công khai mà không hoàn toàn ‘trả lại’ cho các nguồn mà họ lấy từ đó.

Có một câu hỏi lớn hơn ở đây về việc liệu AI có nên là mã nguồn mở hay không. ChatGPT của OpenAI thì không, trong khi các mô hình như DeepSeek của Trung Quốc thì có, cũng như AI phi tập trung. Từ góc độ đạo đức và quyền sở hữu trí tuệ, lựa chọn sau chắc chắn là tốt hơn,” Seletsky nói.

Việc kiểm soát tập trung của các tập đoàn công nghệ lớn này cũng đặt ra những lo ngại khác liên quan đến việc triển khai và giám sát các mô hình AI.

Tập trung và phi tập trung: Khác biệt về đạo đức và hoạt động

Trái ngược với bản chất do cộng đồng điều khiển của deAI, các mô hình AI tập trung được xây dựng bởi một số ít người, dẫn đến khả năng thiên vị.

“AI tập trung thường hoạt động dưới một chiếc ô doanh nghiệp duy nhất, nơi các quyết định được thúc đẩy bởi động cơ lợi nhuận từ trên xuống. Nó về cơ bản là một hộp đen thuộc sở hữu và quản lý bởi một thực thể. Ngược lại, DeAI dựa vào cách tiếp cận do cộng đồng điều khiển. AI được thiết kế để phân tích phản hồi của cộng đồng và tối ưu hóa cho lợi ích tập thể thay vì chỉ lợi ích của doanh nghiệp,” Ahmad Shadid, người sáng lập và CEO của O.XYZ giải thích.

Trong khi đó, công nghệ blockchain cung cấp một con đường rõ ràng cho việc kiếm tiền.

“Người sáng tạo có thể token hóa tài sản sáng tạo của họ—như bài viết, âm nhạc, hoặc thậm chí là ý tưởng—và tự đặt giá. Điều này tạo ra một môi trường công bằng hơn cho cả người sáng tạo và người sử dụng tài sản trí tuệ, về cơ bản hình thành một thị trường tự do cho IP. Nó cũng làm cho việc sở hữu dễ dàng chứng minh, vì mọi thứ trên blockchain đều minh bạch và không thể thay đổi, làm cho việc khai thác công việc của người khác mà không điều chỉnh đúng động cơ trở nên khó khăn hơn,” Seletsky nói với BeInCrypto.

Các nhà phát triển Web3 khác nhau đã phát triển các dự án phi tập trung hóa nội dung được sử dụng cho AI tạo sinh. Các nền tảng như Story, Inflectiv và Arweave tận dụng các khía cạnh khác nhau của công nghệ blockchain để đảm bảo rằng các tập dữ liệu được sử dụng cho các mô hình AI được quản lý một cách đạo đức.

Ilan Rakhmanov, người sáng lập ChainGPT, coi deAI là một lực lượng đối trọng quan trọng đối với AI tập trung. Ông khẳng định rằng việc giải quyết các hành vi phi đạo đức của các tập đoàn AI độc quyền hiện tại sẽ là điều cần thiết để phát triển một ngành công nghiệp lành mạnh hơn trong tương lai.

“Điều này tạo ra một tiền lệ nguy hiểm khi các công ty AI có thể tự do sử dụng nội dung có bản quyền mà không cần ghi nhận hoặc trả tiền. Về mặt pháp lý, điều này mời gọi sự giám sát từ cơ quan quản lý; về mặt đạo đức, nó tước đi quyền kiểm soát của người sáng tạo. ChainGPT tin vào việc ghi nhận và kiếm tiền trên chuỗi, đảm bảo trao đổi giá trị công bằng giữa người dùng AI, người đóng góp và người huấn luyện mô hình,” Rakhmanov nói.

Tuy nhiên, để DeAI trở thành trung tâm, nó phải vượt qua một số trở ngại.

Những trở ngại nào mà deAI phải đối mặt?

Mặc dù deAI có tiềm năng phát triển, nó vẫn đang ở giai đoạn đầu. Trong khía cạnh này, các công ty như OpenAI và Google có lợi thế về sức mạnh kinh tế và cơ sở hạ tầng. Họ có khả năng xử lý các nguồn lực lớn cần thiết để thu thập lượng dữ liệu khổng lồ như vậy.

“Các công ty AI tập trung có quyền truy cập vào sức mạnh tính toán khổng lồ, trong khi deAI cần các mạng lưới phân phối hiệu quả để mở rộng. Sau đó là dữ liệu—các mô hình tập trung phát triển mạnh nhờ các tập dữ liệu được tích trữ, trong khi deAI phải xây dựng các đường dẫn đáng tin cậy để thu thập, xác minh và bồi thường cho người đóng góp một cách công bằng,” Koverko nói với BeInCrypto.

Về điểm này, Ahmad Shadid bổ sung:

“Xây dựng và vận hành các hệ thống AI trên sổ cái phân tán có thể phức tạp, đặc biệt nếu bạn đang cố gắng xử lý lượng dữ liệu khổng lồ ở quy mô lớn. Nó cũng đòi hỏi sự giám sát cẩn thận để giữ cho quá trình học của AI phù hợp với đạo đức và mục tiêu của cộng đồng.”

Những tập đoàn công nghệ lớn này cũng có thể sử dụng nguồn lực và mối quan hệ của họ để vận động mạnh mẽ chống lại các đối thủ như deAI.

“Họ có thể làm điều đó bằng cách vận động cho các quy định có lợi cho các mô hình tập trung, tận dụng sự thống trị thị trường của họ để hạn chế cạnh tranh, hoặc kiểm soát các nguồn lực quan trọng cần thiết cho sự phát triển AI,” Giammario nói.

Đối với Ashraf, khả năng điều này xảy ra nên được coi là điều hiển nhiên.

“Khi toàn bộ mô hình kinh doanh của bạn được xây dựng trên việc tích trữ dữ liệu và kiếm tiền từ nó một cách bí mật, điều cuối cùng bạn muốn là một giải pháp thay thế mở và minh bạch. Hãy mong đợi các gã khổng lồ AI vận động chống lại DeAI, thúc đẩy các quy định hạn chế và sử dụng nguồn lực khổng lồ của họ để làm mất uy tín các giải pháp thay thế phi tập trung. Nhưng chính internet đã bắt đầu như một hệ thống phi tập trung trước khi các tập đoàn chiếm lĩnh, và mọi người đang thức tỉnh trước những mặt trái của sự kiểm soát tập trung. Cuộc chiến cho AI mở chỉ mới bắt đầu,” Jawad Ashraf, CEO của Vanar Chain dự đoán.

Tuy nhiên, để tiến xa hơn trong sứ mệnh của mình, deAI cần nâng cao nhận thức công chúng, tiếp cận cả người dùng Web3 và những người ngoài không gian này.

Thu hẹp khoảng cách kiến thức

Khi được hỏi về những trở ngại chính mà deAI hiện đang đối mặt, Seletsky từ Space ID cho biết rằng mọi người cần nhận thức về vấn đề vi phạm bản quyền trong các mô hình AI để giải quyết nó.

“Trở ngại chính là thiếu giáo dục. Hầu hết người dùng không biết dữ liệu đến từ đâu, cách nó được phân tích và ai đang kiểm soát nó. Nhiều người thậm chí không nhận ra rằng AI có thiên kiến, giống như con người. Cần phải giáo dục người bình thường về điều này trước khi họ có thể hiểu được lợi ích của các mô hình AI phi tập trung,” ông nói.

Một khi công chúng hiểu được các vấn đề bản quyền trong các mô hình AI tập trung, những người ủng hộ deAI phải tích cực chứng minh lợi ích của deAI như một giải pháp thay thế mạnh mẽ. Tuy nhiên, mặc dù nhận thức đã tăng lên, deAI vẫn đối mặt với thách thức trong việc được chấp nhận.

“Việc chấp nhận là một thách thức khác. Các doanh nghiệp đã quen với các giải pháp AI sẵn có, và deAI cần phải đạt được mức độ tiếp cận đó trong khi chứng minh lợi thế của mình về an ninh, minh bạch và đổi mới,” Koverko nói.

Con đường phía trước: Sự rõ ràng về quy định và niềm tin công chúng

Với những thách thức về giáo dục và khả năng tiếp cận đã được giải quyết, con đường để deAI được chấp nhận rộng rãi hơn phụ thuộc vào việc thiết lập sự rõ ràng về quy định và xây dựng niềm tin công chúng. Trevor Koverko, đồng sáng lập Sapien.io, cũng bổ sung rằng deAI cần sự rõ ràng về quy định đi kèm để đạt được những mục tiêu này.

“Nếu không có khung pháp lý rõ ràng, các dự án deAI có nguy cơ bị gạt sang một bên bởi sự không chắc chắn về pháp lý trong khi các đối thủ tập trung thúc đẩy các chính sách có lợi cho sự thống trị của họ. Vượt qua những thách thức này có nghĩa là tinh chỉnh công nghệ của chúng ta, chứng minh giá trị thực tế và xây dựng một phong trào thúc đẩy AI mở và dân chủ hóa,” ông khẳng định.

Shadid đồng ý với nhu cầu cần có sự hỗ trợ lớn hơn từ các tổ chức, đồng thời cho rằng điều này nên đi đôi với việc xây dựng niềm tin công chúng lớn hơn.

“Minh bạch có thể gây khó chịu nếu bạn đã dành hàng thập kỷ để hoàn thiện các phương pháp độc quyền, vì vậy DeAI phải chứng minh sự vượt trội của mình về mặt tin cậy và đổi mới. Một trở ngại khác là xây dựng đủ niềm tin của người dùng và sự rõ ràng về quy định để mọi người—và thậm chí cả chính phủ—cảm thấy thoải mái với cách dữ liệu được xử lý. Cách tốt nhất để tạo đà là chứng minh các trường hợp sử dụng thực tế nơi AI phi tập trung rõ ràng vượt trội hơn so với các đối thủ tập trung hoặc ít nhất chứng minh rằng nó có thể sánh ngang về tốc độ, chi phí và chất lượng trong khi vẫn mở và công bằng hơn nhiều,” Ahmad Shadid giải thích.

Cuối cùng, những lo ngại về bản quyền xung quanh các mô hình AI kêu gọi một sự thay đổi mô hình, tập trung vào việc tôn trọng sở hữu trí tuệ và thúc đẩy một hệ sinh thái AI dân chủ hơn—bất kể tác động cuối cùng của deAI ra sao.