Tech

Các vụ kiện pháp lý hiện tại chống lại AI tổng quát mới chỉ là bước khởi đầu • TechCrunch

Khi AI tổng quát bước vào dòng chính, mỗi ngày mới mang đến một vụ kiện mới.

Microsoft, GitHub và OpenAI hiện đang được bị kiện trong một phong trào hành động lớp buộc tội họ vi phạm luật bản quyền bằng cách cho phép Phi công phụmột hệ thống AI tạo mã được đào tạo trên hàng tỷ dòng mã công khai, để lấy lại các đoạn mã được cấp phép mà không cung cấp tín dụng.

Hai công ty đứng sau các công cụ nghệ thuật AI phổ biến, giữa hành trình và Ổn định AI, nằm trong tầm ngắm của một trường hợp pháp lý cáo buộc rằng họ đã vi phạm quyền của hàng triệu nghệ sĩ bằng cách đào tạo các công cụ của họ trên các hình ảnh được quét trên web.

Và mới tuần trước, nhà cung cấp hình ảnh chứng khoán Getty Images đã kiện Stability AI ra tòa vì báo cáo sử dụng hàng triệu hình ảnh từ trang web của mình mà không được phép đào tạo khuếch tán ổn địnhmột AI sáng tạo nghệ thuật.

Vấn đề chủ yếu là xu hướng của AI tổng quát sao chép hình ảnh, văn bản và hơn thế nữa — bao gồm cả nội dung có bản quyền — từ dữ liệu được sử dụng để đào tạo nó. trong một gần đây ví dụ, một công cụ AI được CNET sử dụng để viết các bài báo giải thích đã bị phát hiện có các bài báo ăn cắp ý tưởng do con người viết – các bài báo có lẽ đã được quét trong tập dữ liệu đào tạo của nó. Trong khi đó, một nghiên cứu học thuật được công bố vào tháng 12 cho thấy các mô hình AI tạo hình ảnh như DALL-E 2khuếch tán ổn định có thể và làm sao chép các khía cạnh của hình ảnh từ dữ liệu đào tạo của họ.

Không gian AI sáng tạo vẫn hoạt động tốt — nó đã huy động được 1,3 tỷ đô la vốn đầu tư mạo hiểm cho đến tháng 11 năm 2022, theo đến PitchBook, tăng 15% so với năm trước. Nhưng các câu hỏi pháp lý đang bắt đầu ảnh hưởng đến kinh doanh.

Một số nền tảng lưu trữ hình ảnh đã cấm nội dung do AI tạo ra vì sợ bị phản đối về mặt pháp lý. Và một số chuyên gia pháp lý đã cảnh báo các công cụ AI tổng quát có thể khiến các công ty gặp rủi ro nếu họ vô tình kết hợp nội dung có bản quyền do các công cụ này tạo ra vào bất kỳ sản phẩm nào họ bán.

Heather Meeker, một chuyên gia pháp lý về cấp phép phần mềm nguồn mở và là đối tác chung tại OSS Capital, nói với TechCrunch qua email: “Thật không may, tôi mong đợi một loạt vụ kiện tụng đối với hầu hết tất cả các sản phẩm AI sáng tạo. “Luật bản quyền cần được làm rõ.”

Những người sáng tạo nội dung như nghệ sĩ người Ba Lan Greg Rutkowski, được biết đến với việc tạo ra những phong cảnh giả tưởng, đã trở thành gương mặt đại diện cho các chiến dịch phản đối cách các công ty khởi nghiệp AI sáng tạo đối xử với các nghệ sĩ. Rutkowski đã phàn nàn về việc gõ văn bản như “Pháp sư với thanh kiếm và quả cầu lửa ma thuật phát sáng chiến đấu với con rồng hung dữ Greg Rutkowski” sẽ tạo ra một hình ảnh trông rất giống với tác phẩm gốc của anh ấy — đe dọa thu nhập của anh ấy.

Với AI sáng tạo sẽ không đi đến đâu, điều gì sẽ xảy ra tiếp theo? Những trường hợp pháp lý nào có giá trị và những cuộc chiến tại tòa án nằm ở đường chân trời?

Eliana Torres, luật sư sở hữu trí tuệ của Nixon Peabody, nói rằng các cáo buộc về vụ kiện tập thể chống lại Stability AI, Midjourney và DeviantArt sẽ rất khó chứng minh trước tòa. Đặc biệt, cô ấy nghĩ rằng sẽ rất khó để xác định hình ảnh nào được sử dụng để đào tạo các hệ thống AI vì nghệ thuật mà hệ thống tạo ra sẽ không nhất thiết giống hệt bất kỳ hình ảnh đào tạo nào.

Các hệ thống tạo hình ảnh hiện đại như Khuếch tán ổn định được gọi là các mô hình “khuếch tán”. Các mô hình khuếch tán học cách tạo hình ảnh từ lời nhắc văn bản (ví dụ: “bản phác thảo về một con chim đậu trên bậu cửa sổ”) khi chúng hoạt động thông qua bộ dữ liệu đào tạo khổng lồ. Các mô hình được đào tạo để “tái tạo” hình ảnh thay vì vẽ chúng từ đầu, bắt đầu bằng nhiễu thuần túy và tinh chỉnh hình ảnh theo thời gian để làm cho hình ảnh ngày càng gần với lời nhắc văn bản.

Giải trí hoàn hảo đừng xảy ra thường xuyên, theo quan điểm của Torres. Đối với những hình ảnh theo phong cách của một nghệ sĩ cụ thể, phong cách đã được chứng minh là gần như không thể che chắn bằng bản quyền.

“Sẽ… là một thách thức để đạt được sự chấp nhận chung đối với định nghĩa ‘theo phong cách’ là ‘tác phẩm mà những người khác sẽ chấp nhận như một tác phẩm được tạo ra bởi nghệ sĩ có Phong cách đã được kêu gọi’, được đề cập trong đơn khiếu nại [i.e. against Stability AI et al.],” Torres nói với TechCrunch trong một cuộc phỏng vấn qua email.

Torres cũng tin rằng vụ kiện không nên nhắm vào những người tạo ra các hệ thống AI này, mà nhắm vào bên chịu trách nhiệm tổng hợp các hình ảnh được sử dụng để đào tạo chúng: Mạng mở trí tuệ nhân tạo quy mô lớn (LAION), một tổ chức phi lợi nhuận. Midjourney, DeviantArt và Stability AI sử dụng dữ liệu đào tạo từ bộ dữ liệu của LAION, bao gồm hàng tỷ hình ảnh từ khắp nơi trên web.

“Nếu LAION tạo tập dữ liệu, thì hành vi vi phạm bị cáo buộc đã xảy ra vào thời điểm đó, chứ không phải khi tập dữ liệu được sử dụng để đào tạo các mô hình,” Torres nói. “Cũng giống như việc một người bước vào phòng trưng bày và xem tranh nhưng không được phép chụp ảnh.”

Các công ty như Stability AI và OpenAI, công ty đứng sau ChatGPT, từ lâu đã tuyên bố rằng “việc sử dụng hợp lý” sẽ bảo vệ họ trong trường hợp hệ thống của họ được đào tạo về nội dung được cấp phép. Học thuyết này được quy định trong luật pháp Hoa Kỳ cho phép sử dụng hạn chế tài liệu có bản quyền mà không cần phải xin phép chủ bản quyền trước.

Những người ủng hộ chỉ ra những trường hợp như Hiệp hội tác giả kiện Google, trong đó Tòa phúc thẩm vòng thứ hai của Hoa Kỳ có trụ sở tại New York đã phán quyết rằng việc Google quét thủ công hàng triệu cuốn sách có bản quyền mà không có giấy phép để tạo dự án tìm kiếm sách của mình là sử dụng hợp lý. Những gì cấu thành việc sử dụng hợp lý liên tục bị thách thức và sửa đổi, nhưng trong lĩnh vực AI tổng quát, đó là một lý thuyết đặc biệt chưa được kiểm chứng.

Mới đây bài báo trong Bloomberg Luật khẳng định rằng sự thành công của biện pháp bảo vệ sử dụng hợp pháp sẽ phụ thuộc vào việc các tác phẩm do AI tạo ra có được xem xét hay không biến đổi— nói cách khác, liệu họ có sử dụng tác phẩm có bản quyền theo cách thay đổi đáng kể so với tác phẩm gốc hay không. Án lệ trước đây, đặc biệt là của Tòa án tối cao năm 2021 Google kiện Oracle quyết định, gợi ý rằng việc sử dụng dữ liệu đã thu thập để tạo ra các tác phẩm mới có thể mang tính biến đổi. Trong trường hợp đó, việc Google sử dụng các phần mã Java SE để tạo hệ điều hành Android của mình được coi là sử dụng hợp lý.

Thật thú vị, các quốc gia khác đã báo hiệu một động thái hướng tới việc sử dụng nội dung có sẵn công khai dễ dàng hơn – có bản quyền hoặc không. Ví dụ: Vương quốc Anh đang có kế hoạch điều chỉnh một luật hiện hành để cho phép khai thác văn bản và dữ liệu “vì bất kỳ mục đích nào”, chuyển cán cân quyền lực ra khỏi chủ sở hữu quyền và nghiêng về phía doanh nghiệp và các tổ chức thương mại khác. Tuy nhiên, không có mong muốn đón nhận sự thay đổi như vậy ở Mỹ và Torres không hy vọng điều đó sẽ sớm thay đổi – nếu có.

Chuyển tiếp TKTK (nhiều sắc thái hơn…)

Trường hợp Getty có nhiều sắc thái hơn một chút. Getty – mà Ghi chú của Torres vẫn chưa nộp đơn khiếu nại chính thức — phải chỉ ra thiệt hại và kết nối bất kỳ hành vi vi phạm nào mà nó cáo buộc với các hình ảnh cụ thể. Tuy nhiên, tuyên bố của Getty đề cập rằng họ không quan tâm đến thiệt hại tài chính và chỉ đang tìm kiếm một “hiện trạng pháp lý mới”.

Andrew Burt, một trong những người sáng lập công ty luật tập trung vào AI BNH.ai, không đồng ý với Torres đến mức anh ấy tin rằng các vụ kiện AI tổng quát tập trung vào các vấn đề sở hữu trí tuệ sẽ “tương đối đơn giản”. Theo quan điểm của ông, nếu dữ liệu có bản quyền được sử dụng để huấn luyện các hệ thống AI — cho dù là do hạn chế về quyền sở hữu trí tuệ hay quyền riêng tư — thì các hệ thống đó sẽ và sẽ bị phạt tiền hoặc các hình phạt khác.

Burt lưu ý rằng Ủy ban Thương mại Liên bang (FTC) đã theo đuổi con đường này với cái mà họ gọi là “phân tích thuật toán,” nơi nó buộc các công ty công nghệ phải loại bỏ các thuật toán có vấn đề cùng với mọi dữ liệu không hợp lệ mà họ đã sử dụng để đào tạo chúng. Trong một ví dụ gần đây, FTC đã sử dụng biện pháp khắc phục sự phân tán thuật toán để buộc Everalbum, nhà sản xuất ứng dụng di động hiện không còn tồn tại có tên là Ever, xóa các thuật toán nhận dạng khuôn mặt mà công ty đã phát triển bằng cách sử dụng nội dung do những người sử dụng ứng dụng của họ tải lên. (Everalbum không nói rõ rằng dữ liệu của người dùng đang được sử dụng cho mục đích này.)

Burt nói: “Tôi mong đợi các hệ thống AI tổng hợp không khác gì các hệ thống AI truyền thống theo cách này.

Vậy thì các công ty phải làm gì khi không có tiền lệ và hướng dẫn? Torres và Burt đồng tình rằng không có câu trả lời rõ ràng.

Về phần mình, Torres khuyên bạn nên xem xét kỹ các điều khoản sử dụng cho từng hệ thống AI thương mại. Cô ấy lưu ý rằng MidJourney có các quyền khác nhau đối với người dùng trả phí và không trả phí, trong khi DALL-E của OpenAI chỉ định các quyền đối với tác phẩm nghệ thuật được tạo cho người dùng đồng thời cảnh báo họ về “nội dung tương tự” và khuyến khích sự cẩn trọng để tránh vi phạm.

Cô nói thêm: “Các doanh nghiệp nên biết về các điều khoản sử dụng và thực hiện thẩm định của họ, chẳng hạn như sử dụng các tìm kiếm hình ảnh ngược của tác phẩm được tạo ra nhằm mục đích sử dụng thương mại”.

Burt khuyến nghị các công ty nên áp dụng các khung quản lý rủi ro như Khung quản lý rủi ro AI do Viện Tiêu chuẩn và Công nghệ Quốc gia phát hành, đưa ra hướng dẫn về cách giải quyết và giảm thiểu rủi ro trong thiết kế và sử dụng các hệ thống AI. Ông cũng gợi ý rằng các công ty nên liên tục kiểm tra và giám sát hệ thống của họ để phát hiện các trách nhiệm pháp lý tiềm ẩn.

Burt cho biết: “Mặc dù các hệ thống AI tổng quát khiến việc quản lý rủi ro AI trở nên khó khăn hơn — công bằng mà nói, việc giám sát một hệ thống AI đưa ra dự đoán nhị phân về rủi ro sẽ đơn giản hơn nhiều — có những hành động cụ thể có thể được thực hiện,” Burt nói.

Một số công ty, dưới áp lực từ các nhà hoạt động và người sáng tạo nội dung, đã thực hiện các bước đi đúng hướng. AI ổn định có kế hoạch cho phép các nghệ sĩ chọn không tham gia tập dữ liệu được sử dụng để huấn luyện mô hình Khuếch tán ổn định thế hệ tiếp theo. Thông qua trang web HaveIBeenTrained.com, chủ bản quyền sẽ có thể yêu cầu chọn không tham gia trước khi chương trình đào tạo bắt đầu sau vài tuần nữa. Đối thủ OpenAI không cung cấp cơ chế từ chối như vậy, nhưng công ty đã hợp tác với các tổ chức như Shutterstock để cấp phép các phần trong phòng trưng bày hình ảnh của họ.

Đối với Copilot, GitHub đã giới thiệu một bộ lọc kiểm tra các đề xuất mã với mã xung quanh gồm khoảng 150 ký tự so với mã GitHub công khai và ẩn các đề xuất nếu có sự trùng khớp hoặc “gần khớp”. Đó là một biện pháp không hoàn hảo — việc bật bộ lọc có thể khiến Copilot bỏ qua các phần quan trọng của ghi công và văn bản giấy phép — nhưng GitHub đã nói rằng họ có kế hoạch giới thiệu các tính năng bổ sung vào năm 2023 nhằm giúp các nhà phát triển đưa ra quyết định sáng suốt về việc có nên sử dụng các đề xuất của Copilot hay không.

Ở góc nhìn 10.000 foot, Burt tin rằng AI tổng quát đang được triển khai ngày càng nhiều mà không hiểu cách giải quyết những mối nguy hiểm của nó. Anh ấy ca ngợi những nỗ lực chống lại những vấn đề rõ ràng, chẳng hạn như các tác phẩm có bản quyền được sử dụng để đào tạo những người tạo nội dung. Nhưng ông cảnh báo rằng sự không rõ ràng của các hệ thống sẽ gây áp lực lên các doanh nghiệp để ngăn chặn các hệ thống bị tàn phá — và có kế hoạch giải quyết các rủi ro của hệ thống trước khi chúng được đưa vào hoạt động tự nhiên.

Ông nói: “Các mô hình AI sáng tạo là một trong những cách sử dụng AI mới lạ và thú vị nhất — với tiềm năng rõ ràng để chuyển đổi ‘nền kinh tế tri thức’. “Giống như AI trong nhiều lĩnh vực khác, phần lớn công nghệ này đã sẵn sàng để sử dụng. Những gì chưa trưởng thành là những cách để quản lý tất cả các rủi ro của nó. Nếu không có sự đánh giá và quản lý chín chắn, chu đáo về tác hại của các hệ thống này, chúng ta có nguy cơ triển khai một công nghệ trước khi hiểu cách ngăn chặn nó gây ra thiệt hại.”

Meeker bi quan hơn, lập luận rằng không phải tất cả các doanh nghiệp — bất kể họ thực hiện các biện pháp giảm nhẹ nào — sẽ có thể gánh các chi phí pháp lý liên quan đến AI tổng quát. Bà nói, điều này cho thấy nhu cầu cấp thiết phải làm rõ hoặc thay đổi luật bản quyền.

Meeker nói: “Nếu các nhà phát triển AI không biết họ có thể sử dụng dữ liệu nào để huấn luyện các mô hình, thì công nghệ này có thể bị lùi lại hàng năm trời. “Theo một nghĩa nào đó, họ không thể làm gì được, bởi vì nếu các doanh nghiệp không thể đào tạo các mô hình một cách hợp pháp trên các tài liệu sẵn có miễn phí, thì họ sẽ không có đủ dữ liệu để đào tạo các mô hình. Chỉ có nhiều giải pháp dài hạn khác nhau như mô hình chọn tham gia hoặc từ chối hoặc hệ thống tổng hợp tiền bản quyền để thanh toán cho tất cả các tác giả… Các vụ kiện chống lại các doanh nghiệp AI vì đã sử dụng tài liệu có bản quyền để đào tạo người mẫu có khả năng làm tê liệt ngành, [and] có thể gây ra sự hợp nhất sẽ hạn chế sự đổi mới.”



Source by [author_name]

news7h

News7h: Update the world's latest breaking news online of the day, breaking news, politics, society today, international mainstream news .Updated news 24/7: Entertainment, Sports...at the World everyday world. Hot news, images, video clips that are updated quickly and reliably

Related Articles

Back to top button