Tin Công nghệ
DeepSeek có đang sao chép ChatGPT?
DeepSeek và ChatGPT giống nhau đến mức nào? Một nghiên cứu mới tiết lộ mức độ tương đồng đáng kinh ngạc giữa hai mô hình AI, làm dấy lên nghi vấn về nguồn gốc dữ liệu huấn luyện. Liệu đây là sự trùng hợp hay có điều gì ẩn giấu phía sau?

Một nghiên cứu mới đăng trên arXiv.org ngày 3/3 cho thấy văn bản do AI của DeepSeek tạo ra có mức tương đồng khoảng 74,2% với ChatGPT của OpenAI. Nghiên cứu này do Copyleaks – một công ty chuyên phân tích và so sánh mô hình AI – thực hiện. Forbes nhận định phát hiện này có thể ảnh hưởng đến các vấn đề về quyền sở hữu trí tuệ, quy định AI và định hướng phát triển của ngành trí tuệ nhân tạo trong tương lai.

Copyleaks đã sử dụng công nghệ nhận diện dấu vân tay phong cách ngôn ngữ để phân tích đầu ra của nhiều mô hình AI như OpenAI, Claude, Google Gemini, Meta Llama và DeepSeek. Kết quả cho thấy các mô hình thường có phong cách riêng biệt, dễ dàng nhận diện, ngoại trừ DeepSeek. Phần lớn văn bản do DeepSeek tạo ra bị phân loại là của OpenAI, làm dấy lên nghi vấn về việc mô hình này có thể đã được huấn luyện dựa trên đầu ra của ChatGPT.

Shai Nisan, Giám đốc khoa học dữ liệu tại Copyleaks, so sánh phương pháp này với việc giám định chữ viết tay nhằm xác định tác giả một văn bản. Ông nhấn mạnh sự tương đồng giữa DeepSeek và ChatGPT là đáng chú ý và không xuất hiện ở các mô hình khác.

Kết quả này đặt ra câu hỏi về cách DeepSeek được phát triển, liệu họ có sử dụng dữ liệu từ OpenAI mà không có sự cho phép hay không. Dù nghiên cứu chưa thể khẳng định chắc chắn DeepSeek là sản phẩm phái sinh, nhưng nó cho thấy cần có sự điều tra sâu hơn về quá trình đào tạo mô hình này. Nếu DeepSeek thực sự đã dùng dữ liệu của OpenAI mà không có sự đồng ý, điều đó có thể gây ra tác động lớn về mặt pháp lý và sở hữu trí tuệ.

Nisan cũng cảnh báo rằng sự thiếu minh bạch trong nguồn dữ liệu đào tạo AI sẽ là một vấn đề lớn trong tương lai. Các cơ quan quản lý có thể buộc các công ty AI công khai dữ liệu và phương pháp huấn luyện mô hình của họ để tránh các vi phạm về bản quyền và đạo đức.

Nguồn ảnh: straitstimes

Dù các mô hình AI có thể dần có phong cách tương đồng do sử dụng tập dữ liệu chồng chéo, Copyleaks khẳng định phương pháp của họ có thể phân biệt sự khác biệt tinh vi giữa các mô hình. Do đó, sự giống nhau giữa DeepSeek và OpenAI có thể không chỉ là do dữ liệu trùng lặp mà còn liên quan đến kiến trúc và quá trình đào tạo.

Trước đó, vào cuối năm 2024, một số người dùng phát hiện mô hình DeepSeek V3 tự nhận là ChatGPT khi được hỏi. Một số thử nghiệm từ TechCrunch cũng cho thấy V3 khẳng định mình là GPT-4, mô hình của OpenAI ra mắt năm 2023.

Có giả thuyết cho rằng DeepSeek có thể đã áp dụng kỹ thuật "chưng cất" kiến thức từ các mô hình tiên tiến hơn. Đây là phương pháp giúp các mô hình nhỏ hơn đạt được hiệu suất cao bằng cách học từ đầu ra của các mô hình lớn. Tuy nhiên, OpenAI từng bày tỏ lo ngại về việc DeepSeek có thể đã vi phạm điều khoản dịch vụ của họ. Đến nay, DeepSeek vẫn chưa có phản hồi chính thức về những nghi vấn này.

Nguồn:https://vnexpress.net/phong-cach-deepseek-tuong-dong-dang-kinh-ngac-voi-chatgpt-4856444.html

Danh mục tin tức
Bài viết liên quan
03/12/2025
AI Agent: Trợ lý ảo tự động đặt hàng và thực hiện công việc thay con người

AI không chỉ hỗ trợ con người, mà giờ đây còn có thể tự ra quyết định và hành động độc lập – đôi khi khiến chúng ta bất ngờ theo đúng nghĩa đen.

03/12/2025
Mạng X Sập Hàng Giờ, Elon Musk Tố Bị Tấn Công Quy Mô Lớn – Thực Hư Ra Sao?

Mạng xã hội X bất ngờ 'sập' trong nhiều giờ, khiến hàng chục nghìn người dùng hoang mang. Elon Musk lên tiếng khẳng định nền tảng này bị tấn công mạng với quy mô lớn, có thể do một tổ chức hoặc thậm chí một quốc gia đứng sau.

03/10/2025
Ra mắt gói cước 5G linh hoạt, giá từ 10.000 đồng/ngày tại Việt Nam

5G không còn là công nghệ của tương lai – giờ đây, chỉ với 10.000 đồng, bạn đã có thể trải nghiệm tốc độ mạng siêu nhanh!

03/07/2025
Việt Nam tăng tốc làm chủ công nghệ: Bước nhảy vọt trong kỷ nguyên số

Việt Nam không chỉ tham gia, mà đang làm chủ cuộc chơi công nghệ. Liệu đây có phải bước ngoặt vươn tầm thế giới?

03/06/2025
Bí mật tiềm ẩn của AI, Elon Musk dự đoán điều không ai muốn nghe!

AI có thể thông minh hơn toàn bộ loài người vào năm 2029, với 20% khả năng dẫn đến diệt vong – Elon Musk cảnh báo, nhưng liệu chúng ta có kịp kiểm soát?

01/16/2024
Luật Giao dịch điện tử (sửa đổi): Tạo hành lang thông thoáng cho giao dịch số

Luật Giao dịch điện tử (GDĐT) năm 2023 đã được Quốc hội khóa XV thông qua với tỷ lệ 94,74% tán thành, có nhiều chính sách mới nổi bật giúp công nhận giao dịch điện tử sẽ có giá trị tương đương và có thể sử dụng thay thế giao dịch truyền thống. Có thể coi Luật này là Luật cơ bản về chuyển đổi số.