Tin tức
Berkeley gây chấn động: Sao chép mô hình AI DeepSeek với chi phí chỉ 30 USD

Berkeley gây chấn động: Sao chép mô hình AI DeepSeek với chi phí chỉ 30 USD

02/02/2025

Banner PHS

Berkeley gây chấn động: Sao chép mô hình AI DeepSeek với chi phí chỉ 30 USD

Một nhóm nghiên cứu tại Đại học California, Berkeley, khẳng định họ đã tái tạo thành công công nghệ cốt lõi đằng sau mô hình AI gây tiếng vang của DeepSeek với tổng chi phí chỉ khoảng 30 USD.

Thông tin này đã khuấy động cuộc tranh luận về chi phí phát triển AI tiên tiến. Liệu việc xây dựng AI tiên tiến có thực sự đòi hỏi ngân sách khổng lồ hay những giải pháp thay thế với chi phí thấp hơn nhiều đã bị các gã khổng lồ công nghệ bỏ qua?

DeepSeek gần đây đã gây chú ý khi giới thiệu R1, một mô hình AI được cho là có thể sao chép các chức năng của ChatGPT với chi phí chỉ bằng một phần nhỏ so với mức thông thường tại Thung lũng Silicon. Nhưng nhóm Berkeley đã tiến xa hơn nữa.

Dưới sự dẫn dắt của nghiên cứu sinh Jiayi Pan, nhóm đã phát triển "TinyZero" - một phiên bản thu nhỏ được công bố trên GitHub. Theo Pan, mặc dù không đạt quy mô 671 tỷ tham số như mô hình gốc của DeepSeek, TinyZero vẫn có thể thực hiện được các chức năng cốt lõi tương tự như mô hình R1-Zero.

Phương pháp của Pan dựa trên học tăng cường (reinforcement learning), trong đó AI bắt đầu từ những dự đoán gần như ngẫu nhiên và dần dần cải thiện câu trả lời thông qua việc điều chỉnh và tìm kiếm các giải pháp khả thi.

Trong bài viết mô tả dự án, anh lấy ví dụ từ trò chơi Countdown - một chương trình đố vui truyền hình Anh Quốc, nơi người chơi phải kết hợp các con số cho sẵn để đạt được một giá trị mục tiêu. "Kết quả là nó đã hoạt động tốt", Pan chia sẻ. "Mặc dù ban đầu AI chỉ đưa ra những câu trả lời vô nghĩa, nhưng cuối cùng nó đã tự tìm ra cách khắc phục các lỗi".

Quan trọng hơn, việc chỉ cần vài ngày làm việc và bỏ ra 30 USD có thể sao chép được mô hình AI cao cấp như vậy là một cú sốc đối với nhiều người trong ngành. Điều này đi ngược với quan điểm phổ biến cho rằng những đột phá trong AI đòi hỏi trung tâm dữ liệu, GPU cao cấp và hàng tỷ USD đầu tư.

DeepSeek từng làm ngạc nhiên giới công nghệ khi công bố chi phí phát triển mô hình chỉ vài triệu USD. Theo Pan, ở quy mô nhỏ hơn, con số này thậm chí có thể xuống còn 30 USD.

Tuy nhiên, giới quan sát cho rằng cần thận trọng. Họ cho rằng chi phí DeepSeek công bố có thể chưa phản ánh đầy đủ thực tế, do công ty có thể đang tận dụng các nguồn lực hiện có hoặc kỹ thuật từ các mô hình độc quyền khác.

Mặc dù TinyZero đã chứng minh rằng việc phát triển AI bằng kỹ thuật học tăng cường có thể thực hiện được với chi phí thấp, nó vẫn còn nhiều hạn chế về khả năng xử lý và độ phức tạp so với hệ thống DeepSeek. Có thể nói, TinyZero giống như một bản thử nghiệm ban đầu để kiểm chứng lý thuyết, thay vì một sản phẩm hoàn chỉnh có thể cạnh tranh trực tiếp với DeepSeek trên thị trường.

Tuy nhiên, bài thử nghiệm này ám chỉ một bước chuyển đổi quan trọng trong lĩnh vực AI. Nếu các nhà phát triển mã nguồn mở có thể sao chép các chức năng phức tạp với ít tài nguyên, điều đó đặt ra câu hỏi tại sao các công ty lớn như OpenAI, Google hay Microsoft lại đổ số tiền khổng lồ vào nền tảng của họ. Một mặt, quy mô và khả năng nâng cao đều có giá của nó. Mặt khác, khả năng lạm phát chi phí trong ngành xuất hiện. Xét cho cùng, các sáng kiến mã nguồn mở có thể cạnh tranh với những gã khổng lồ công nghệ này bằng cách hoạt động với ngân sách tinh gọn hơn.

"TinyZero" và R1 của DeepSeek cho thấy nhu cầu ngày càng tăng đối với các mô hình AI nhỏ gọn, tiết kiệm tài nguyên. Nhiều người đã cho rằng những bước đột phá tiên tiến đòi hỏi chi phí hàng tỷ USD. Giờ đây, có vẻ như một sinh viên xuất sắc hoặc một startup năng động có thể tạo ra những đột phá công nghệ với chi phí thấp đáng ngạc nhiên.

Dù điều này cuối cùng có định hình lại tương lai của cơ sở hạ tầng AI hay chỉ là một điểm bất thường thú vị, cuộc thảo luận về một mô hình AI mạnh mẽ với giá cả phải chăng mới chỉ bắt đầu.

Vũ Hạo

FILI - 23:10:32 01/02/2025

Banner PHS
Logo PHS

Trụ sở: Tầng 21, Phú Mỹ Hưng Tower, 08 Hoàng Văn Thái, Phường Tân Phú, Quận 7, Thành phố Hồ Chí Minh 

(Giờ làm việc: 8h00 - 17h00 hàng ngày - trừ thứ 7, chủ nhật và các ngày lễ) 

1900 25 23 58
support@phs.vn
Kết nối với chúng tôi:

Đăng ký nhận tin

Tải app PHS-Mobile Trading

Công ty Cổ phần Chứng khoán Phú HưngCông ty Cổ phần Chứng khoán Phú Hưng