TTC Việt Nam
Page Header Background

Tìm hiểu chi tiết về trí tuệ nhân tạo AI mã nguồn mở và các mô hình hiện nay

Trang chủ»Tìm hiểu chi tiết về trí tuệ nhân tạo AI mã nguồn mở và các mô hình hiện nay
Tìm hiểu chi tiết về trí tuệ nhân tạo AI mã nguồn mở và các mô hình hiện nay

OpenAI không tạo ra các mô hình AI mở: Các mô hình GPT và DALL·E khác nhau đều là độc quyền hoặc mã nguồn đóng. Còn Llama của Meta thì sao? Cho dù Mark Zuckerberg có nói bao nhiêu lần đi nữa, nó cũng không phải là mã nguồn mở - mặc dù nó là mã nguồn mở, không giống như các mô hình của OpenAI. 

Nói một cách tổng quát, có 3 loại mô hình AI chính:

  • Độc quyền
  • Mã nguồn mở
  • Mở

Các loại này áp dụng cho cả mô hình ngôn ngữ lớn (LLM) và mô hình chuyển đổi văn bản thành hình ảnh. Mọi thứ vẫn đang được định hình, và Open Source Initiative hiện đang phát triển một định nghĩa nghiêm ngặt về những gì cần thiết để một mô hình AI thực sự được coi là mã nguồn mở, nhưng hãy xem tình hình hiện tại như thế nào.

Mã nguồn mở là gì?

Trước khi xem xét các mô hình AI mã nguồn mở, hãy cùng nhìn lại và xem xét mã nguồn mở thực sự có nghĩa là gì. Nó không phải là một từ ngữ thời thượng ngẫu nhiên: Open Source Initiative (OSI) duy trì một định nghĩa mô tả đầy đủ triết lý và các yêu cầu cơ bản. Nó được phát hành theo Giấy phép Quốc tế Creative Commons Attribution 4.0, nhưng đây là ý chính.

Mã nguồn mở không chỉ có nghĩa là bạn có thể tự do tải xuống hoặc truy cập mã nguồn. Nó phải được cung cấp cho bất kỳ ai sử dụng và sửa đổi theo bất kỳ cách nào họ muốn và cho bất kỳ mục đích nào. Giấy phép mã nguồn mở không được phép hạn chế bất kỳ "lĩnh vực hoạt động" nào, đó là điểm mà nhiều mô hình AI mã nguồn mở còn thiếu sót.

OSI duy trì một danh sách các giấy phép được phê duyệt, nhưng một số giấy phép lớn là Giấy phép Apache 2.0, Giấy phép MIT và Giấy phép Công khai GNU.

Mô hình AI độc quyền là gì?

Các mô hình AI độc quyền là một số mô hình phổ biến và mạnh mẽ nhất hiện có. Những mô hình này được phát triển và vận hành bởi các công ty tư nhân, và mã nguồn, chiến lược huấn luyện, trọng số mô hình, thậm chí cả các chi tiết như số lượng tham số đều thường được giữ bí mật. Cách duy nhất để truy cập vào một mô hình độc quyền là thông qua một số dịch vụ chính thức như chatbot, API hoặc công cụ được xây dựng bằng API.

Hãy lấy ví dụ về GPT-4o của OpenAI. Chúng ta không biết nó được huấn luyện trên dữ liệu nào hoặc nó có bao nhiêu tham số. Cách duy nhất để truy cập nó là thông qua ChatGPT, API của OpenAI hoặc một ứng dụng sử dụng GPT-4o, như Perplexity hoặc Zapier Chatbots.

Và tất nhiên, OpenAI tính phí để truy cập GPT-4o. Nếu muốn sử dụng nó - và đây là một trong những mô hình AI tốt nhất hiện có - thì bạn có thể trả 20 USD/tháng cho ChatGPT Plus, hoặc trả phí để sử dụng API, bằng cách đăng ký một dịch vụ khác hoặc tự xây dựng một cái gì đó. Bạn không thể chỉ tải xuống GPT-4o và chạy nó trên máy chủ của riêng mình.

Điều tương tự cũng đúng với tất cả các mô hình AI độc quyền khác, bao gồm:

  • GPT-4o mini và DALL·E 3 từ OpenAI
  • Claude 3 và Claude 3.5 từ Anthropic
  • Gemini và Imagen 3 từ Google
  • Command R và R+ từ Cohere
  • Midjourney

AI mã nguồn mở là gì?

AI mã nguồn mở là các mô hình AI được phát hành theo giấy phép mã nguồn mở, nhưng điều đó không hẳn chỉ đơn giản như vậy. Các nhà nghiên cứu đã phát hiện ra rằng nhiều mô hình tự nhận là mã nguồn mở nhưng thực chất lại không phải. Quá trình này được gọi là "tẩy trắng mã nguồn mở" (open-washing), và nó làm phức tạp mọi thứ một cách nghiêm trọng… kể cả đối với những người viết về các mô hình AI.

Biểu đồ cho thấy mức độ "mở" của một số mô hình AI

Hiện tại, Open Source Initiative đang nỗ lực phát triển định nghĩa về trí tuệ nhân tạo (AI) mã nguồn mở vì các giấy phép hiện có không thực sự bao quát hết những khía cạnh kỹ thuật của thế hệ mô hình AI hiện tại. Để thực sự đáp ứng các yêu cầu và triết lý của phần mềm mã nguồn mở, không chỉ mã nguồn của mô hình cần được cung cấp miễn phí, mà cả dữ liệu huấn luyện, code huấn luyện, tham số và nhiều thứ khác nữa cũng vậy. Các phần mềm cần được chia sẻ theo giấy phép mã nguồn mở, trong khi những thứ như dữ liệu huấn luyện và mô tả cách hoạt động cần được chia sẻ theo giấy phép Creative Commons - hoặc các giấy phép mở tương tự.

Mô hình AI mở là gì?

Các mô hình mở lấp đầy khoảng trống giữa những mô hình AI độc quyền, khép kín và lý tưởng hoàn hảo về các mô hình AI mã nguồn mở thực sự. (Cho đến khi OSI đưa ra định nghĩa của họ, mô hình gần nhất có thể tìm thấy với lý tưởng đó là OLMo 7B).

Nói một cách đơn giản, các mô hình AI mở được cung cấp miễn phí ở một mức độ nào đó. Thông thường, bạn có thể tải xuống chúng từ Hugging Face và các nền tảng mô hình khác và chạy chúng trên thiết bị của riêng bạn sau khi đồng ý với bất kỳ điều khoản cấp phép nào được đưa ra. Bạn thường có thể huấn luyện lại chúng với dữ liệu của riêng mình để tạo ra mô hình của riêng bạn, rồi xây dựng chatbot và ứng dụng của riêng bạn dựa trên chúng. Trong hầu hết các trường hợp, bạn có thể tìm hiểu sâu về những yếu tố như trọng số của mô hình và kiến ​​trúc hệ thống để hiểu cách chúng hoạt động (ở mức độ tốt nhất có thể).

Giấy phép mở vẫn có thể cho phép sử dụng rộng rãi, nhưng chúng có một số giới hạn bổ sung mà mô hình mã nguồn mở sẽ không có. Ví dụ, giấy phép của Llama 3 cho phép sử dụng thương mại cho tối đa 700 triệu người dùng hàng tháng và chặn một số mục đích sử dụng nhất định. Nhiều nhà nghiên cứu đang nghiên cứu các cách để phân loại những mô hình khác nhau dựa trên mức độ mở của chúng để làm cho mọi thứ rõ ràng hơn.

Góc nhìn từ chuyên gia kỹ thuật của TTC Việt Nam

Dưới góc độ hạ tầng mạng và hệ thống, việc lựa chọn giữa mô hình AI mã nguồn mở và đóng không chỉ là câu chuyện về giấy phép, mà là bài toán tối ưu tài nguyên máy chủ. Đối với doanh nghiệp, việc triển khai các mô hình mã nguồn mở (như Llama 3 hay Mistral) trên hệ thống riêng giúp kiểm soát dữ liệu đầu vào và quyền riêng tư tốt hơn, tránh sự phụ thuộc vào các API bên thứ ba. Tuy nhiên, điều này đòi hỏi năng lực về phần cứng và khả năng tinh chỉnh mô hình sâu. Nếu quý khách đang tìm kiếm giải pháp tối ưu hệ thống mạng hoặc hạ tầng máy chủ để chạy AI cục bộ, TTC Việt Nam sẵn sàng tư vấn các kiến trúc phần cứng phù hợp nhất với nhu cầu.

Các mô hình AI mở và mã nguồn mở phổ biến hiện nay

Các mô hình này bao gồm:

  • Llama 3.1 (Meta - LLM): Giấy phép tùy chỉnh, đa dạng tham số 8B, 70B, 405B với các hạn chế về sử dụng.
  • Gemma 2 (Google - LLM): Giấy phép tùy chỉnh, kích thước 2B, 9B, 27B, giới hạn người dùng.
  • Phi-3 (Microsoft - LLM): Giấy phép MIT, kích thước 3.8B, 7B, 14B.
  • Mixtral 8x7B (Mistral - LLM): Giấy phép Apache 2.0, kiến trúc 8x7B.
  • Mistral 7B (Mistral - LLM): Giấy phép Apache 2.0, kích thước 7B.
  • DBRX (Databricks/Mosaic - LLM): Giấy phép tùy chỉnh, kiến trúc Mixture of Experts.
  • OLMo 7B (Allen Institute for AI - LLM): Giấy phép Apache 2.0, được coi là mô hình mở tiêu chuẩn nhất hiện nay.
  • FLUX.1 [schnell] & [dev] (Black Forest Labs - Trình tạo ảnh): Có sự phân hóa về giấy phép giữa dùng phi thương mại và mã nguồn mở.
  • Stable Diffusion (Stability AI - Trình tạo ảnh): Các phiên bản cũ như 1.5, 2.1, SDXL hiện có sẵn theo giấy phép mở.

Nên sử dụng mô hình AI mở hay mã nguồn mở?

Mặc dù không có nhiều mô hình AI mã nguồn mở hàng đầu như mong muốn, nhưng các mô hình mở tốt nhất lại có khả năng cạnh tranh đáng kinh ngạc với những lựa chọn thay thế độc quyền. Ví dụ, Llama 3 405B và FLUX.1 có thể cạnh tranh sòng phẳng với GPT-4o và DALL·E 3. Nếu có đủ kỹ năng kỹ thuật để sử dụng một mô hình mã nguồn mở, bạn có thể đạt được hiệu suất tương tự với chi phí thấp hơn nhiều và với nhiều sự tự do hơn.

Để được tư vấn chuyên sâu về các giải pháp hạ tầng mạng và tối ưu hệ thống viễn thông phục vụ vận hành các hệ thống AI hiện đại, quý khách vui lòng liên hệ ngay với TTC Việt Nam (ttcvn.net) để nhận được sự hỗ trợ từ các kỹ sư giàu kinh nghiệm của chúng tôi.

NỘI DUNG

  • Đang tải Mục lục...

ĐĂNG KÝ TRẢI NGHIỆM
DỊCH VỤ

HƠN 5.000+ DOANH NGHIỆP ĐÃ VÀ ĐANG ĐỒNG HÀNH CÙNG TTC VIỆT NAM ĐỂ XÂY DỰNG HỆ THỐNG

NHẬN TƯ VẤN MIỄN PHÍ