Trong thế giới trí tuệ nhân tạo đang phát triển không ngừng, việc phân biệt rõ ràng giữa các loại mô hình AI là điều cần thiết. Một số tên tuổi lớn như OpenAI với các mô hình GPT và DALL·E, hay Llama của Meta, thường được hiểu lầm là mã nguồn mở. Thực tế, các mô hình của OpenAI là độc quyền, còn Llama tuy không hoàn toàn mở như mong đợi, nhưng lại cung cấp mã nguồn theo cách khác biệt.
Về cơ bản, có ba loại mô hình AI chính đang được thảo luận rộng rãi:
- Mô hình độc quyền
- Mô hình mã nguồn mở
- Mô hình mở
Các phân loại này áp dụng cho cả mô hình ngôn ngữ lớn (LLM) và mô hình chuyển đổi văn bản thành hình ảnh. Hiện tại, mọi thứ vẫn đang trong quá trình định hình, và Tổ chức Sáng kiến Mã nguồn mở (Open Source Initiative - OSI) đang tích cực xây dựng một định nghĩa chặt chẽ về những tiêu chí để một mô hình AI thực sự được coi là mã nguồn mở. Hãy cùng tìm hiểu rõ hơn về từng loại hình này.
Mã nguồn mở thực sự có nghĩa là gì?
Trước khi đi sâu vào các mô hình AI, điều quan trọng là phải hiểu ý nghĩa cốt lõi của "mã nguồn mở". Đây không chỉ là một thuật ngữ thời thượng, mà là một triết lý được Tổ chức Sáng kiến Mã nguồn mở (OSI) định nghĩa đầy đủ. Định nghĩa này mô tả các yêu cầu cơ bản mà một phần mềm cần đáp ứng, và được phát hành theo Giấy phép Quốc tế Creative Commons Attribution 4.0.
Mã nguồn mở vượt xa việc chỉ cho phép tải xuống hoặc truy cập mã nguồn miễn phí. Nó yêu cầu mã nguồn phải được cung cấp cho bất kỳ ai để sử dụng, sửa đổi theo bất kỳ cách nào và cho bất kỳ mục đích nào mong muốn. Giấy phép mã nguồn mở tuyệt đối không được phép hạn chế "lĩnh vực hoạt động" nào. Đây chính là điểm mà nhiều mô hình AI tự xưng mã nguồn mở còn thiếu sót.
OSI duy trì một danh sách các giấy phép được phê duyệt, trong đó có một số tên tuổi lớn như Giấy phép Apache 2.0, Giấy phép MIT và Giấy phép Công khai GNU.
Mô hình AI độc quyền là gì?
Các mô hình AI độc quyền thường là những mô hình mạnh mẽ và phổ biến nhất trên thị trường. Chúng được phát triển và quản lý bởi các công ty tư nhân, giữ bí mật về mã nguồn, chiến lược huấn luyện, trọng số mô hình và thậm chí cả số lượng tham số. Cách duy nhất để tiếp cận một mô hình độc quyền là thông qua các dịch vụ chính thức của nhà phát triển, chẳng hạn như chatbot, giao diện lập trình ứng dụng (API) hoặc các công cụ được xây dựng trên nền tảng API đó.
Lấy ví dụ điển hình là GPT-4o của OpenAI. Chúng ta không có thông tin về dữ liệu mà nó được huấn luyện hay số lượng tham số của nó. Người dùng chỉ có thể tương tác với GPT-4o qua ChatGPT, API của OpenAI hoặc các ứng dụng bên thứ ba tích hợp nó, như Perplexity hay Zapier Chatbots.
Tất nhiên, việc truy cập các mô hình như GPT-4o thường đi kèm với chi phí. Để sử dụng một trong những mô hình AI hàng đầu này, người dùng có thể phải trả 20 USD/tháng cho ChatGPT Plus, hoặc thanh toán phí khi sử dụng API thông qua việc đăng ký các dịch vụ khác hoặc tự xây dựng ứng dụng riêng. Không thể trực tiếp tải xuống GPT-4o và chạy trên máy chủ cá nhân.
Tương tự, điều này cũng đúng với nhiều mô hình AI độc quyền khác, bao gồm:
- GPT-4o mini và DALL·E 3 từ OpenAI
- Claude 3 và Claude 3.5 từ Anthropic
- Gemini và Imagen 3 từ Google
- Command R và R+ từ Cohere
- Midjourney
AI mã nguồn mở thực sự là gì?
Mô hình AI mã nguồn mở được định nghĩa là các mô hình AI được phát hành theo giấy phép mã nguồn mở, nhưng thực tế lại phức tạp hơn nhiều. Các nhà nghiên cứu đã chỉ ra rằng không ít mô hình tự nhận là mã nguồn mở nhưng thực chất lại không đáp ứng đầy đủ tiêu chuẩn. Hiện tượng này được gọi là "tẩy trắng mã nguồn mở" (open-washing), gây ra nhiều sự nhầm lẫn, ngay cả đối với những chuyên gia trong lĩnh vực AI.
Biểu đồ minh họa mức độ "mở" của một số mô hình AI
Trước tình hình đó, Tổ chức Sáng kiến Mã nguồn mở (OSI) đang nỗ lực xây dựng một định nghĩa rõ ràng về trí tuệ nhân tạo mã nguồn mở, bởi các giấy phép hiện hành chưa thể bao quát hết các khía cạnh kỹ thuật phức tạp của các mô hình AI thế hệ mới. Để một mô hình AI thực sự được coi là mã nguồn mở theo đúng triết lý của phần mềm mã nguồn mở, không chỉ mã nguồn của mô hình mà cả dữ liệu huấn luyện, mã nguồn huấn luyện, tham số và nhiều yếu tố khác cũng cần được công khai. Phần mềm phải được chia sẻ theo giấy phép mã nguồn mở, trong khi dữ liệu huấn luyện và tài liệu mô tả cách hoạt động cần tuân thủ các giấy phép mở tương tự như Creative Commons.
Hơn nữa, mức độ tự do mà giấy phép mã nguồn mở mang lại là vô cùng lớn. Các giấy phép nghiêm ngặt nhất thường chỉ yêu cầu người dùng công khai mọi thứ họ xây dựng bằng nó và ghi nhận công lao của các nhà phát triển ban đầu. Đơn giản chỉ có vậy!
Mô hình AI mở là gì?
Các mô hình AI mở đóng vai trò cầu nối giữa các mô hình AI độc quyền, khép kín và lý tưởng về một mô hình AI mã nguồn mở hoàn toàn. Hiện tại, OLMo 7B là mô hình gần nhất với lý tưởng mã nguồn mở thực sự mà chúng ta có thể tìm thấy cho đến khi OSI hoàn thiện định nghĩa của mình.
Nói một cách đơn giản, các mô hình AI mở được cung cấp miễn phí ở một mức độ nào đó. Người dùng thường có thể tải chúng xuống từ các nền tảng như Hugging Face và các kho mô hình khác, sau đó chạy trên thiết bị của riêng mình sau khi chấp nhận các điều khoản cấp phép. Thông thường, bạn có thể huấn luyện lại chúng bằng dữ liệu riêng để tạo ra mô hình tùy chỉnh, rồi phát triển chatbot và ứng dụng dựa trên đó. Trong hầu hết các trường hợp, người dùng có thể nghiên cứu sâu các yếu tố như trọng số mô hình và kiến trúc hệ thống để hiểu cách chúng hoạt động (trong giới hạn cho phép).
Mặc dù các giấy phép mở cho phép sử dụng rộng rãi, chúng vẫn đi kèm một số giới hạn bổ sung mà mô hình mã nguồn mở thực sự không có. Chẳng hạn, giấy phép của Llama 3 cho phép sử dụng thương mại cho tối đa 700 triệu người dùng hàng tháng và cấm một số mục đích sử dụng cụ thể. Điều này có nghĩa là bạn hoặc tôi có thể phát triển ứng dụng với Llama 3, nhưng các tập đoàn lớn như Apple hay Google thì không thể. Tương tự, chính sách sử dụng bị cấm của Gemma 2, trong số các điều khoản khác, cấm "tạo điều kiện hoặc khuyến khích người dùng thực hiện bất kỳ loại tội phạm nào". Dễ hiểu là Google không muốn những chatbot có nội dung độc hại được gắn mác "powered by Google Gemma" tràn lan trên các phương tiện truyền thông.
Những hạn chế này, dù dễ hiểu, lại mâu thuẫn với triết lý mã nguồn mở, đó là lý do tại sao vấn đề này vẫn còn gây tranh cãi. Nhiều nhà nghiên cứu đang tìm cách phân loại các mô hình khác nhau dựa trên mức độ mở của chúng nhằm làm rõ hơn mọi thứ. Nếu có bất kỳ sự thay đổi đáng kể nào, chúng tôi sẽ cập nhật đến bạn.
Các mô hình AI mở và mã nguồn mở nổi bật
Dưới đây là danh sách các mô hình AI mở và mã nguồn mở đáng chú ý hiện nay. Vị trí chính xác của chúng trên thang đo từ "mã nguồn mở" đến "mở" vẫn đang được tranh luận cho đến khi chúng ta có một định nghĩa chuẩn xác hơn từ OSI.
- Llama 3.1 (Meta): Một mô hình ngôn ngữ lớn (LLM) với các phiên bản 8 tỷ, 70 tỷ và 405 tỷ tham số. Mô hình này sử dụng giấy phép tùy chỉnh, có những hạn chế nhất định về cách sử dụng và số lượng người dùng.
- Gemma 2 (Google): Cũng là một mô hình ngôn ngữ lớn (LLM) do Google phát triển, với các phiên bản 2 tỷ, 9 tỷ và 27 tỷ tham số. Giấy phép tùy chỉnh của Gemma 2 cũng đi kèm với các giới hạn đối với người dùng.
- Phi-3 (Microsoft): Một mô hình ngôn ngữ lớn (LLM) từ Microsoft, có các phiên bản 3.8 tỷ, 7 tỷ và 14 tỷ tham số. Phi-3 được phát hành dưới giấy phép MIT.
- Mixtral 8x7B (Mistral): Mô hình ngôn ngữ lớn (LLM) của Mistral, sử dụng kiến trúc Mixture of Experts với 8x7 tỷ tham số. Nó được cấp phép theo Apache 2.0.
- Mistral 7B (Mistral): Một mô hình ngôn ngữ lớn (LLM) khác từ Mistral, với 7 tỷ tham số, cũng sử dụng giấy phép Apache 2.0.
- DBRX (Databricks/Mosaic): Mô hình ngôn ngữ lớn (LLM) với số lượng tham số tương đương 36 tỷ. DBRX sử dụng kiến trúc Mixture of Experts phức tạp và có giấy phép tùy chỉnh.
- OLMo 7B (Allen Institute for AI): Một mô hình ngôn ngữ lớn (LLM) với 7 tỷ tham số. OLMo 7B được phát hành theo giấy phép Apache 2.0 và được xem là mô hình AI mã nguồn mở tốt nhất hiện có.
- FLUX.1 [schnell] (Black Forest Labs): Một trình tạo ảnh với giấy phép tùy chỉnh, chỉ cho phép sử dụng phi thương mại.
- FLUX.1 [dev] (Black Forest Labs): Cũng là một trình tạo ảnh từ Black Forest Labs, được phát hành dưới giấy phép Apache 2.0.
- Stable Diffusion (Stability AI): Một trình tạo ảnh nổi tiếng, sử dụng giấy phép tùy chỉnh. Các phiên bản trước của Stable Diffusion, bao gồm 1.5, 2.1 và SDXL, đều có sẵn theo giấy phép mở.
Nên lựa chọn mô hình AI mở hay mã nguồn mở?
Mặc dù số lượng mô hình AI mã nguồn mở hàng đầu vẫn còn hạn chế, nhưng các mô hình AI mở tốt nhất hiện nay có khả năng cạnh tranh rất mạnh mẽ với các lựa chọn độc quyền. Ví dụ, Llama 3 405B và FLUX.1 có thể mang lại hiệu suất tương đương với GPT-4o và DALL·E 3. Nếu bạn sở hữu đủ kỹ năng kỹ thuật để triển khai và tùy chỉnh, việc sử dụng mô hình mở có thể giúp bạn đạt được hiệu quả tương tự với chi phí thấp hơn đáng kể và sự tự do kiểm soát lớn hơn.
Để được tư vấn chuyên sâu về các giải pháp mạng và viễn thông tích hợp công nghệ AI tiên tiến, hãy liên hệ ngay TTC Việt Nam – Đơn vị hàng đầu về giải pháp hạ tầng và công nghệ tại Việt Nam. Chúng tôi sẵn sàng hỗ trợ bạn tối ưu hóa hệ thống và khai thác tối đa tiềm năng của AI!





