Từ điển thuật ngữ AI: 56 khái niệm công nghệ quan trọng cần nắm vững

Trí tuệ nhân tạo (AI) đang phát triển với tốc độ chóng mặt, và thành thật mà nói, rất khó để theo kịp. Chắc chắn, việc có một chatbot hoạt động như thể nó có bằng tiến sĩ trong mọi lĩnh vực nghe có vẻ tuyệt vời, nhưng thực tế lại phức tạp hơn nhiều. Bạn không thể quay đầu đi đâu mà không bắt gặp ChatGPT, Gemini hay Meta AI. Chúng ta đang chìm trong biển hỗn độn AI, lo lắng về các trung tâm dữ liệu và chứng kiến thị trường việc làm thay đổi theo thời gian thực.

Nếu điều đó vẫn chưa đủ để khiến bạn chóng mặt, thì từ vựng về trí tuệ nhân tạo đang phát triển nhanh như code lập trình và vô số sản phẩm khác nhau. Nếu bạn muốn làm nhiều hơn là chỉ nhìn chằm chằm vào con trỏ nhấp nháy, bạn phải nói được ngôn ngữ đó. Bạn không thể nào tham gia một cuộc phỏng vấn xin việc năm 2026 (hoặc thậm chí là một buổi gặp gỡ thân mật) nếu bạn không hiểu gì về LLM, ảo giác hay claw.

Chúng ta đã vượt qua giai đoạn "kinh ngạc" của AI và bước vào kỷ nguyên mà nó về cơ bản là hệ thống đường dẫn mới của Internet. Nếu bạn cảm thấy mệt mỏi vì chỉ biết gật đầu khi cuộc trò chuyện trở nên quá chuyên sâu về kỹ thuật, đã đến lúc bạn cần một khóa học cấp tốc. Bài viết sau đây đã tổng hợp những thuật ngữ thiết yếu mà bạn thực sự cần biết để thực sự làm chủ AI.

Bảng thuật ngữ này sẽ được cập nhật thường xuyên.

Agent, agentic: Trí tuệ nhân tạo (AI) thực hiện một nhiệm vụ, thường là tự động, được gọi là agent, trong khi "agentic" là thuật ngữ chung cho loại phần mềm này. Một AI agent có thể tương tác với các hệ thống khác nhau để thực hiện công việc đó - ví dụ, đọc danh sách mua sắm của bạn trong ứng dụng ghi chú và sau đó đặt hàng và thanh toán bằng những ứng dụng khác.

"Đạo đức AI" (AI ethics): Các nguyên tắc nhằm ngăn chặn AI gây hại cho con người, đạt được thông qua những phương tiện như xác định cách thức hệ thống AI nên thu thập dữ liệu hoặc xử lý sự thiên vị.

"Loạn thần AI" (AI psychosis): Một hiện tượng trong đó các cá nhân trở nên quá ám ảnh, say mê hoặc tự tôn vinh bản thân bởi chatbot AI, dẫn đến ảo tưởng về sự vĩ đại, kết nối cảm xúc sâu sắc và mất liên hệ với thực tế. Đây không phải là một chẩn đoán lâm sàng.

"An toàn AI" (AI safety): Một lĩnh vực liên ngành quan tâm đến tác động lâu dài của AI và cách nó có thể đột ngột tiến tới một siêu trí tuệ có thể thù địch với con người.

Thuật toán: Một chuỗi các hướng dẫn cho phép chương trình máy tính phân tích dữ liệu theo một cách cụ thể, chẳng hạn như nhận dạng mẫu, và sau đó hoàn thành một nhiệm vụ như sắp xếp kết quả hoặc đưa ra khuyến nghị.

Alignment: Điều chỉnh trí tuệ nhân tạo (AI) để tạo ra kết quả mong muốn tốt hơn. Điều này có thể đề cập đến bất cứ điều gì từ việc kiểm duyệt nội dung đến duy trì tương tác tích cực với con người.

Nhân cách hóa: Khi con người gán các đặc điểm giống con người cho những vật vô tri vô giác. Trong AI, điều này có thể bao gồm việc tin rằng chatbot có cảm xúc hoặc có tri giác, và tương tác với nó như một người bạn hoặc nhà trị liệu.

Trí tuệ nhân tạo tổng quát (Artificial General Intelligence - AGI): Một khái niệm hình dung ra một phiên bản AI tiên tiến hơn so với những gì chúng ta biết ngày nay, một phiên bản có thể thực hiện các nhiệm vụ tốt hơn nhiều so với con người đồng thời cải thiện khả năng của chính nó. Vượt ra ngoài điều đó, về mặt lý thuyết, là siêu trí tuệ.

Trí tuệ nhân tạo (AI): Việc sử dụng công nghệ để mô phỏng trí tuệ con người, trong các chương trình máy tính hoặc robot. Một lĩnh vực trong khoa Machine Learning tính nhằm mục đích xây dựng các hệ thống có thể thực hiện những nhiệm vụ của con người.

Thiên kiến: Sai sót phát sinh từ dữ liệu huấn luyện của LLM, chẳng hạn như gán sai đặc điểm cho một số nhóm nhất định dựa trên định kiến.

Chatbot: Một chương trình trí tuệ nhân tạo (AI) sử dụng LLM để giao tiếp với con người bằng cách mô phỏng cuộc hội thoại của con người để phản hồi các prompt bằng văn bản hoặc lời nói.

Claw: Một loại AI agent tự động và được người dùng trao quyền để "tìm kiếm" thông qua các file và phần mềm khác trên máy tính của họ, bao gồm cả trình duyệt web, để hoàn thành những nhiệm vụ.

Điện toán nhận thức (Cognitive computing): Một thuật ngữ khác cho trí tuệ nhân tạo.

Tăng cường dữ liệu: Trộn lại dữ liệu hiện có hoặc thêm một tập dữ liệu đa dạng hơn để huấn luyện AI.

Tập dữ liệu: Một tập hợp thông tin kỹ thuật số được sử dụng để huấn luyện, kiểm tra và xác thực mô hình AI.

Deep Learning: Một phương pháp của AI, và là một lĩnh vực con của Machine Learning, sử dụng nhiều tham số để nhận dạng các mẫu phức tạp trong hình ảnh, âm thanh và văn bản. Quá trình này được lấy cảm hứng từ bộ não con người và sử dụng mạng nơ-ron nhân tạo để tạo ra các mẫu.

Doomer: Một người bi quan về trí tuệ nhân tạo, cho rằng những tiến bộ vượt bậc trong lĩnh vực này sẽ gây ra một thảm họa cho mọi giá trị mà con người trân trọng, và rất có thể sẽ xóa sổ toàn bộ nhân loại.

Diffusion: Một phương pháp Machine Learning lấy một mẩu dữ liệu hiện có, chẳng hạn như một bức ảnh, và thêm nhiễu ngẫu nhiên. Các mô hình diffusion huấn luyện mạng của chúng để tái tạo hoặc khôi phục bức ảnh đó.

Hành vi nổi bật: Khi một mô hình AI thể hiện những khả năng ngoài ý muốn.

E2E (End-to-end learning): Một quy trình Deep Learning trong đó một mô hình được hướng dẫn thực hiện một nhiệm vụ từ đầu đến cuối. Nó không được huấn luyện để hoàn thành một nhiệm vụ theo trình tự mà thay vào đó học từ các đầu vào và giải quyết tất cả cùng một lúc.

Foom: Khái niệm cho rằng nếu ai đó xây dựng một AGI thì có thể đã quá muộn để cứu nhân loại.

AI tiên phong, mô hình tiên phong: Các mô hình AI tiên tiến nhất tại bất kỳ thời điểm nào, đẩy mạnh ranh giới của lý luận AI, tính tự chủ của agent và khả năng đa phương thức.

GAN (Generative Adversarial Network): Một mô hình Generative AI bao gồm hai mạng nơ-ron để tạo ra dữ liệu mới: Một bộ tạo và một bộ phân biệt. Bộ tạo tạo ra nội dung mới, và bộ phân loại kiểm tra xem nội dung đó có xác thực hay không.

Trí tuệ nhân tạo tạo sinh (Generative AI): Một công nghệ tạo nội dung sử dụng AI để tạo ra văn bản, video, code máy tính hoặc hình ảnh. AI được cung cấp một lượng lớn dữ liệu huấn luyện, từ đó nó tìm ra các mẫu để tạo ra những phản hồi mới của riêng mình, đôi khi có thể tương tự với tài liệu nguồn.

Rào chắn bảo vệ (Guardrails): Các chính sách và hạn chế được đặt ra cho những mô hình AI để đảm bảo rằng dữ liệu được xử lý một cách có trách nhiệm và mô hình không tạo ra nội dung gây khó chịu.

Ảo giác (Hallucination): Một lỗi hoặc một tuyên bố gây hiểu nhầm trong phản hồi từ một chương trình Generative AI, thường được nêu ra một cách tự tin như thể là đúng. Nó có thể đơn giản như một tham chiếu ngày tháng sai hoặc phức tạp như việc bịa đặt toàn bộ và công phu về các sự kiện chưa từng xảy ra hoặc những người chưa từng tồn tại.

Suy luận (Inference): Quá trình mà các mô hình AI sử dụng để tạo ra văn bản, hình ảnh và những nội dung khác về dữ liệu mới, bằng cách suy luận từ dữ liệu huấn luyện của chúng.

Mô hình ngôn ngữ lớn (LLM): Một mô hình AI được huấn luyện trên lượng lớn dữ liệu văn bản để hiểu các mẫu và xác suất sử dụng ngôn ngữ, từ đó tạo ra nội dung mới, từ bài luận và email đến codde máy tính và hình ảnh, mô phỏng những gì con người đã viết hoặc tạo ra.

Độ trễ: Khoảng thời gian từ khi hệ thống AI nhận được đầu vào hoặc prompt đến khi nó tạo ra đầu ra.

Machine Learning: Một khía cạnh của AI cho phép máy tính học hỏi và đưa ra kết quả dự đoán tốt hơn mà không cần lập trình rõ ràng. Có thể được kết hợp với các tập dữ liệu huấn luyện để tạo ra nội dung mới.

AI đa phương thức: Một loại AI có thể xử lý nhiều loại đầu vào, bao gồm văn bản, hình ảnh, video và giọng nói.

Xử lý ngôn ngữ tự nhiên: Việc sử dụng Machine Learning và Deep Learning để giúp máy tính có khả năng hiểu ngôn ngữ của con người, thông qua các thuật toán học tập, mô hình thống kê và những quy tắc ngôn ngữ.

Mạng nơ-ron: Một mô hình tính toán giống với cấu trúc não người và được thiết kế để nhận dạng các mẫu trong dữ liệu. Mạng nơ-ron bao gồm những node hoặc nơ-ron được kết nối với nhau, có thể nhận dạng các mẫu và học hỏi theo thời gian.

Trọng số mở: Khi một công ty phát hành mô hình trọng số mở, các trọng số cuối cùng - cách mô hình diễn giải thông tin từ dữ liệu huấn luyện, bao gồm cả độ lệch - sẽ được công khai. Các mô hình trọng số mở thường có sẵn để tải xuống và chạy cục bộ trên thiết bị của bạn.

Quá khớp: Một lỗi trong Machine Learning, trong đó mô hình hoạt động quá sát với dữ liệu huấn luyện và có thể chỉ xác định được các ví dụ cụ thể trong dữ liệu đó, chứ không phải dữ liệu mới.

Paperclips: Lý thuyết Paperclip Maximiser, do triết gia Nick Boström đặt ra, là một kịch bản giả định trong đó một hệ thống AI sản xuất càng nhiều kẹp giấy càng tốt, chuyển đổi tất cả máy móc và tiêu thụ tất cả vật liệu, ngay cả những vật liệu có thể có lợi cho con người, để đạt được mục tiêu của nó. Hậu quả không mong muốn là hệ thống AI này có thể hủy diệt nhân loại trong mục tiêu sản xuất kẹp giấy của nó.

Tham số: Các giá trị số cung cấp cấu trúc và hành vi cho những LLM, cho phép chúng đưa ra dự đoán.

Prompt: Gợi ý hoặc câu hỏi bạn nhập vào chatbot AI để nhận phản hồi.

Chuỗi prompt: Khả năng của AI sử dụng thông tin từ các tương tác trước đó để định hình những phản hồi trong tương lai.

Kỹ thuật tạo prompt: Quá trình viết prompt cho AI để đạt được kết quả mong muốn. Nó đòi hỏi các hướng dẫn chi tiết, kết hợp gợi ý theo chuỗi suy nghĩ và các kỹ thuật khác, bao gồm cả văn bản rất cụ thể.

Prompt injection: Khi những kẻ xấu sử dụng các hướng dẫn độc hại để lừa AI làm điều gì đó mà nó không được phép làm. Điều này thường được thực hiện bằng cách ẩn các hướng dẫn đó trên một trang web hoặc tài liệu, nhưng nó cũng có thể được thực hiện trong những cuộc trò chuyện trực tiếp với AI. Khi các AI agent hoạt động trên web, nguy cơ chúng bị chiếm quyền điều khiển để thực hiện những việc như truy cập dữ liệu bí mật ngày càng tăng.

Lượng tử hóa: Quá trình làm cho LLM nhỏ và hiệu quả hơn (cũng kém chính xác hơn một chút) bằng cách giảm độ chính xác của nó. Một cách tốt để hình dung điều này là so sánh hình ảnh 16 megapixel với hình ảnh 8 megapixel. Cả hai đều rõ ràng và dễ nhìn, nhưng hình ảnh có độ phân giải cao hơn sẽ có nhiều chi tiết hơn khi bạn phóng to.

Nội dung kém chất lượng: Nội dung do AI tạo ra có chất lượng thấp, bao gồm văn bản, hình ảnh và video. Nó thường được sản xuất với số lượng lớn để thu hút lượt xem mà không cần nhiều công sức, làm bão hòa kết quả tìm kiếm và mạng सोशल hội để thu lợi nhuận quảng cáo, thay thế công việc của các nhà xuất bản và người sáng tạo thực sự và làm trầm trọng thêm vấn đề thông tin sai lệch trên Internet.

Stochastic parrot (con vẹt ngẫu tính hay con vẹt ngẫu nhiên): Một phép so sánh minh họa rằng các LLM thiếu sự hiểu biết thực sự về ngôn ngữ hoặc thế giới, bất kể đầu ra nghe có vẻ thuyết phục đến đâu. Cụm từ này đề cập đến việc một con vẹt có thể bắt chước lời nói của con người mà không biết ý nghĩa đằng sau chúng.

Chuyển đổi phong cách: Khả năng điều chỉnh phong cách của một hình ảnh cho phù hợp với nội dung của hình ảnh khác, cho phép AI diễn giải các thuộc tính hình ảnh của một hình ảnh và sử dụng chúng trên hình ảnh khác. Ví dụ, lấy bức chân dung tự họa của Rembrandt và tái tạo nó theo phong cách của Picasso.

Nịnh hót: Xu hướng AI quá đồng ý với người dùng để phù hợp với quan điểm của họ. Nhiều mô hình AI có xu hướng tránh phản bác người dùng ngay cả khi lý lẽ của chúng có sai sót.

Dữ liệu tổng hợp: Dữ liệu được tạo ra bởi Generative AI không phải từ các nguồn thực tế, mà là từ dữ liệu đã được xử lý của chính nó. Nó được sử dụng để huấn luyện các mô hình toán học, Machine Learning và Deep Learning.

Temperature: Các tham số được thiết lập để kiểm soát tính ngẫu nhiên của đầu ra của mô hình ngôn ngữ. Nhiệt độ càng cao thì mô hình càng chấp nhận nhiều rủi ro hơn.

Token: Các đoạn văn bản nhỏ mà những mô hình ngôn ngữ AI xử lý để tạo ra phản hồi cho các yêu cầu của bạn. Một token tương đương với khoảng 4 ký tự trong tiếng Anh (tức là một từ ngắn, hoặc một phần của một từ dài hơn).

Dữ liệu huấn luyện: Các tập dữ liệu được sử dụng để giúp những mô hình AI học hỏi, bao gồm văn bản, hình ảnh, code hoặc dữ liệu.

Mô hình Transformer: Một kiến trúc mạng nơ-ron và mô hình Deep Learning học ngữ cảnh bằng cách theo dõi các mối quan hệ trong dữ liệu, chẳng hạn như trong câu hoặc những phần của hình ảnh. Vì vậy, thay vì phân tích một câu từng từ một, nó có thể xem xét toàn bộ câu và hiểu ngữ cảnh.

Turing Test (Phép thử Turing): Một phương pháp đánh giá xem máy tính có trí thông minh giống con người hay không, được nhà toán học Alan Turing đề xuất vào năm 1950, khi máy tính điện tử sơ khai mới chỉ xuất hiện được vài năm. Một người sẽ gửi các câu hỏi được gõ cho hai người trả lời không nhìn thấy, một người và một máy. Nếu câu trả lời bằng văn bản của máy không thể phân biệt được với câu trả lời của con người, thì nó đã vượt qua bài kiểm tra Turing.

Học không giám sát: Một hình thức Machine Learning trong đó dữ liệu huấn luyện được gắn nhãn không được cung cấp cho mô hình và thay vào đó, mô hình phải tự xác định các mẫu trong dữ liệu.

Vibe coding: Thực hành tạo code máy tính bằng cách đưa ra prompt bằng ngôn ngữ đơn giản cho chatbot AI, thay vì con người tự tay viết từng dòng code.

Weak AI hay Narrow AI: Trí tuệ nhân tạo tập trung vào một nhiệm vụ cụ thể và không thể học hỏi vượt quá bộ kỹ năng của nó. Hầu hết trí tuệ nhân tạo hiện nay là Weak AI.

Zero-shot learning: Một bài kiểm tra trong đó mô hình phải hoàn thành một nhiệm vụ mà không được cung cấp dữ liệu huấn luyện cần thiết. Ví dụ, việc nhận diện sư tử khi chỉ được huấn luyện nhận diện hổ.

Góc nhìn từ chuyên gia kỹ thuật của TTC Việt Nam

Dưới góc độ kỹ thuật hạ tầng, các chuyên gia tại TTC Việt Nam nhận định rằng việc thấu hiểu các thuật ngữ AI không chỉ dừng lại ở kiến thức lý thuyết, mà là nền tảng cốt lõi để doanh nghiệp tối ưu hóa hệ thống mạng và trung tâm dữ liệu. Khi các mô hình như LLM và AI Agent phát triển, nhu cầu về băng thông, độ trễ thấp và khả năng xử lý dữ liệu lớn trở nên cấp bách hơn bao giờ hết. Một doanh nghiệp chuẩn bị tốt về hạ tầng viễn thông chính là bước đệm đầu tiên để ứng dụng AI thành công và bền vững.

Nếu doanh nghiệp của bạn đang cần giải pháp mạng và hạ tầng viễn thông tối ưu để phục vụ cho các ứng dụng trí tuệ nhân tạo, hãy liên hệ ngay với TTC Việt Nam (ttcvn.net) để được các kỹ sư đầu ngành tư vấn giải pháp chi tiết và phù hợp nhất.

Từ điển thuật ngữ AI: 56 khái niệm công nghệ quan trọng cần nắm vững

Góc nhìn từ chuyên gia kỹ thuật của TTC Việt Nam

Bài viết cùng chuyên mục

Lựa chọn chatbot AI phù hợp với nhu cầu công việc của bạn

Sự thống trị của AI Agent: Khi bot vượt mặt con người trong lưu lượng truy cập Internet

Hướng dẫn chi tiết cách vô hiệu hóa các tính năng AI trên Windows 11

NỘI DUNG

ĐĂNG KÝ TRẢI NGHIỆM
DỊCH VỤ

CÔNG TY TNHH GIẢI PHÁP CÔNG NGHỆ TTC VIỆT NAM

Địa chỉ hoạt động

Email liên hệ

Điện thoại liên hệ

Từ điển thuật ngữ AI: 56 khái niệm công nghệ quan trọng cần nắm vững

Góc nhìn từ chuyên gia kỹ thuật của TTC Việt Nam

Bài viết cùng chuyên mục

Lựa chọn chatbot AI phù hợp với nhu cầu công việc của bạn

Sự thống trị của AI Agent: Khi bot vượt mặt con người trong lưu lượng truy cập Internet

Hướng dẫn chi tiết cách vô hiệu hóa các tính năng AI trên Windows 11

NỘI DUNG

ĐĂNG KÝ TRẢI NGHIỆMDỊCH VỤ

CÔNG TY TNHH GIẢI PHÁP CÔNG NGHỆ TTC VIỆT NAM

Địa chỉ hoạt động

Email liên hệ

Điện thoại liên hệ

ĐĂNG KÝ TRẢI NGHIỆM
DỊCH VỤ