Skip to content

Agentic AI

🤖

Khi LLM không chỉ trả lời, mà tự lập kế hoạch → gọi tool → quan sát kết quả → tự sửa → lặp lại đến khi xong.Đó là Agentic AI.

Module này dạy bạn 5 việc

  1. HIỂU — agent thực chất là gì, khác chatbot/workflow ở đâu, khi nào nên và khi nào không nên dùng.
  2. LÀM CHỦ — agent loop, tool design, context engineering — những thứ quyết định 80% chất lượng agent.
  3. SETUP — dựng môi trường, viết agent đầu tiên từ số 0 (không cần framework).
  4. TẠO — build agent thật: memory, RAG, multi-agent, MCP, kết nối hệ thống.
  5. ỨNG DỤNG — đánh giá, bảo vệ, đưa lên production và ship cho người dùng thật.

Không cần nền ML. Cần: biết gọi API + tư duy lập trình cơ bản.


🧭 Tư duy cốt lõi: Workflow vs Agent

Trước khi học cách build, phải phân biệt được hai thứ hay bị gọi lẫn là "agent" (theo cách Anthropic định nghĩa trong Building Effective Agents):

WorkflowAgent
Ai quyết định luồng?Lập trình viên viết sẵn code pathLLM tự quyết runtime
Tính dự đoánCao, ổn định, rẻLinh hoạt, đắt hơn, khó đoán hơn
Dùng khiBài toán biết trước các bướcBài toán mở, không hardcode được đường đi

Bài học quan trọng nhất của cả ngành 2026

Đa số use case KHÔNG cần agent. Bắt đầu bằng giải pháp đơn giản nhất; chỉ leo lên agent (rồi multi-agent) khi nó thật sự cải thiện kết quả đo được. Cả OpenAI, Anthropic lẫn cộng đồng đều nhấn mạnh: "start simple, add complexity only when it pays off."

Viên gạch nền: "Augmented LLM"

Đơn vị nhỏ nhất để xây mọi agent — một LLM được tăng cường (Anthropic gọi là augmented LLM):

Augmented LLM = Model + Tools + Memory + Retrieval

LLM tự sinh truy vấn (retrieval), tự chọn & gọi hàm (tools), tự quyết giữ lại gì (memory). Việc của bạn là cho nó một giao diện tốt, mô tả rõ ràng để dùng.


Agent Loop — trái tim của mọi agent

Mọi agent, dù đơn giản hay phức tạp, đều chạy một vòng lặp. Anthropic (Claude Agent SDK) gói gọn thành 4 nhịp:

Vòng lặp chuẩn

Gather context → Take action → Verify work → Repeat

  1. Thu thập ngữ cảnh — tìm/đọc thông tin cần thiết (search, đọc file, gọi API).
  2. Hành động — gọi tool để làm việc thật.
  3. Kiểm chứng — đối chiếu kết quả với tiêu chí (test, linter, LLM-as-judge), tự sửa nếu sai.
  4. Lặp lại — đến khi đạt điều kiện dừng (xong việc / hết lượt / cần con người).

Đây là phiên bản kỹ thuật của vòng ReAct: Thought → Action → Observation → loop.

🤖 ReAct Loop — Agent suy nghĩ thế nào?

Click "Run step" để xem agent loop từng bước.

Thought — agent suy nghĩ kế tiếp
Action — gọi tool
Observation — đọc kết quả tool

Lộ trình 12 chương — 4 phần

Lộ trình bám đúng cách OpenAI, Anthropic, Google và Andrew Ng dạy, theo nguyên tắc cộng đồng đồng thuận: "loop-first, framework-second" — hiểu bản chất vòng lặp trước, framework sau.

🟦 Phần A — HIỂU nền tảng

#ChươngBạn nắm được
1Agent là gì: Workflow vs AgentPhân biệt agent/chatbot/workflow; thang tự chủ L0–L5; khi nào nên/không nên build
2Agent Loop & các Pattern chuẩn4 pattern của Andrew Ng + 5 workflow pattern của Anthropic

🟩 Phần B — LÀM CHỦ & SETUP

#ChươngBạn nắm được
3Build agent đầu tiên từ số 0Tự viết agent loop (không framework); function calling; structured output
4Tool Design (Agent–Computer Interface)5 nguyên tắc thiết kế tool; namespacing; token-efficiency; error message
5Context EngineeringCú shift lớn nhất 2026: quản lý ngữ cảnh, attention budget, compaction, just-in-time
6Memory & Agentic RAGBộ nhớ ngắn/dài hạn; Mem0/Zep/Letta; RAG → Agentic RAG

🟨 Phần C — NÂNG CAO

#ChươngBạn nắm được
7Multi-Agent SystemsDebate "đừng vội multi-agent"; orchestrator-workers; chi phí ~15x
8MCP, Skills & Code ExecutionMCP chuẩn kết nối; Agent Skills; code-execution tiết kiệm token; A2A
9Frameworks & ToolingLangGraph/CrewAI/OpenAI SDK/Claude SDK/ADK; Computer Use; cách chọn

🟧 Phần D — ỨNG DỤNG & PRODUCTION

#ChươngBạn nắm được
10Evaluation & ObservabilityĐánh giá trajectory; LLM-as-judge; LangSmith/Langfuse/Phoenix; OTel
11Safety, Guardrails & ReliabilityLethal trifecta; OWASP Agentic Top 10; 12-Factor Agents
12Ứng dụng VN & Roadmap shipWorkflow agent (n8n/Smax.ai/voice); case VN; roadmap 30 ngày

4 Agentic Pattern bạn sẽ gặp khắp nơi

Andrew Ng (DeepLearning.AI) đúc kết 4 pattern mà gần như mọi agent đều dùng — học thuộc bộ này là có "từ vựng" để đọc hiểu mọi hệ thống agent:

  1. Reflection — agent tự soi và sửa output của chính mình.
  2. Tool Use — LLM tự chọn hàm/API để gọi.
  3. Planning — LLM chia bài toán lớn thành các bước nhỏ.
  4. Multi-Agent Collaboration — nhiều agent chuyên biệt phối hợp, như một công ty thuê nhiều nhân viên.

Chi tiết + 5 workflow pattern của Anthropic (prompt chaining, routing, parallelization, orchestrator-workers, evaluator-optimizer): Chương 2.


Bối cảnh model 2026 — chọn "bộ não" nào?

Agent chỉ mạnh bằng model đứng sau. Trạng thái giữa 2026 (luôn kiểm tra lại vì model ra rất nhanh):

NhàDòng modelGhi chú cho agent
AnthropicOpus 4.8 (28/5/2026), Sonnet 4.6, Haiku 4.5Mạnh nhất cho agentic coding & tool use; Sonnet 4.6 ~ "Opus-level giá 1/5"; Haiku cho việc rẻ/nhanh
OpenAIGPT-5.5 (4/2026), dòng Codex (5.2/5.3-Codex)Agentic coding tốt; built-in tools qua Responses API
GoogleGemini 3.1 Pro, Gemini 3 FlashMạnh long-context & computer-use/browser agent

Mẹo chi phí (dùng xuyên suốt module)

Định tuyến theo độ khó: model nhỏ/rẻ (Haiku, GPT-5-mini) cho phân loại & việc đơn giản; model lớn cho suy luận phức tạp. Kết hợp prompt caching + structured output. Có thể tiết kiệm 60–80% chi phí mà không giảm chất lượng.


Xem trước khi bắt đầu — 3 video nền tảng

Generative vs Agentic AI: Shaping the Future of AI Collaboration

Generative vs Agentic AI: Shaping the Future of AI Collaboration

📺 IBM Technology YouTube ↗

Phân biệt AI sinh nội dung vs AI agent — vào đề rõ ràng. (2025, 1.2M view)

Don't Build Agents, Build Skills Instead – Anthropic

Don't Build Agents, Build Skills Instead – Anthropic

📺 AI Engineer YouTube ↗

Kỹ sư Anthropic bàn triết lý thiết kế agent. (2025, 1.4M view)

you need to learn MCP RIGHT NOW!! (Model Context Protocol)

you need to learn MCP RIGHT NOW!! (Model Context Protocol)

📺 NetworkChuck YouTube ↗

MCP — chuẩn kết nối agent↔tool 2026. (2025, 1.5M view)


🇻🇳 Vì sao dev/founder Việt Nam có lợi thế?

4 lợi thế thực tế

1. Margin runway lớn — lương dev VN thấp hơn global 3–5x, cùng chi phí tool ($50–500/tháng) → biên lợi nhuận cao hơn khi làm product/agency.

2. Blue ocean MCP cho stack nội địa — MISA, KiotViet, Sapo, Pancake, Base.vn… phần lớn chưa có MCP server chính thức. Cơ hội build lớp kết nối (xem Chương 8).

3. Thị trường AI Sale / Customer Care SME khổng lồ — 100K+ SME chưa được phục vụ; Smax.ai đang dominate Messenger/Zalo (xem Chương 12).

4. Nhiều phần mềm nội địa không có API — Computer Use mở khoá tự động hoá việc nhập liệu (xem Chương 9).


Đọc theo thứ tự nào?

  • Dev mới với agent → Chương 1 → 2 → 3 → 4 → 5 (nền tảng vững trước khi vào framework)
  • Founder build product → Chương 1 → 3 → 6 → 8 → 12
  • Operator (HR/marketing/ops) → Chương 1 → 9 (Computer Use) → 12
  • 🇻🇳 Agency / system integrator → Chương 4 → 8 (MCP) → 11 (Safety) → 12 (Roadmap)
  • Researcher / ML engineer → Chương 2 → 5 → 7 → 10

Khóa học miễn phí chính hãng (Anthropic · OpenAI · Google)

Học thẳng từ nguồn gốc. Tất cả miễn phí (link đã kiểm tra còn sống, ghi rõ nguồn):

🟣 Anthropic

🟢 OpenAI

🔵 Google

Mảng tạo nội dung (ảnh/video/nhạc) học ở module Generative AI — cũng có mục khóa học miễn phí riêng.


Trước khi bắt đầu

"Năm 2023 LLM là chatbot.Năm 2024 LLM biết gọi function.Năm 2025–2026 LLM biết tự lái — plan, execute, verify, recover.

Không học agentic giờ = ngồi xem cuộc cách mạng diễn ra mà không tham gia."

→ Sẵn sàng? Bắt đầu: Chương 1 — Agent là gì: Workflow vs Agent