KB-60FB

Tầm nhìn Auto-Dispatch — Kiến trúc Tự động hóa Hội đồng AI

5 min read Revision 1
architecturevisionauto-dispatchmulti-agentautomationstream-3

Tầm nhìn Auto-Dispatch — Kiến trúc Tự động hóa Hội đồng AI

Ngày: 2026-03-24. Phiên: Thảo luận kiến trúc với anh Huyên. Trạng thái: Thiết kế — chưa triển khai. Đọc: search_knowledge("auto-dispatch architecture")


1. BÀI TOÁN

User (anh Huyên) đang làm vai trò "router người" — copy prompt từ AI này sang AI kia. Đây là bottleneck lớn nhất. Mục tiêu: giải phóng user, để hệ thống AI tự phối hợp 24/7 trên Mac mini.

Subscription đã trả: Claude Max, GPT Plus, Google/Gemini. Phải tận dụng tối đa, không dùng API tính phí riêng.


2. KIẾN TRÚC 3 LỚP

Lớp 1: NÃO — Agent Điều phối (Langroid/VPS)

  • Chạy trên VPS (Contabo $8/tháng)
  • Đọc kịch bản/quy trình từ Agent Data
  • Ra lệnh: "GPT ơi, vào đọc task #X, phản biện"
  • Kiểm tra thứ tự, logic đơn giản
  • Model giá rẻ (TQ) đủ dùng — vì chỉ điều phối, không xử lý nội dung
  • Token cực ít: vài chục token/lệnh

Lớp 2: CHÂN TAY — Thao tác cơ học (Mac mini 24/7)

  • AppleScript + Accessibility API (macOS native)
  • Điều khiển bàn phím ảo → gõ vào GPT desktop app
  • Xử lý popup Allow qua Accessibility API (tìm button → click)
  • Không dùng AI — zero token
  • Nhận lệnh từ Agent điều phối qua SSH/API

Lớp 3: BỘ NHỚ — Agent Data (trung tâm)

  • Session thực sự nằm ở đây
  • Prompt đã viết sẵn: "vào đâu, đọc gì, ghi ở đâu"
  • Mỗi AI (GPT, Claude, Gemini) đọc prompt → tự biết phải làm gì
  • Kết quả ghi vào Agent Data → AI khác đọc tiếp
  • Đây chính là Dòng Chảy số 3 (Action → Tasks) trong tầm nhìn 3 Dòng Chảy

3. CÁCH GỌI TỪNG AI — ON-DEMAND

AI Cách gọi on-demand Subscription Vai trò
Claude Code claude -p "prompt" Max (đã trả) Code, kiến trúc, tư duy sâu
Gemini CLI gemini -p "prompt" Đã trả Phản biện, góc nhìn khác
GPT AppleScript → GPT desktop app Plus (đã trả) Phản biện, hội đồng AI, Actions
Model TQ (Langroid) API giá rẻ ~$5-10/tháng Công việc nặng, xử lý hàng loạt

GPT trigger chi tiết (AppleScript):

#!/bin/bash
# trigger-gpt.sh "$PROMPT"
PROMPT="$1"

# 1. Mở GPT app
osascript -e 'tell application "ChatGPT" to activate'
sleep 2

# 2. Gõ prompt (bàn phím ảo OS-level)
osascript -e "tell application \"System Events\" to keystroke \"$PROMPT\""
sleep 0.5
osascript -e 'tell application "System Events" to key code 36'  # Enter

# 3. Xử lý popup Allow (Accessibility API)
for i in $(seq 1 15); do
    sleep 2
    FOUND=$(osascript -e '
        tell application "System Events"
            tell process "ChatGPT"
                try
                    set allowBtn to first button whose name contains "Allow"
                    click allowBtn
                    return "CLICKED"
                on error
                    return "NOT_FOUND"
                end try
            end tell
        end tell
    ')
    [ "$FOUND" = "CLICKED" ] && break
done

Lưu ý: GPT desktop app cần set "Always allow" cho Actions Agent Data 1 lần đầu (thủ công). Sau đó script không cần xử lý popup nữa.


4. FLOW MẪU — HỘI ĐỒNG AI TỰ ĐỘNG

Agent Điều phối (Langroid, model TQ giá rẻ):
    1. Đọc ai_tasks status="pending" từ Agent Data
    2. Gọi Claude Code: claude -p "Đọc task #X, soạn draft kế hoạch, ghi vào task_comments"
    3. Chờ Claude xong → đổi status = "review_needed"
    4. Gọi GPT: trigger-gpt.sh "Đọc task #X status review_needed, phản biện, ghi comment"
    5. Chờ GPT xong → đổi status = "reviewed"
    6. Gọi Gemini: gemini -p "Đọc task #X, bổ sung góc nhìn, ghi comment"
    7. Đổi status = "ready_for_decision"
    
    → Sáng hôm sau anh Huyên đọc kết quả tổng hợp, quyết định.

5. NGUYÊN TẮC THIẾT KẾ

  1. Dùng subscription đã trả — KHÔNG dùng API tính phí cho model flagship
  2. Model TQ giá rẻ cho điều phối — logic đơn giản, vài chục token/lệnh
  3. AppleScript = chân tay — zero token, OS-level, GPT app không phân biệt bot/người
  4. Agent Data = bộ nhớ duy nhất — session nằm ở đây, không phải trong app AI nào
  5. On-demand trigger — gọi khi cần, không chỉ scheduled
  6. Self-healing — script tự phát hiện thất bại, ghi log, alert

6. ĐIỀU KIỆN TIÊN QUYẾT (chưa đủ)

  • Web-test hạ tầng ổn định (đang xây, cần hàng tháng)
  • Kiểm soát từng nguyên tử/hạ nguyên tử (Điều 0-B)
  • Workflow engine lắp ráp (Điều 31+)
  • Script trigger-gpt.sh viết và test trên Mac mini
  • Agent điều phối (Langroid) xây trên VPS
  • "Always allow" Actions trong GPT app (1 lần thủ công)

7. TIMELINE DỰ KIẾN

  • Hiện tại: Thiết kế, nghiên cứu khả năng
  • Khi web-test ổn định: Xây agent điều phối + trigger-gpt.sh
  • Sau đó: Test flow hội đồng AI tự động đầu tiên
  • Dài hạn: Anthropic ship Cowork API (#25791) → thay AppleScript bằng giải pháp chính thức

Tài liệu này là tầm nhìn chiến lược. Triển khai phụ thuộc vào tiến độ hạ tầng web-test và workflow engine.