KB-5C42

GPT — Cách tiếp cận triệt để để dựng bản thiết kế 18 Lark Base (2026-04-12)

5 min read Revision 1
larkblueprintreverse-engineeringgptagent-data

GPT — Cách tiếp cận triệt để để dựng bản thiết kế 18 Lark Base (2026-04-12)

Bối cảnh

Nhân sự kỹ thuật nắm toàn bộ Lark Base đã nghỉ việc. Mục tiêu là dựng lại bản thiết kế đủ sâu để hiểu cấu trúc vận hành, quan hệ bảng, luồng dữ liệu, và nền cho sửa chữa/nâng cấp an toàn.

Kết luận

Cách tiếp cận triệt để và tối ưu KHÔNG phải là đọc từng bảng rồi vẽ tay ngay. Phải làm theo phương pháp 4 lớp, bám tài liệu lõi hiện có:

  • knowledge/dev/architecture/index.md — Hiến pháp Kiến trúc Hệ thống Incomex
  • knowledge/dev/ssot/data-connection-law.md — Luật Luồng Dữ liệu & Kết nối
  • knowledge/dev/lark/README.md
  • knowledge/dev/lark/mechanisms.md
  • knowledge/dev/lark/phase4-data-inventory.md
  • knowledge/dev/lark/snapshots/2026-04-11/index.md

Phương pháp 4 lớp

Lớp 1 — Inventory thực thể

Chốt danh mục 18 base, app_token, tables, fields, views, automations, permissions, owners. Mục tiêu: biết “có cái gì”. Không suy luận business ở bước này.

Lớp 2 — Graph cấu trúc

Dựng đồ thị quan hệ thật:

  • bảng nào link bảng nào
  • field nào là link / lookup / formula / sync
  • inbound/outbound dependencies
  • nhóm bảng master / transactional / derived / reporting / staging

Lớp 3 — Runtime behavior

Không chỉ sơ đồ tĩnh. Phải truy ra:

  • automation nào bắn khi nào
  • field tính toán nào làm biến đổi trạng thái
  • sync/lookup nào kéo dữ liệu sang bảng khác
  • record lifecycle từ tạo → xử lý → duyệt → báo cáo

Lớp 4 — Canonical design pack

Xuất thành bộ tài liệu sống:

  1. Registry 18 base
  2. ER/graph quan hệ bảng
  3. Data flow theo domain
  4. Workflow/automation catalog
  5. Danh mục rủi ro sửa đổi
  6. Ma trận impact khi thay đổi field/bảng/workflow

Vì sao đây là cách tối ưu

  • Theo Hiến pháp Kiến trúc: phải có mô hình tổng thể và SSOT, không phụ thuộc trí nhớ cá nhân.
  • Theo Luật Luồng Dữ liệu & Kết nối: phải mô tả được nguồn, đích, đường đi, biến đổi, và điểm kiểm soát dữ liệu.
  • Theo mechanisms.md: Lark có ít nhất 4 cơ chế liên kết dữ liệu + automation; chỉ đọc schema là chưa đủ.
  • Theo phase4-data-inventory.md: phải tick theo bằng chứng thật, tránh tưởng là đã hiểu nhưng thực ra chỉ đoán.

Trình tự thực thi đề xuất

Giai đoạn A — Freeze nhận thức hệ thống

  • Chốt snapshot đầy đủ 18 base.
  • Không sửa schema trong lúc đang khảo sát.
  • Gắn version/time cho mọi bằng chứng.

Giai đoạn B — Dump cấu trúc chuẩn hóa

Mỗi base lấy:

  • tables
  • fields
  • field types/options
  • views
  • forms
  • roles/permissions
  • automation list/config
  • record samples đại diện

Giai đoạn C — Phân loại bảng

Mỗi bảng gắn loại:

  • master
  • transaction
  • workflow state
  • mapping
  • staging
  • reporting
  • derived/cache Điều này giúp sửa đúng chỗ gốc, không sửa nhầm bảng ngọn.

Giai đoạn D — Dựng 3 loại sơ đồ

  1. Base map: 18 base liên hệ logic gì với nhau
  2. Table relation map: bảng nào nối bảng nào
  3. Business flow map: dữ liệu đi từ phát sinh đến báo cáo/duyệt/đối soát

Giai đoạn E — Reverse-engineer quy tắc vận hành

Cho từng luồng lớn, trả lời 7 câu:

  1. Dữ liệu sinh ở đâu?
  2. Ai nhập?
  3. Trigger nào chạy?
  4. Bảng nào nhận tiếp?
  5. Trường nào tính/lookup/sync?
  6. Trạng thái nào đổi?
  7. Đầu ra cuối cùng là gì?

Giai đoạn F — Chuẩn bị cho sửa chữa/nâng cấp

Xuất ma trận tác động:

  • đổi field A ảnh hưởng bảng nào
  • bỏ automation B gãy luồng nào
  • đổi master table C làm sai báo cáo nào
  • sync/link nào là điểm nổ dây chuyền

Sai lầm cần tránh

  • Chỉ chụp schema mà không đọc automation
  • Chỉ đọc 1 base “core” rồi suy ra cả hệ thống
  • Vẽ theo tên bảng, không xác minh bằng field_id/table_id thực tế
  • Sửa ngay trong lúc chưa có impact map
  • Để tài liệu nằm ngoài SSOT, không cập nhật về Agent Data

Đầu ra cuối cùng nên có

  1. Lark System Blueprint — tài liệu tổng
  2. Base dossiers — 18 hồ sơ base
  3. Cross-table dependency graph
  4. Workflow & automation catalog
  5. Critical master tables
  6. Change impact playbook
  7. Upgrade-safe rules for Lark

Khuyến nghị điều hành

Nên làm đây thành một dự án reverse-engineering chính thức, không phải việc đọc tài liệu đơn lẻ. Cách nhanh nhất để ra kết quả đúng là:

  • lấy snapshot máy đọc được
  • chuẩn hóa thành graph phụ thuộc
  • chỉ sau đó mới viết blueprint business

Đây là con đường chậm hơn vài ngày ở đầu nhưng nhanh hơn rất nhiều ở giai đoạn sửa chữa vì tránh sửa mù và tránh phụ thuộc vào người cũ.