KB-1794

Council Review Vòng 2 — GPT — NĐ-36-01 v1.1

7 min read Revision 1
council-reviewnd-36-01gptround22026-04-06s169

Council Review Vòng 2 — GPT — NĐ-36-01 v1.1

Ngày: 2026-04-06 Phiên: S169 Đối tượng: knowledge/dev/architecture/nd-36-01-semantic-relationship-infrastructure-draft.md

Tài liệu đã đọc

  • knowledge/dev/architecture/nd-36-01-semantic-relationship-infrastructure-draft.md
  • knowledge/current-state/reports/council-review-nd-36-01-gpt-v1.md
  • knowledge/current-state/reports/council-review-nd-36-01-gemini-v1.md
  • knowledge/dev/ssot/operating-rules.md
  • knowledge/dev/architecture/dieu39-knowledge-graph-law-draft.md

Kết luận ngắn

v1.1 sửa đúng trọng tâm gần như toàn bộ góp ý Vòng 1. Từ mức “đủ lõi nhưng chưa production-ready”, bản này đã lên mức “đủ chắc để viết Phần 2”. Tôi nâng điểm từ 8.7 → 9.2/10.

1) 9 MT đã đủ chưa?

Đủ để bước sang Phần 2.

v1.1 đã khép được các lỗ hổng lớn của v1.0:

  • MT8 xử lý merge/split/survivorship/namespace
  • MT9 xử lý evaluation/calibration
  • MT4 xử lý 3 vùng dữ liệu + tách match_score/approval_state
  • MT6 nâng từ log đơn lẻ thành active learning có review queue + hard negatives + gold set

Tôi chưa thấy thiếu mục tiêu lớn nào ở tầng Mục tiêu. Những gì còn thiếu chủ yếu đã chuyển sang tầng Giải pháp/Thành phần/Quy trình chứ không phải thiếu MT.

2 lỗ nhỏ còn lại ở mức mục tiêu

  1. Versioning/temporal semantics cho alias/relation nên viết rõ hơn trong MT2 hoặc MT8.
  2. Retention/lifecycle cho candidate/quarantine/annotation log nên được nhắc ở MT4 hoặc nguyên tắc xuyên suốt.

2) Feedback Vòng 1 đã xử lý đúng chưa?

Có, và xử lý đúng bản chất.

MT8

Đã giải đúng lỗi lớn nhất của v1.0: từ “link lúc đọc” sang “quản trị thực thể chuẩn”. Câu merge/split/canonical reassignment + namespace/scope là đúng thuốc.

MT9

Đã sửa đúng bệnh “AI có vẻ đúng”. Precision/recall, false merge/false link, gold set, confidence calibration là đủ chuẩn để bước vào production discipline.

MT3

Sửa rất tốt. Bước 0 Normalize+Blocking + tầng 2/3 song song là chính xác hơn bản tuyến tính. Vai trò agent được kéo về đúng chỗ: chỉ ăn phần khó.

MT4

Sửa rất đúng: 3 vùng dữ liệu + match_score ≠ approval_state + JSONB runtime/cột nóng/export layer. Đây là sửa quan trọng bậc nhất vì nó chặn trộn tri thức chuẩn với tri thức nghi ngờ.

MT6

Sửa tốt và đủ sâu. Từ “log” chuyển thành “system”: review queue, Top 3 candidates, hard negatives, domain-aware, decay, gold set.

3) Sẵn sàng viết Phần 2 chưa?

Có. THÔNG QUA để viết Phần 2.

Lý do:

  • Mục tiêu đã rõ WHAT, chưa lao vào HOW quá sớm
  • Ranh giới NĐ-36-01 / Đ38 / Đ39 đã chốt đủ rõ
  • Các “cửa pháp trị” lớn đã có: candidate/approved/quarantine, APR cho merge/split, bootstrap=draft, AI chỉ đề xuất
  • Tinh thần OR §XII đã đúng: mục tiêu rõ, có thể sang giải pháp

4) Rủi ro còn lại

R1. semantic_concept phình thành SSOT song song

Rủi ro vẫn còn nếu Phase 2 viết lỏng. Cần chốt cứng trong Phần 2:

  • chỉ sinh semantic_concept khi chưa có entity chuẩn nào phù hợp
  • nếu đã có entity chuẩn thì alias/relation phải trỏ về entity đó, không đẻ concept mới
  • mọi species mới phải APR + Council + Birth

R2. Chưa DOT-hoá khép kín ở mức mục tiêu

Phần 1 đúng, nhưng sang Phần 2 bắt buộc phải có DOT cho:

  • candidate review queue
  • merge/split proposal
  • semantic integrity check định kỳ
  • stale alias scan
  • calibration / gold set benchmark
  • retention / archive / eviction

R3. Advisory locks / concurrent disambiguation

Gemini Vòng 1 nhắc đúng. Đây không phải thiếu ở MT, nhưng là rủi ro triển khai thật trên PG khi nhiều worker/agent cùng xử lý ambiguity.

R4. Versioning cho semantic relations

Gemini Vòng 1 nhắc “versioning cho quan hệ ngữ nghĩa”; v1.1 chưa viết thật đậm. Nên có effective_from/effective_to hoặc revision policy ở Phần 2.

5) Thứ tự triển khai phân pha

Đồng ý với đề xuất Pha A → B → C → D của GPT Vòng 1, chỉ chỉnh nhẹ như sau:

Pha A — NĐ-36-01 Core MVP

  • aliases
  • abbreviation_dict
  • entity_relations lõi
  • approved/candidate/quarantine
  • exact + fuzzy + Qdrant candidate generation
  • provenance tối thiểu
  • review queue tối thiểu

Pha B — Đ38 Binding MVP

  • semantic annotation runtime
  • binding VB → entity/schema
  • cột nóng + JSONB runtime
  • DOT so VB ↔ PG

Pha C — NĐ-36-01 Governance MVP

  • MT8 merge/split/canonical reassignment
  • namespace/scope
  • stale alias scan
  • versioning/temporal semantics cơ bản

Pha D — Đ39 Consumer MVP

  • ăn 2 nguồn: entity_relations + Đ38 output
  • A3/A4/A8 trước, chưa mở rộng intelligence sâu

Pha E — NĐ-36-01 Learning nâng cao

  • full active learning
  • gold set monthly benchmark
  • RLHF data prep
  • CBR outcome organization

=> Tôi không đẩy MT8 xuống quá muộn. Merge/split governance nên vào sớm hơn bản đề xuất cũ, ít nhất ở mức MVP governance, vì nếu đợi sau Đ39 thì SSOT sẽ bắt đầu méo.

Điểm số

  • v1.0: 8.7/10
  • v1.1: 9.2/10
  • Mức tăng: +0.5

Các lỗ hổng còn lại

  1. Chưa viết rõ versioning/temporal policy cho alias/relation/annotation.
  2. Chưa viết rõ retention tiers cho candidate/quarantine/log.
  3. Chưa nhấn mạnh advisory locks / concurrency control cho disambiguation/merge.
  4. Chưa khẳng định đủ cứng rằng semantic_concept là ngoại lệ hẹp, không phải chuồng mặc định cho mọi thứ chưa rõ.
  5. Chưa nói rõ ACL / scope filtering ở tầng NĐ-36-01 khi annotation chạm dữ liệu nhạy cảm; Đ39 có C8 nhưng NĐ-36-01 nên nhắc nguyên tắc để không đẩy hết lên Đ39.

Đề xuất hiệu chỉnh cuối cùng trước Phần 2

  1. Thêm 1 đoạn ngắn dưới MT2 hoặc MT8: alias/relation có hiệu lực theo thời gian, có revision/lifecycle.
  2. Thêm 1 đoạn ngắn dưới MT4: candidate/quarantine/log có retention + archive policy.
  3. Trong nguyên tắc xuyên suốt, thêm dòng: concurrent review/disambiguation phải có advisory lock hoặc cơ chế tương đương.
  4. Chốt câu pháp trị cho semantic_concept: species ngoại lệ, chỉ dùng khi chưa có entity chuẩn phù hợp; cấm dùng làm bãi chứa “chưa biết để đâu”.
  5. Thêm 1 câu nguyên tắc về scope/ACL tối thiểu cho annotation và disambiguation case có dữ liệu nhạy cảm.

Phán quyết

THÔNG QUA Phần 1. KHÔNG cần Vòng 3.

Chỉ cần vá 5 điểm chữ nhỏ ở trên ngay đầu Phần 2 hoặc cuối Phần 1 là đủ. Không phải lỗ hổng cấp “chặn”.

Nhận xét cuối

v1.1 đã qua ngưỡng “ý tưởng tốt” và vào ngưỡng “khung mục tiêu triển khai được”. Chỗ cần giữ kỷ luật nhất khi viết Phần 2 không còn là chọn buzzword, mà là:

  • không để semantic_concept thành SSOT thứ 2,
  • không để logic rơi khỏi PG vào prompt,
  • không để candidate trộn vào approved,
  • và phải DOT-hoá toàn bộ vòng merge/review/benchmark/retention.