KB-47A5

Điều 14: Luật Chống Trùng lặp — 3 cấp

2 min read Revision 1
lawdieu-14duplicate3-capengine

ĐIỀU 14: LUẬT CHỐNG TRÙNG LẶP — KHÔNG HAI THỨ CÙNG BẢN CHẤT

Trùng lặp = phá vỡ SSOT = vi phạm Nguyên tắc 1. Data ghi vào A nhưng AI đọc B → sai mà không ai hiểu tại sao.

§1. Ba cấp độ chống trùng

Cấp Tên Điều kiện Hành động Kỹ thuật
1 Trùng chính xác Tên/code giống 100% sau chuẩn hoá CHẶN — không cho tạo O(1), instant. Realtime.
2 Nghi ngờ trùng Mô tả tương tự ≥70% (vector semantic) CẢNH BÁO + system_issues + review bắt buộc Qdrant cosine similarity. Scheduled. O(log n), scale 100K+.
3 Trùng cấu trúc 2 tổ hợp chứa ≥80% cùng items (Jaccard) CẢNH BÁO + review bắt buộc Jaccard index. Scheduled.

§2. Áp dụng cho MỌI loại thực thể

Fields, checkpoints, checkpoint sets, nodes, journey templates, collections, DOT tools, documents — KHÔNG loại nào được miễn.

§3. Engine chống trùng — 1 tool duy nhất

dot-duplicate-engine (1 tool — thay tất cả script vụ việc)

TRƯỚC KHI TẠO bất kỳ thực thể:
  1. dot-duplicate-engine --check --type=<type> --name=<n> --desc=<desc>
  2. Cấp 1 (trùng chính xác) → STOP, trả lỗi
  3. Cấp 2 (nghi ngờ) → WARNING, cho tạo + tạo ai_task review
  4. Clean → cho tạo

SCHEDULED SCAN (mỗi ngày):
  dot-duplicate-engine --scan --type=ALL → report + ai_tasks

§4. Điều kiện hoạt động

  • Mô tả (description) ≥20 từ tiếng Việt = NGUYÊN LIỆU cho Engine. Thiếu mô tả = Engine mù.
  • Field name normalization: lowercase, remove prefix, split camelCase/snake_case → semantic match.

§5. Trạng thái: ⚠️ PENDING-ENFORCE

dot-duplicate-engine chưa triển khai (TD-083). Luật có hiệu lực, tool đang trong roadmap Phase 2-3.

→ Chi tiết đầy đủ: knowledge/dev/architecture/duplicate-prevention-law.md (v1.2, Council: Gemini + GPT reviewed)