KB-47A5
Điều 14: Luật Chống Trùng lặp — 3 cấp
2 min read Revision 1
lawdieu-14duplicate3-capengine
ĐIỀU 14: LUẬT CHỐNG TRÙNG LẶP — KHÔNG HAI THỨ CÙNG BẢN CHẤT
Trùng lặp = phá vỡ SSOT = vi phạm Nguyên tắc 1. Data ghi vào A nhưng AI đọc B → sai mà không ai hiểu tại sao.
§1. Ba cấp độ chống trùng
| Cấp | Tên | Điều kiện | Hành động | Kỹ thuật |
|---|---|---|---|---|
| 1 | Trùng chính xác | Tên/code giống 100% sau chuẩn hoá | CHẶN — không cho tạo | O(1), instant. Realtime. |
| 2 | Nghi ngờ trùng | Mô tả tương tự ≥70% (vector semantic) | CẢNH BÁO + system_issues + review bắt buộc | Qdrant cosine similarity. Scheduled. O(log n), scale 100K+. |
| 3 | Trùng cấu trúc | 2 tổ hợp chứa ≥80% cùng items (Jaccard) | CẢNH BÁO + review bắt buộc | Jaccard index. Scheduled. |
§2. Áp dụng cho MỌI loại thực thể
Fields, checkpoints, checkpoint sets, nodes, journey templates, collections, DOT tools, documents — KHÔNG loại nào được miễn.
§3. Engine chống trùng — 1 tool duy nhất
dot-duplicate-engine (1 tool — thay tất cả script vụ việc)
TRƯỚC KHI TẠO bất kỳ thực thể:
1. dot-duplicate-engine --check --type=<type> --name=<n> --desc=<desc>
2. Cấp 1 (trùng chính xác) → STOP, trả lỗi
3. Cấp 2 (nghi ngờ) → WARNING, cho tạo + tạo ai_task review
4. Clean → cho tạo
SCHEDULED SCAN (mỗi ngày):
dot-duplicate-engine --scan --type=ALL → report + ai_tasks
§4. Điều kiện hoạt động
- Mô tả (description) ≥20 từ tiếng Việt = NGUYÊN LIỆU cho Engine. Thiếu mô tả = Engine mù.
- Field name normalization: lowercase, remove prefix, split camelCase/snake_case → semantic match.
§5. Trạng thái: ⚠️ PENDING-ENFORCE
dot-duplicate-engine chưa triển khai (TD-083). Luật có hiệu lực, tool đang trong roadmap Phase 2-3.
→ Chi tiết đầy đủ: knowledge/dev/architecture/duplicate-prevention-law.md (v1.2, Council: Gemini + GPT reviewed)