Addendum — Metadata sống của Miếng thông tin (alignment với Metadata Governance)
Addendum — Metadata sống của Miếng thông tin
Date: 2026-05-01
Status: Bridging addendum for P11A.
Purpose: Khớp Miếng thông tin với Metadata Governance hiện có. Không tạo doctrine metadata mới.
1. Nguyên tắc
Miếng thông tin không có hệ metadata riêng tách khỏi Metadata Governance chung.
Miếng thông tin là một object family trong Metadata Governance. Nó phải dùng lại các khái niệm đã có: core metadata, profile metadata, relation object, controlled vocabulary, validation layers, DOT/checker.
Nếu metadata hiện có chưa đủ, bổ sung profile field hoặc edge_type vào framework hiện có. Không sinh ra khái niệm metadata thứ hai.
2. Một miếng được xem là “sống” khi hệ thống biết
- Nó là ai — logical_unit identity + unit_version content metadata.
- Nó thuộc về đâu — document/publication membership, parent/child structure.
- Nó nói về gì — profile metadata như topic, entity, numeric claim, version reference, code/workflow binding.
- Nó liên quan ai — relation edges như references, depends_on, uses, implements, supersedes, contradicts.
- Ai đang dùng nó — reverse edges/projections từ publications, components, workflows, vectors, checkers, agents.
3. Mapping vào object hiện có
| Khái niệm | Object / layer |
|---|---|
| Miếng identity | logical_unit |
| Nội dung/version của miếng | unit_version |
| Miếng nằm trong văn bản nào | publication_member / published snapshot |
| Quan hệ cha-con trong văn bản | parent_id, sort_order |
| Quan hệ ngang giữa miếng/object | relation object / edge |
| Nhãn/chủ đề/entity/claim | profile metadata |
| Vector chunk | projection của unit_version, không phải SoT |
4. Relation layer
Relation edge là object metadata chính thức, không phải ghi chú trong body.
Minimum edge fields:
- source
- target
- edge_type
- confidence
- provenance
- status/lifecycle
- timestamps
Core edge types cần proof trước:
contains/ reverse querybelongs_toreferences/ reverse queryreferenced_bydepends_on/ reverse querydepended_on_byuses/ reverse queryused_byimplements/ reverse queryimplemented_bysupersedescontradictscompatible_with/incompatible_with
Không nhất thiết lưu cả hai chiều nếu reverse query có thể suy ra.
5. Vector rule
Vector là projection, không phải source of truth.
Nếu cần chia nhỏ hơn một unit_version, sub-chunk chỉ được nằm trong đúng logical_unit_id + unit_version_id đó.
Cấm tạo một vector chunk bằng cách lấy một phần miếng A và một phần miếng B.
Mọi vector sub-chunk phải inherit metadata từ unit gốc:
- logical_unit_id
- unit_version_id
- canonical_address
- doc_code/publication context nếu áp dụng
- section_type
- lifecycle_status
- review_state
- source span within unit
6. P11A requirement
P11A phải inventory production schema và đối chiếu với C2/02C3/02C1/LSL-01/P5 để trả lời:
- Metadata Governance hiện đã có object/table/field nào cho logical_unit, unit_version, relation, profile, vector projection?
- Relation layer đã có schema/table/registry thật chưa?
- Profile metadata storage hiện có chưa?
- Edge_type vocabulary hiện có chưa?
- Vector payload hiện có enforce đúng unit boundary chưa?
- Cái gì đã có và dùng được ngay, cái gì cần proof, cái gì cần schema migration sau?
7. Boundary
Addendum này không thay thế C2/02C3/02C1. Nó chỉ là cầu nối để đảm bảo Miếng thông tin dùng đúng Metadata Governance hiện có.
Không triển khai schema mới từ addendum này nếu chưa qua P11A inventory và User/GPT approval.