NĐ-LARK-01 — Rà soát khả năng thực hiện, phân công và hiệu suất các cổng

Trạng thái: DRAFT bổ sung cho nd-lark-01-reconstruction-blueprint-plan-v1-gpt.md Tác giả: Incomex Hội đồng AI / GPT Ngày: 2026-04-12 Mục đích: Làm rõ tính khả thi thật, cách phân công thực hiện, và đánh giá hiệu suất các cổng theo tình hình hiện tại

I. Kết luận điều hành ngắn

Kế hoạch NĐ-LARK-01 khả thi, nhưng chỉ khả thi nếu đổi từ tư duy “viết blueprint tổng quát” sang tư duy điều tra có kiểm chứng theo cổng và theo checklist coverage.

Điểm nghẽn thật hiện nay không phải là thiếu ý tưởng lưu trữ, mà là thiếu 3 thứ:

Ma trận khả năng thật của từng cổng — cổng nào đọc được loại dữ liệu nào ngoài đời thực.
Danh sách inventory mục tiêu đã chốt — chính xác là phải lấy những loại thông tin nào.
Phân công rõ ràng — ai chịu trách nhiệm cổng nào, ai chịu trách nhiệm coverage, ai chốt bằng chứng.

Nếu 3 thứ này chưa chốt, mọi thiết kế PG hay blueprint đều mới ở mức lý thuyết.

II. Đánh giá khả năng thực hiện theo hiện trạng từng cổng

1. Cổng 1 — MCP tool / Claude Desktop

Hiện trạng

Đã có MCP tool.
Claude Desktop truy cập được.
Nhưng mức hữu dụng hiện tại rất hạn chế.

Đánh giá

Khả năng kỹ thuật: có tồn tại, nhưng chưa phải trụ cột.
Hiệu suất khai thác: thấp.
Độ ổn định để làm dump hàng loạt: thấp.
Vai trò phù hợp: phụ trợ, thử nhanh, kiểm tra chéo hẹp.

Kết luận sử dụng

Không dùng Cổng 1 làm tuyến chính cho Phase 4. Chỉ dùng khi:

cần xác minh nhanh một điểm nhỏ,
cần đối chiếu hành vi với cổng khác,
hoặc cần khai thác thứ mà C2/C4 đang chưa rõ.

Xếp hạng hiện tại

Tính khả thi: MEDIUM
Giá trị sản xuất: LOW
Ưu tiên triển khai: LOW

2. Cổng 2 — Public REST / chương trình đọc dữ liệu

Hiện trạng

Đã triển khai xong.
Đã xác nhận tải thử được 1 file.
Theo tài liệu S178, bộ đọc READ toolkit đã verify 15/15 endpoint đọc của Bitable v1 trên base thử nghiệm là PASS.
Theo tài liệu mechanisms.md và cong2-p6-final-report, C2 là tuyến chủ đạo cho schema, role/permission, member/user, forms, app/table/field metadata và phần lớn inventory nền.

Đánh giá

Khả năng kỹ thuật: cao.
Độ lặp lại: cao nhất trong các cổng đang có.
Khả năng tự động hóa: cao.
Phù hợp để dump 18 base: cao.
Điểm yếu: hiện mới xác nhận thực chiến ở mức hẹp; chưa chứng minh xong coverage trên toàn bộ 18 base.

Kết luận sử dụng

Cổng 2 phải là xương sống chính thức của toàn bộ chương trình dump.

Nhưng cần tránh một hiểu lầm: “đã test 1 file chạy” không đồng nghĩa với “đã đủ để triển khai sản xuất toàn bộ”. Việc còn thiếu là một sprint ngắn để đo coverage thực chiến trên 18 base theo checklist inventory.

Xếp hạng hiện tại

Tính khả thi: HIGH
Giá trị sản xuất: VERY HIGH
Ưu tiên triển khai: HIGHEST

3. Cổng 3 — bỏ

Kết luận sử dụng

Loại khỏi kế hoạch điều hành chính. Không phân bổ nguồn lực nữa.

4. Cổng 4 — Claude Desktop qua Chrome extension / đọc trực tiếp UI

Hiện trạng

Kết nối cơ bản được xác nhận là ổn.
Theo mechanisms.md, đây là cổng rất quan trọng cho những gì API không lộ ra đầy đủ, đặc biệt nhóm automation/config và các dấu vết UI-only.
Theo cong2-p6-final-report, một số loại dữ liệu hiện được đánh dấu C4 ONLY như sync table IDs, formula code, trash tables, record ordering, change stream; ngoài ra automation/list và automation/configs theo tài liệu cũng là năng lực cốt lõi của C4.

Đánh giá

Khả năng kỹ thuật: cao cho điều tra sâu.
Khả năng hàng loạt: trung bình.
Độ ổn định / tái lập: trung bình, kém hơn C2.
Giá trị: cực cao ở vai trò bù khuyết và xác minh.

Kết luận sử dụng

Cổng 4 phải là cổng số 2 về tầm quan trọng, nhưng không phải tuyến dump nền. Nó nên được dùng theo cơ chế:

C2 dump trước,
coverage chỉ ra gap,
C4 vào lấp đúng gap đó.

Xếp hạng hiện tại

Tính khả thi: HIGH
Giá trị sản xuất: HIGH
Ưu tiên triển khai: HIGH, nhưng sau C2

5. Cổng 5 — Computer Use (Claude Desktop)

Hiện trạng

Chưa thử.
Theo mechanisms.md, đây là phương án cuối để đọc phần Setup UI hoặc stage options khi C4 không tìm được endpoint hoặc fieldMap không trả.

Đánh giá

Khả năng kỹ thuật lý thuyết: có giá trị cứu hộ.
Tính xác thực thực chiến hiện tại: chưa có.
Chi phí vận hành: cao.
Độ lặp lại: thấp nhất.
Rủi ro: dễ tốn thời gian mà không tăng coverage tương xứng nếu dùng quá sớm.

Kết luận sử dụng

Không được mở rộng C5 thành tuyến điều tra chính. C5 chỉ được mở khi đồng thời thỏa 3 điều kiện:

C2 không đọc được.
C4 không đọc được hoặc không xác minh được.
Loại dữ liệu đó được xác định là critical cho blueprint.

Xếp hạng hiện tại

Tính khả thi: UNKNOWN → tạm MEDIUM-LOW
Giá trị sản xuất: situational
Ưu tiên triển khai: LAST RESORT

III. Xếp hạng tổng thể các cổng theo vai trò thực tế

Cổng	Vai trò nên giao	Khả thi	Hiệu suất	Tự động hóa	Vai trò trong kế hoạch
C1	phụ trợ / kiểm tra chéo nhỏ	Trung bình	Thấp	Thấp	không làm trụ cột
C2	dump nền / inventory chính	Cao	Cao nhất	Cao	xương sống
C3	bỏ	-	-	-	loại khỏi kế hoạch
C4	bù gap / automation / UI-only / xác minh	Cao	Trung bình-cao	Trung bình	cổng số 2
C5	cứu hộ / last resort	Chưa rõ	Thấp	Thấp	chỉ mở khi thật cần

Kết luận chốt

Mô hình điều hành đúng là: C2 làm nền → C4 lấp gap → C1 kiểm tra chéo hẹp → C5 cứu hộ chọn lọc.

IV. Vấn đề mù hiện nay: chưa chốt được “Lark thực sự cấp cái gì để lưu”

Đây là nhận định đúng và là trọng tâm nhất.

Tài liệu phase4-data-inventory.md rất quan trọng, nhưng hiện tại nó mới là checklist mục tiêu dựa trên hiểu biết đã có. Muốn biến nó thành công cụ điều hành thực chiến, cần tách nó thành 3 lớp rõ ràng:

Lớp A — Expected inventory

Danh sách kỳ vọng phải lấy. Ví dụ:

app metadata
table list
field list
view list
form list
role list
permission matrix
member list
automation list
automation configs
formula code
sync IDs
stage options
change stream

Lớp B — Observed availability by gate

Cho từng item ở lớp A, phải ghi rõ:

C2 đọc được thật chưa?
C4 đọc được thật chưa?
mới là suy luận hay đã có bằng chứng?
đã thử trên mấy base?
base nào?

Lớp C — Operational status

Cho từng item, phải có trạng thái thực chiến:

DONE — đã lấy được ổn định
PARTIAL — lấy được một phần
UNVERIFIED — tin là có nhưng chưa thử đủ
BLOCKED — hiện chưa lấy được
NOT-NEEDED-NOW — chưa cần cho phase hiện tại

Nếu chưa tách ra 3 lớp như vậy thì vẫn còn “mù có tổ chức”, chưa phải “biết rõ cái gì thiếu”.

V. Điều chỉnh quan trọng để kế hoạch đi vào thực chất

1. Bổ sung một giai đoạn mới trước Phase dump lớn

Đề xuất chèn thêm một giai đoạn riêng, đứng trước giai đoạn dump toàn bộ:

Giai đoạn 1A — Capability & Coverage Validation

Mục tiêu của giai đoạn này không phải là vẽ blueprint, mà là trả lời dứt điểm 4 câu hỏi:

C2 thực sự đọc được những loại dữ liệu nào trên 18 base?
C4 thực sự đọc bù được những loại dữ liệu nào?
Còn những loại dữ liệu critical nào chưa có cổng đọc đáng tin?
Checklist phase4-data-inventory.md cần sửa gì để phản ánh thực tế?

Đầu ra bắt buộc của Giai đoạn 1A

gate-capability-matrix.md
inventory-manifest-v1.md
coverage-baseline-report.md
danh sách critical gaps

Nếu chưa có 4 đầu ra này, không nên lao vào dump diện rộng.

2. Phân công phải dựa theo vai trò, không theo cảm tính

Vai trò 1 — Lead điều tra C2

Nhiệm vụ:

chạy dump bằng C2,
ghi raw evidence,
báo coverage thực chiến,
không suy diễn UI-only.

Deliverable chính:

C2 dump logs
raw payload inventory
coverage per base
danh sách phần C2 không đọc được

Vai trò 2 — Lead điều tra C4

Nhiệm vụ:

chỉ nhận danh sách gap từ coverage,
dùng C4 để đọc phần UI-only / automation / sync / formula / stage,
ghi bằng chứng rõ ràng,
không làm thay việc dump nền của C2.

Deliverable chính:

gap-resolution notes
C4 evidence pack
danh sách item C4-only hoặc C4-better

Vai trò 3 — Registry / PG engineer

Nhiệm vụ:

dựng schema PG tối giản,
nhận raw evidence từ C2/C4,
chuẩn hóa vào registry,
cập nhật coverage table,
sinh dependency queries.

Deliverable chính:

PG schema v1
load scripts
coverage views
initial relations extraction

Vai trò 4 — Inventory editor / evidence controller

Nhiệm vụ:

quản lý phase4-data-inventory.md,
chuyển checklist thành manifest điều hành,
đảm bảo mỗi tick có bằng chứng thật,
theo dõi item nào đang unverified / blocked.

Deliverable chính:

inventory manifest chuẩn hóa
gate capability matrix
change log inventory

Vai trò 5 — Blueprint synthesizer

Nhiệm vụ:

không đi lấy dữ liệu thô trực tiếp ở đầu,
dùng registry + coverage + evidence để viết flow dossiers và blueprint,
đánh dấu confidence rõ ràng.

Deliverable chính:

flow dossiers
dependency summaries
blueprint draft

Vai trò 6 — Owner / reviewer

Nhiệm vụ:

chốt ưu tiên nghiệp vụ,
quyết định phần nào critical,
duyệt khi nào được phép dùng C5,
duyệt blueprint và review gaps.

VI. Phân công thực hiện đề xuất theo trình tự

Đợt 1 — Làm cho kế hoạch “đo được”

Người phụ trách chính

Lead C2
Inventory editor
Registry engineer

Việc phải xong

Chốt inventory manifest v1 từ phase4-data-inventory.md
Chạy C2 trên một nhóm base đại diện, không chỉ 1 file
Ghi lại coverage baseline
Tách rõ item nào: done / partial / unverified / blocked

Lý do

Đây là bước biến lý thuyết thành số đo thật.

Đợt 2 — Mở rộng dump nền

Người phụ trách chính

Lead C2
Registry engineer

Việc phải xong

chạy C2 trên toàn bộ 18 base
nạp raw vào PG
sinh coverage report toàn cục
dựng inventory nền: bases / tables / fields / views / forms / roles / permissions / members

Lý do

Không có dump nền thì chưa có cái để gap analysis.

Đợt 3 — Đánh vào phần khó

Người phụ trách chính

Lead C4
Inventory editor
Registry engineer

Việc phải xong

đọc các item C4-only / C4-better
verify automation list + configs
verify sync setup / formula code / stage options / change stream
cập nhật coverage và confidence

Lý do

Đây là phần làm nên giá trị của blueprint, nhưng chỉ nên làm sau khi có dump nền.

Đợt 4 — Chỉ mở C5 nếu cần

Người phụ trách chính

Lead C4 / operator Computer Use
Owner duyệt

Việc phải xong

lập danh sách exact items cần C5
chứng minh C2+C4 không đủ
chạy C5 hẹp theo checklist
ghi evidence rõ ràng

Lý do

Nếu mở C5 quá sớm sẽ tốn công mà coverage tăng ít.

Đợt 5 — Tổng hợp blueprint

Người phụ trách chính

Blueprint synthesizer
Owner / reviewer

Việc phải xong

dependency graph
flow dossiers
blueprint draft
impact matrix sơ bộ

VII. Đề xuất sửa tài liệu `phase4-data-inventory.md`

Tài liệu này nên được nâng từ checklist tĩnh thành công cụ điều hành sống bằng cách thêm các cột sau cho từng item:

Critical? — Có thực sự cần cho blueprint phase hiện tại không
Observed by C2?
Observed by C4?
Observed by C5?
Tested bases count
Best gate
Operational status
Evidence ref
Owner

Mục đích

Khi đó ta sẽ không chỉ có danh sách “muốn lấy gì”, mà có luôn:

lấy được chưa,
lấy bằng cổng nào tốt nhất,
đang giao cho ai,
bằng chứng nằm ở đâu.

Đây là thay đổi quan trọng nhất để kế hoạch đi vào thực chất.

VIII. Các nhóm dữ liệu nên ưu tiên chốt trước

Không cần cố lấy tất cả ngay từ đầu. Để khả thi, nên ưu tiên 4 nhóm theo thứ tự:

Nhóm 1 — Inventory nền bắt buộc

base metadata
table list
field list
view list
form list

Nhóm 2 — Quan hệ cấu trúc bắt buộc

link fields
lookup fields
sync table IDs
formula references

Nhóm 3 — Workflow bắt buộc

automation list
automation configs
trigger types
writeback targets

Nhóm 4 — Quản trị / bối cảnh

roles
permission matrix
members
change stream / trash / rank info nếu thực sự cần cho blueprint

Kết luận ưu tiên

Muốn “vẽ lại được hệ thống để sửa chữa”, chỉ cần chậm nhất phải chốt xong Nhóm 1 + 2 + 3. Nhóm 4 quan trọng, nhưng một phần có thể đi sau.

IX. Đánh giá tính khả thi thực sự

Mức 1 — Có thể bắt đầu ngay không?

Có. Vì C2 và C4 đều đã có kết nối thực tế; C2 đã có nền tảng kỹ thuật đủ mạnh, C4 có vai trò bù khuyết rõ.

Mức 2 — Có thể làm triệt để không?

Có khả năng cao, nhưng chỉ nếu đưa phase4-data-inventory.md thành inventory manifest có coverage thật và có phân công sở hữu.

Mức 3 — Điểm có thể làm hỏng kế hoạch là gì?

Dùng C4 quá sớm thay cho C2
Không có owner cho từng item inventory
Tick checklist theo suy luận thay vì evidence
Không tách “có endpoint” với “đọc ổn định được trên 18 base”
Mở C5 quá rộng khi chưa chứng minh cần thiết

X. Khuyến nghị chốt

Chốt 1

Sửa NĐ-LARK-01 để thêm Giai đoạn 1A — Capability & Coverage Validation.

Chốt 2

Nâng phase4-data-inventory.md từ checklist sang inventory manifest điều hành.

Chốt 3

Phân công tối thiểu phải có 4 đầu mối:

Lead C2
Lead C4
Registry/PG engineer
Inventory editor

Chốt 4

Không mở C5 cho đến khi có danh sách critical gaps đã được owner duyệt.

Chốt 5

Mọi đánh giá hiệu suất cổng phải dựa trên 3 thước đo:

coverage tăng bao nhiêu,
thời gian / công sức bỏ ra bao nhiêu,
độ lặp lại / tái kiểm tra được đến đâu.

XI. Kết luận cuối

Hiện nay hướng đi chung là đúng. Nhưng để kế hoạch thực sự khả thi và đi vào thực chất, phải dừng coi phase4-data-inventory.md là checklist lý thuyết, và biến nó thành bảng điều hành thực chiến: item nào, cổng nào đọc được, đã thử trên bao nhiêu base, bằng chứng ở đâu, ai chịu trách nhiệm, trạng thái hiện tại là gì.

Khi làm được việc đó, toàn bộ kế hoạch dựng blueprint sẽ chuyển từ “có vẻ hợp lý” sang “có thể thi công được”.

NĐ-LARK-01 — Rà soát khả năng thực hiện, phân công và hiệu suất các cổng

I. Kết luận điều hành ngắn

II. Đánh giá khả năng thực hiện theo hiện trạng từng cổng

1. Cổng 1 — MCP tool / Claude Desktop

Hiện trạng

Đánh giá

Kết luận sử dụng

Xếp hạng hiện tại

2. Cổng 2 — Public REST / chương trình đọc dữ liệu

Hiện trạng

Đánh giá

Kết luận sử dụng

Xếp hạng hiện tại

3. Cổng 3 — bỏ

Kết luận sử dụng

4. Cổng 4 — Claude Desktop qua Chrome extension / đọc trực tiếp UI

Hiện trạng

Đánh giá

Kết luận sử dụng

Xếp hạng hiện tại

5. Cổng 5 — Computer Use (Claude Desktop)

Hiện trạng

Đánh giá

Kết luận sử dụng

Xếp hạng hiện tại

III. Xếp hạng tổng thể các cổng theo vai trò thực tế

Kết luận chốt

IV. Vấn đề mù hiện nay: chưa chốt được “Lark thực sự cấp cái gì để lưu”

Lớp A — Expected inventory

Lớp B — Observed availability by gate

Lớp C — Operational status

V. Điều chỉnh quan trọng để kế hoạch đi vào thực chất

1. Bổ sung một giai đoạn mới trước Phase dump lớn

Giai đoạn 1A — Capability & Coverage Validation

Đầu ra bắt buộc của Giai đoạn 1A

2. Phân công phải dựa theo vai trò, không theo cảm tính

Vai trò 1 — Lead điều tra C2

Vai trò 2 — Lead điều tra C4

Vai trò 3 — Registry / PG engineer

Vai trò 4 — Inventory editor / evidence controller

Vai trò 5 — Blueprint synthesizer

Vai trò 6 — Owner / reviewer

VI. Phân công thực hiện đề xuất theo trình tự

Đợt 1 — Làm cho kế hoạch “đo được”

Người phụ trách chính

Việc phải xong

Lý do

Đợt 2 — Mở rộng dump nền

Người phụ trách chính

Việc phải xong

Lý do

Đợt 3 — Đánh vào phần khó

Người phụ trách chính

Việc phải xong

Lý do

Đợt 4 — Chỉ mở C5 nếu cần

Người phụ trách chính

Việc phải xong

Lý do

Đợt 5 — Tổng hợp blueprint

Người phụ trách chính

Việc phải xong

VII. Đề xuất sửa tài liệu phase4-data-inventory.md

Mục đích

VIII. Các nhóm dữ liệu nên ưu tiên chốt trước

Nhóm 1 — Inventory nền bắt buộc

Nhóm 2 — Quan hệ cấu trúc bắt buộc

Nhóm 3 — Workflow bắt buộc

Nhóm 4 — Quản trị / bối cảnh

Kết luận ưu tiên

IX. Đánh giá tính khả thi thực sự

Mức 1 — Có thể bắt đầu ngay không?

Mức 2 — Có thể làm triệt để không?

Mức 3 — Điểm có thể làm hỏng kế hoạch là gì?

X. Khuyến nghị chốt

Chốt 1

Chốt 2

Chốt 3

Chốt 4

Chốt 5

VII. Đề xuất sửa tài liệu `phase4-data-inventory.md`