Dữ liệu đầu vào quyết định chất lượng AI: bài học cho kỹ sư dự toán

Vì sao AI trả lời sai khi kiểm tra dự toán thường do dữ liệu đầu vào: 5 loại dữ liệu cần chuẩn hóa, cách chuẩn bị trước khi hỏi và lưu ý bảo mật cho đội.

29 lượt xem4 phút đọc

Dữ liệu đầu vào quyết định chất lượng AI: bài học cho kỹ sư dự toán

AI không sửa được dữ liệu đầu vào lộn xộn

Nếu bảng dự toán thiếu mã hiệu, mô tả viết tắt, đơn vị không thống nhất, khối lượng không có nguồn, căn cứ pháp lý copy từ hồ sơ cũ, thì AI không thể tạo ra kết quả đáng tin. Nó vẫn viết một câu trả lời trôi chảy, nhưng câu trả lời đó chỉ trôi chảy trên một nền dữ liệu chưa chắc.

Trong quản lý chi phí, chất lượng AI phụ thuộc nhiều vào chất lượng dữ liệu đầu vào. Đây là điểm nhiều người bỏ qua khi mới dùng AI — và là lý do hai người hỏi cùng một câu nhưng nhận kết quả rất khác nhau.

Người dùng đang mắc lỗi gì?

Có ba thói quen phổ biến: copy nguyên bảng dài vào AI nhưng không giải thích cột; hỏi AI kết luận khi dữ liệu thiếu nguồn; và không phân biệt dữ liệu thật, dữ liệu tạm và giả định. Khi đó AI không biết đâu là số đã kiểm, đâu là số tạm, đâu là mô tả đầy đủ — kết quả dễ thành suy đoán.

5 loại dữ liệu kỹ sư dự toán nên chuẩn hóa

Mô tả công tác

Phải đủ để người khác hiểu phạm vi. Chỉ ghi "bê tông", "trát", "lắp đặt" thì AI không kiểm được điều kiện áp dụng. Nên có: vật liệu, quy cách, vị trí, điều kiện thi công, phạm vi bao gồm.

Khối lượng

Nên có nguồn: bản vẽ nào, sheet nào, khu vực nào, công thức hoặc quy tắc nào. Chỉ có số thì AI chỉ kiểm được bất thường bề mặt. Nên có: đơn vị, nguồn bóc, ghi chú, giả định, ngày cập nhật.

Định mức và mã hiệu

Mã hiệu cần đi với mô tả công tác và điều kiện áp dụng. Chỉ đưa mã, AI không biết mã đó có phù hợp điều kiện thi công không. Nên có: mã, tên công tác, đơn vị định mức, nguồn định mức, ghi chú vận dụng.

Đơn giá

Cần nguồn và thời điểm. Một đơn giá không có địa phương, thời điểm hoặc nguồn công bố sẽ khó kiểm chứng. Nên có: địa phương, thời điểm, nguồn công bố, hệ số điều chỉnh nếu có.

Căn cứ pháp lý

Nên ghi rõ số văn bản, ngày ban hành, nội dung liên quan, và tình trạng cập nhật nếu biết — đặc biệt lúc này, khi nhiều quy định đang có dự thảo thay thế. Đừng chỉ ghi chung "theo quy định hiện hành".

Cách chuẩn bị dữ liệu trước khi hỏi AI

Trước khi đưa dữ liệu vào AI, hãy làm sáu việc: xóa dữ liệu nhạy cảm nếu dùng công cụ công cộng; chọn đúng phạm vi, không đưa cả file nếu chỉ cần một phần; giữ tên cột rõ ràng; ghi chú dòng nào là tạm tính; nêu mục tiêu kiểm tra; và yêu cầu AI nói rõ khi thiếu dữ liệu.

Dữ liệu dưới đây là bảng dự toán rút gọn gồm: hạng mục, mã hiệu, mô tả công tác, đơn vị, khối lượng, đơn giá. Một số dòng có thể là số tạm. Hãy chỉ kiểm tra dấu hiệu bất thường và nêu dữ liệu cần bổ sung. Đừng kết luận đúng/sai.

Ví dụ: cùng một câu hỏi, dữ liệu khác nhau

Câu hỏi: "Dòng bê tông móng này có cần kiểm tra lại không?"

Dữ liệu kém: "Bê tông móng, 500 m3."

Dữ liệu tốt hơn: hạng mục móng khu A; công tác bê tông móng đá 1x2 mác 250; đơn vị m3; khối lượng 500; nguồn bản vẽ KC-05 đến KC-08; ghi chú chưa trừ phần giao với cổ cột; mục tiêu kiểm tra điểm cần hỏi lại người bóc khối lượng.

Với dữ liệu kém, AI chỉ trả lời chung. Với dữ liệu tốt hơn, AI có thể gợi ý kiểm phần giao cổ cột, phạm vi móng, mác bê tông, bản vẽ nguồn, quy tắc trừ hay không trừ.

Dữ liệu nhạy cảm và bảo mật

Không phải dữ liệu nào cũng nên đưa lên công cụ AI công cộng. Dự toán, đơn giá, hồ sơ thầu, hợp đồng có thể chứa thông tin thương mại, chiến lược giá hoặc dữ liệu khách hàng. Trước khi dùng, nên xác định: dữ liệu nào được phép đưa lên công cụ bên ngoài, dữ liệu nào phải ẩn hoặc rút gọn, công cụ nào được phép dùng, và ai chịu trách nhiệm kiểm tra đầu ra. Với cá nhân, nguyên tắc an toàn là chỉ đưa phần cần kiểm và ẩn tên dự án/chủ đầu tư/giá nhạy cảm khi không cần thiết.

Bài học cho phòng quản lý chi phí

Nếu một đội muốn dùng AI hiệu quả, đừng bắt đầu bằng việc phát prompt cho mọi người, mà bắt đầu bằng chuẩn dữ liệu: mẫu bảng dự toán rút gọn dùng cho AI, quy ước đặt tên cột, quy ước ghi chú số tạm, quy ước nguồn căn cứ, và quy trình kiểm chứng kết quả. Khi dữ liệu chuẩn, prompt ngắn hơn mà kết quả vẫn tốt hơn.

Câu hỏi thường gặp

Vì sao AI trả lời sai khi kiểm tra dự toán? Một lý do lớn là dữ liệu đầu vào thiếu, sai hoặc không có ngữ cảnh. AI có thể suy đoán nếu người dùng không yêu cầu nói rõ phần thiếu dữ liệu.

Dữ liệu tối thiểu để AI kiểm tra bảng dự toán là gì? Hạng mục, mã hiệu, mô tả công tác, đơn vị, khối lượng, đơn giá hoặc thành tiền, và mục tiêu kiểm tra. Nếu cần kiểm pháp lý hoặc định mức, phải có nguồn căn cứ.

Có nên đưa file dự toán thật lên AI không? Chỉ khi được phép và đã kiểm soát dữ liệu nhạy cảm. Với công cụ công cộng, nên rút gọn, ẩn thông tin nhạy cảm và chỉ đưa phần cần kiểm.

Dùng tiếp như thế nào

Trước khi tìm prompt hay hơn, hãy chuẩn hóa dữ liệu đầu vào — đây là bước giúp AI thành công cụ kiểm tra hữu ích thay vì nguồn trả lời chung chung. Cách viết prompt khi dữ liệu đã rõ, xem Prompt AI cho kỹ sư dự toán; cách đưa dữ liệu vào một vòng rà soát hoàn chỉnh, xem quy trình 20 phút rà soát bảng dự toán. Bạn cũng có thể tra cứu trên sổ tay Quản lý chi phí, Dự toán & Đo bóc khối lượng của CostFlow.

Chia sẻ bài viết

Nếu bạn thấy bài viết này hữu ích, hãy chia sẻ với bạn bè!

Bình luận

Chia sẻ kinh nghiệm hoặc đặt câu hỏi về bài viết