5.1.2.1. Data
Copied
{
"id": "aefc17a7-8318-4180-ab28-482d55dc22cc",
"service_label": {
"id": "232bb139-f411-4bfc-b63b-f4e5aad96dcd",
"created_at": "2024-04-26T08:54:55.396569Z",
"updated_at": "2024-04-26T08:54:55.396590Z",
"deleted_at": null,
"label": "invoice_data",
"display_name": "Thông tin hóa đơn",
"default": true,
"enable": true,
"ordering": 0,
"data_type": "string",
"format": null,
"constraint": "required",
"category": "section",
"capitalize_type": "default",
"box": null,
"document_template": "c44b7565-7116-4600-a6ff-6d84dbddad60",
"parent": null
},
"created_at": "2024-05-06T08:37:40.924170Z",
"updated_at": "2024-05-06T08:37:40.924196Z",
"deleted_at": null,
"ocr_value": null,
"value": null,
"last_ocr_value": null,
"normalized_value": null,
"confidence_score": null,
"status": "for_review",
"category": "section",
"box": null,
"lookup_verified": null,
"row_idx": null,
"value_confirmation": null,
"value_approval": null,
"merchandise": null,
"page": "a5c39172-40d1-412b-a531-d4449ae80477",
"document": "27d72697-1076-452b-8d85-8f437979e68d",
"parent": null,
"data_set":[]
}
Cấu trúc của 1 ô dữ liệu trong 1 văn bản sẽ có những thông tin quan trọng như:
- id: ID của ô dữ liệu
- service_label: Chứa thông tin về nhãn của ô dữ liệu đó, gồm các thông tin như:
- label: Nhãn của ô dữ liệu (VD: invoice_data)
- display_name: Tên hiển thị của nhãn đó (VD: Thông tin hóa đơn)
- category: Loại kiểu dữ liệu, sẽ là 1 trong 4 kiểu dữ liệu được đề cập dến ở phần a.
- constraint: Nếu giá trị là “required” nghĩa là trường dữ liệu này là bắt buộc cần điền để xác nhận hồ sơ.
- value: Giá trị hiện tại của ô dữ liệu
- box: Danh sách 4 phần tử là vị trí 4 đỉnh của vùng trên tài liệu mà đọc được dữ liệu
- confidence_score: Độ tin cậy của dữ liệu
- ocr_value: Dữ liệu đọc được từ quá trình OCR
- normalized_value: Dữ liệu được định dạng lại sao cho hợp lý
- value: Dữ liệu cuối cùng, khi người dùng thay đổi dữ liệu của các giấy tờ trong tài liệu sẽ thay đổi giá trị này
- page: UUID của trang chứa vùng dữ liệu
- parent: UUID của dữ liệu cha
- data_set: Nếu là kiểu dữ liệu section, table hay row sẽ có các trường con, vậy nên data_set sẽ là danh sách của các Data con của dữ liệu Data này.