5.1.2.1. Data

Copied
{
  "id": "aefc17a7-8318-4180-ab28-482d55dc22cc",
  "service_label": {
      "id": "232bb139-f411-4bfc-b63b-f4e5aad96dcd",
      "created_at": "2024-04-26T08:54:55.396569Z",
      "updated_at": "2024-04-26T08:54:55.396590Z",
      "deleted_at": null,
      "label": "invoice_data",
      "display_name": "Thông tin hóa đơn",
      "default": true,
      "enable": true,
      "ordering": 0,
      "data_type": "string",
      "format": null,
      "constraint": "required",
      "category": "section",
      "capitalize_type": "default",
      "box": null,
      "document_template": "c44b7565-7116-4600-a6ff-6d84dbddad60",
      "parent": null
  },
  "created_at": "2024-05-06T08:37:40.924170Z",
  "updated_at": "2024-05-06T08:37:40.924196Z",
  "deleted_at": null,
  "ocr_value": null,
  "value": null,
  "last_ocr_value": null,
  "normalized_value": null,
  "confidence_score": null,
  "status": "for_review",
  "category": "section",
  "box": null,
  "lookup_verified": null,
  "row_idx": null,
  "value_confirmation": null,
  "value_approval": null,
  "merchandise": null,
  "page": "a5c39172-40d1-412b-a531-d4449ae80477",
  "document": "27d72697-1076-452b-8d85-8f437979e68d",
  "parent": null,
  "data_set":[]
}

Cấu trúc của 1 ô dữ liệu trong 1 văn bản sẽ có những thông tin quan trọng như:

  • id: ID của ô dữ liệu
  • service_label: Chứa thông tin về nhãn của ô dữ liệu đó, gồm các thông tin như:
    • label: Nhãn của ô dữ liệu (VD: invoice_data)
    • display_name: Tên hiển thị của nhãn đó (VD: Thông tin hóa đơn)
    • category: Loại kiểu dữ liệu, sẽ là 1 trong 4 kiểu dữ liệu được đề cập dến ở phần a.
    • constraint: Nếu giá trị là “required” nghĩa là trường dữ liệu này là bắt buộc cần điền để xác nhận hồ sơ.
  • value: Giá trị hiện tại của ô dữ liệu
  • box: Danh sách 4 phần tử là vị trí 4 đỉnh của vùng trên tài liệu mà đọc được dữ liệu
  • confidence_score: Độ tin cậy của dữ liệu
  • ocr_value: Dữ liệu đọc được từ quá trình OCR
  • normalized_value: Dữ liệu được định dạng lại sao cho hợp lý
  • value: Dữ liệu cuối cùng, khi người dùng thay đổi dữ liệu của các giấy tờ trong tài liệu sẽ thay đổi giá trị này
  • page: UUID của trang chứa vùng dữ liệu
  • parent: UUID của dữ liệu cha
  • data_set: Nếu là kiểu dữ liệu section, table hay row sẽ có các trường con, vậy nên data_set sẽ là danh sách của các Data con của dữ liệu Data này.