Lập mô hình dữ liệu là gì? – Giải thích về lập mô hình dữ liệu – AWS

Lập mô hình dữ liệu thường bắt đầu bằng việc biểu diễn dữ liệu theo khái niệm và sau đó biểu diễn lại dữ liệu theo ngữ cảnh của công nghệ đã chọn. Các nhà phân tích và bên liên quan tạo ra một số loại mô hình dữ liệu khác nhau trong giai đoạn thiết kế dữ liệu. Sau đây là ba loại mô hình dữ liệu chính:

Mô hình dữ liệu khái niệm

Các mô hình dữ liệu khái niệm mang lại cái nhìn toàn cảnh về dữ liệu. Loại mô hình dữ liệu này giải thích những thông số sau:

  • Dữ liệu bên trong hệ thống
  • Các thuộc tính dữ liệu và điều kiện hoặc ràng buộc về dữ liệu
  • Các quy tắc kinh doanh liên quan đến dữ liệu
  • Cách thức sắp xếp dữ liệu tốt nhất
  • Các yêu cầu về bảo mật và tính toàn vẹn của dữ liệu

Các bên kinh doanh liên quan và nhà phân tích thường tạo ra mô hình khái niệm. Đó là một hình ảnh trình bày theo kiểu sơ đồ đơn giản không tuân theo quy tắc lập mô hình dữ liệu chính thức. Điều quan trọng ở đây là mô hình đó giúp các bên liên quan bất kể biết về kỹ thuật hay phi kỹ thuật đều có thể chia sẻ tầm nhìn chung và đồng thuận về mục đích, phạm vi cũng như thiết kế dự án dữ liệu của họ.

Ví dụ về mô hình dữ liệu khái niệm

Ví dụ: Mô hình dữ liệu khái niệm dành cho một đại lý ô tô có thể hiển thị các thực thể dữ liệu như sau:

  1. Một thực thể Showrooms (Phòng trưng bày) biểu diễn thông tin về các cửa hàng tiêu thụ khác nhau mà đại lý sở hữu
  2. Một thực thể Cars (Xe ô tô) biểu diễn một số xe ô tô mà đại lý hiện đang trữ trong kho
  3. Một thực thể Customers (Khách hàng) biểu diễn mọi khách hàng có thể thực hiện giao dịch mua tại đại lý
  4. Một thực thể Sales (Giao dịch bán hàng) biểu diễn thông tin về giao dịch bán hàng thực tế
  5. Một thực thể Salesperson (Nhân viên bán hàng) biểu diễn thông tin về mọi nhân viên bán hàng làm việc cho đại lý

Mô hình khái niệm này cũng sẽ bao gồm những yêu cầu kinh doanh, chẳng hạn như:

  • Mọi chiếc xe ô tô phải thuộc về một phòng trưng bày cụ thể.
  • Mọi giao dịch bán hàng phải có ít nhất một nhân viên bán hàng và một khách hàng liên kết với nhân viên bán hàng đó.
  • Mọi chiếc xe ô tô phải có tên thương hiệu và mã số sản phẩm.
  • Mọi khách hàng phải cung cấp số điện thoại và địa chỉ email của mình.

Do đó, các mô hình khái niệm đóng vai trò là cầu nối giữa những quy tắc kinh doanh và hệ thống quản lý cơ sở dữ liệu vật lý căn bản (DBMS). Mô hình dữ liệu khái niệm cũng được gọi là mô hình miền.

Mô hình dữ liệu logic

Mô hình dữ liệu logic ánh xạ các lớp dữ liệu khái niệm với cấu trúc dữ liệu kỹ thuật. Loại mô hình này cung cấp thêm chi tiết về khái niệm dữ liệu và mối quan hệ dữ liệu phức tạp đã được xác định trong mô hình dữ liệu khái niệm, ví dụ:

  • Các loại dữ liệu của nhiều thuộc tính khác nhau (ví dụ: chuỗi hoặc số)
  • Mối quan hệ giữa các thực thể dữ liệu
  • Thuộc tính chính hoặc trường chủ chốt trong dữ liệu

Các kiến trúc sư và nhà phân tích dữ liệu cùng nhau hợp tác để tạo ra mô hình logic. Họ tuân theo một trong số vài hệ thống lập mô hình dữ liệu chính thức để tạo ra hình ảnh trình bày. Đôi khi, các nhóm linh hoạt có thể chọn bỏ qua bước này và trực tiếp chuyển từ mô hình khái niệm sang mô hình vật lý. Tuy nhiên, những mô hình này rất hữu ích đối với quá trình thiết kế các cơ sở dữ liệu lớn gọi là kho dữ liệu và quá trình thiết kế hệ thống báo cáo tự động.

Ví dụ về mô hình dữ liệu logic

Ví dụ: tại đại lý ô tô của chúng ta, mô hình dữ liệu logic sẽ mở rộng mô hình khái niệm và xem xét sâu hơn những lớp dữ liệu như sau:

  • Thực thể Showrooms (Phòng trưng bày) có các trường như tên và vị trí là dạng dữ liệu văn bản và số điện thoại là dạng dữ liệu số.
  • Thực thể Customers (Khách hàng) có trường địa chỉ email với định dạng [email protected] hoặc [email protected]. Tên trường có thể không được dài quá 100 ký tự.
  • Thực thể Sales (Giao dịch bán hàng) có tên khách hàng và tên nhân viên bán hàng dưới dạng các trường, cùng với đó là ngày bán hàng dưới dạng loại dữ liệu ngày và số tiền dưới dạng loại dữ liệu thập phân.

Do đó, các mô hình logic đóng vai trò là cầu nối giữa mô hình dữ liệu khái niệm với công nghệ cơ sở và ngôn ngữ cơ sở dữ liệu được nhà phát triển sử dụng để tạo cơ sở dữ liệu. Tuy nhiên, những mô hình này không mang tính áp đặt về mặt công nghệ và bạn có thể triển khai chúng bằng bất kỳ ngôn ngữ cơ sở dữ liệu nào. Những kỹ sư dữ liệu và bên liên quan thường đưa ra các quyết định công nghệ sau khi họ đã tạo ra một mô hình dữ liệu logic.

Mô hình dữ liệu vật lý

Mô hình dữ liệu vật lý ánh xạ các mô hình dữ liệu logic với công nghệ DBMS cụ thể và sử dụng thuật ngữ của phần mềm. Ví dụ: loại mô hình này cung cấp chi tiết về những thông số sau:

  • Loại trường dữ liệu như được biểu diễn trong DBMS
  • Mối quan hệ dữ liệu như được biểu diễn trong DBMS
  • Chi tiết bổ sung như tinh chỉnh hiệu suất

Các kỹ sư dữ liệu tạo ra mô hình vật lý trước khi triển khai bản thiết kế cuối cùng. Họ cũng tuân theo các kỹ thuật lập mô hình dữ liệu chính thức để đảm bảo đã bao quát tất cả các khía cạnh của thiết kế.

Ví dụ về mô hình dữ liệu vật lý

Giả sử đại lý ô tô đã quyết định tạo ra một kho lưu trữ dữ liệu trong Amazon S3 Glacier truy xuất linh hoạt. Mô hình dữ liệu vật lý của họ mô tả những thông số sau:

  • Trong Sales (Giao dịch bán hàng), số tiền bán hàng là loại dữ liệu kiểu số thực (float) và ngày bán hàng là loại dữ liệu kiểu nhãn thời gian.
  • Trong Customers (Khách hàng), tên khách hàng là loại dữ liệu kiểu chuỗi.
  • Trong thuật ngữ của S3 Glacier truy xuất linh hoạt, vault là vị trí địa lý của dữ liệu của bạn. 

Mô hình dữ liệu vật lý của bạn cũng bao gồm những chi tiết bổ sung như Khu vực AWS bạn sẽ tạo vault của mình. Do đó, mô hình dữ liệu vật lý đóng vai trò là cầu nối giữa mô hình dữ liệu logic và bản triển khai công nghệ cuối cùng.