3 giai đoạn chuẩn hóa dữ liệu

Một số giai đoạn quan trọng liên quan đến quá trình chuẩn hóa dữ liệu như sau:

Có một số cách nhóm các thành phần dữ liệu trong bảng. Nhà thiết kế cơ sở dữ liệu sẽ quan tâm đến việc chọn cách đảm bảo không có sự bất thường trong việc phân nhóm dữ liệu. Những bất thường này bao gồm dự phòng dữ liệu, mất dữ liệu và quan hệ giả trong dữ liệu.

Hình ảnh lịch sự: 4.bp.blogspot.com/-MTnjMQCPoRI/Tu4HGFKjV2I/AAAAAAAAAHQ/md1Cz89KH1U/s1600/2service.jpg

Bình thường hóa nhằm mục đích loại bỏ sự bất thường trong dữ liệu. Quá trình chuẩn hóa bao gồm ba giai đoạn, mỗi giai đoạn tạo ra một bảng ở dạng bình thường.

1. Dạng bình thường đầu tiên:

Bước đầu tiên trong quá trình chuẩn hóa là đặt tất cả các trường lặp lại trong các tệp riêng biệt và gán các khóa thích hợp cho chúng.

Lấy ví dụ về xử lý đơn đặt hàng mua các yếu tố dữ liệu sau đây có thể được xác định trong đơn đặt hàng:

ID nhà cung cấp

Tên nhà cung cấp

Địa chỉ nhà

Số lượng đơn đặt hàng

Ngày

Điều khoản thanh toán

Điều kiện vận chuyển

Không.

Mã sản phẩm

Sự miêu tả

Đơn vị đo lường

Giá bán

Số lượng đặt hàng

Số tiền

Như đã nêu chi tiết ở trên, 'điều khoản vận chuyển' được lặp lại cho mỗi S. Số và sẽ có nhiều bản ghi cho mỗi đơn đặt hàng. Trong giai đoạn đầu tiên của chuẩn hóa, các thành phần dữ liệu lặp lại được đặt trong các bảng riêng biệt. Do đó, chúng tôi chia các thành phần dữ liệu thành hai bảng như dưới đây:

Các yếu tố dữ liệu quan trọng được hiển thị bằng chữ in hoa. Bảng hiện ở dạng bình thường đầu tiên (INF) vì tất cả các thành phần dữ liệu lặp lại (các trường) nằm trong một bảng riêng (Bảng 1.2) và các khóa truy xuất đã được gán cho mỗi bảng. Vì có hai yếu tố chính trong cả hai bảng, có thể nói rằng mỗi bảng có các phím ghép / hỗn hợp. Quá trình chuẩn hóa này đã đơn giản hóa dữ liệu.

2. Dạng bình thường thứ hai:

Trong giai đoạn chuẩn hóa này, tất cả các yếu tố không phải khóa được chỉ định đầy đủ bởi một thứ khác ngoài khóa hoàn chỉnh được đặt trong một bảng riêng biệt. Thông thường, các phần tử không khóa này chỉ phụ thuộc vào một phần của khóa ghép.

Cân nhắc Bảng 1.1, một khóa tổng hợp bao gồm Nhà cung cấp_ ID và Đơn đặt hàng số. đang được sử dụng. Tuy nhiên, các yếu tố không chính như tên và địa chỉ của nhà cung cấp chỉ phụ thuộc vào id của nhà cung cấp chứ không phụ thuộc vào đơn đặt hàng số. Do đó, các phần tử dữ liệu không khóa này được đặt trong các bảng riêng biệt cùng với phần tử dữ liệu chính là nhà cung cấp dịch vụ.

Tương tự, các yếu tố dữ liệu không chính như ngày, điều khoản thanh toán và điều khoản vận chuyển chỉ phụ thuộc vào đơn đặt hàng số. và do đó được đặt trong một bảng riêng biệt cùng với đơn đặt hàng số. là yếu tố chính. Bây giờ, chúng ta có ba bảng thay cho Bảng 1.1:

Tương tự, chúng ta có thể tách Bảng 1.2 bằng cách tách các yếu tố không chính như mô tả, đơn vị đo lường và giá cả, chỉ phụ thuộc vào mã sản phẩm trong bảng. Tương tự, mã sản phẩm, số lượng và số lượng phụ thuộc vào đơn đặt hàng số và S. Số được đặt trong một bảng riêng biệt.

Mẫu bình thường thứ hai (2NF) đã sẵn sàng và có năm bảng.

3. Dạng bình thường thứ ba:

Giai đoạn chuẩn hóa này cho phép loại bỏ các phần tử và bảng dữ liệu dư thừa là tập hợp con của các bảng khác. Các phần tử dự phòng là các phần tử dữ liệu không khóa được đặt trong nhiều bảng của các phần tử dữ liệu ảo.

Các phần tử dữ liệu ảo là những phần tử có giá trị có thể được tính bằng các phần tử khác và khi giá trị được yêu cầu. Giá trị của phần tử dữ liệu số lượng trong Bảng 1.2.2 có thể được tính bằng cách nhân số lượng với giá do đó loại bỏ các phần tử dữ liệu dư thừa đó.

Nếu một bảng khác được gọi là bảng chính của nhà cung cấp cũng đang được duy trì trong cơ sở dữ liệu, có khả năng Bảng 1.1.2 sẽ là một tập hợp con của bảng chính của nhà cung cấp. Do đó, bảng này cũng có thể được loại bỏ.

Dạng thông thường thứ ba (3NF) cung cấp nhóm dữ liệu đơn giản, dễ bảo trì và có độ dự phòng tối thiểu.

Do đó, chuẩn hóa có thể giúp giảm sự dư thừa cũng như loại bỏ các bất thường khác trong dữ liệu. Quá trình chuẩn hóa ba bước được thảo luận ở trên chỉ mang tính gợi ý. Những nỗ lực tiếp theo có thể được thực hiện trong khi thiết kế cơ sở dữ liệu, nếu cần thiết dựa trên bản chất của dữ liệu.