Trong sáng kiến quản lý dữ liệu thông minh, việc dẫn đầu hoặc tham gia chất lượng dữ liệu có giống như một “hiệu ứng yo-yo”, giống như những thăng trầm của chế độ ăn kiêng không thành công mà nhiều người trong chúng ta thường cam kết vào đầu năm mới. Trong trường hợp của chúng tôi, đây là những nỗ lực theo chu kỳ của chúng tôi để cải thiện chất lượng dữ liệu và bắt đầu một năm mới.
Làm thế nào chúng ta có thể chuyển đổi tư duy yo-yo này thành một quá trình chuyển đổi tiến bộ, sẽ giải quyết các vấn đề về dữ liệu và cải thiện chúng về lâu dài? Dưới đây là bốn phương pháp hữu ích nhất.
Phát triển và lựa chọn số liệu, mục tiêu
Trước khi khởi chạy sáng kiến dữ liệu thông minh, hãy ghi lại những nổ lực và kết quả. Mục tiêu và địn hướng nên được rõ ràng và cụ thể. Ví dụ như mục tiêu tổng thể là “Chúng tôi muốn đạt được 80% liên hệ có tiêu đề và email vào cuối quý 2”. Điều này được theo dõi với các cơ sở cụ thể: Bao nhiêu trong số 80% sáng kiến đó sẽ cần bao hàm? Nó sẽ là mọi thứ hay bất cứ thứ gì được tạo ra trước quý trước? Hãy cụ thể để mọi người hiểu. Sau đó, cung cấp lịch trình cập nhật chỉ số liên tục cho các bên liên quan và thông tin chi tiết về mức độ ưu tiên và thời gian dự kiến. Sau khi bạn có điều này, hãy gửi chúng đi vào thời gian và nhịp độ đã hứa - RELIGIOUSLY. Thông qua sự minh bạch, bạn thu hút được các bên liên quan tham gia vào quá trình của bạn
Tận dụng lợi thế từ công nghệ
Phương pháp tốt nhất này dựa vào sự hiệu quả: Công nghệ có thể phát triển siêu năng lực quản lý dữ liệu của bạn theo cấp số nhân. Công việc thủ công có thể cần thiết để chứng minh chiến thuật và chắc chắn cho một phần nhất định của vũ trụ dữ liệu mà bạn đang xử lý, nhưng công nghệ cho phép bạn tái tạo những chiến thuật mà bạn đã phát triển và mở rộng quy mô chúng một cách hiệu quả. Nó đơn giản như việc chọn SQL trên bảng tính để thao tác dữ liệu. Khi bạn đã có một quy trình đã được chứng minh, bạn có thể gửi mã của mình cho nhóm công nghệ để bổ sung, thay đổi và làm phong phú dữ liệu một cách có hệ thống, sau đó thường xuyên thực hiện cập nhật.
Mặt khác, việc sử dụng bảng tính sẽ khiến bạn bắt nhịp với tốc độ chậm hơn và có thể dễ bị lỗi thủ công. Một ví dụ khác là sử dụng giao diện lập trình ứng dụng làm cổng kết nối vũ trụ dữ liệu của bạn với nguồn tham chiếu. Điều này sẽ loại bỏ nhu cầu tải xuống hàng loạt dữ liệu theo cách thủ công và tải chúng lên hệ thống của bạn. Được áp dụng đúng cách, công nghệ có thể giảm lỗi và thêm tính ổn định và bền vững cho bất kỳ sáng kiến dữ liệu nào.
Xây dựng tiêu chuẩn dữ liệu
Để tăng độ tin cậy của dữ liệu, cần có một khuôn khổ để có thể định lượng tính đầy đủ và tuân thủ quy trình thích hợp. Tổ chức các tiêu chuẩn dữ liệu sẽ cung cấp khả năng này. Với các tiêu chuẩn này, người tạo dữ liệu, người dùng và người quản lý sẽ có hiểu biết chung về dữ liệu hiện có và dữ liệu nào doanh nghiệp cần để hoạt động. Đánh giá công việc cần làm có thể được định lượng một cách đơn giản hơn.
Ví dụ, cần quyết định xem trường số điện thoại có thể được để trống hay điền. Khi được điền, nó chỉ nên có các ký tự số không lặp lại lớn hơn bảy chữ số. Sự vắng mặt của các tiêu chuẩn như thế này sẽ liên tục mang lại những phiền nhiễu không cần thiết cho các quy trình dữ liệu của bạn. Tiêu chuẩn dữ liệu giúp thực thi việc giảm thiểu dữ liệu không đủ tiêu chuẩn được đưa vào hệ thống dữ liệu bạn. Những tiêu chuẩn đó cũng có thể mang lại hiệu quả trong các nỗ lực đo lường và công nghệ.
Thiết lập thói quen dữ liệu
Một chế độ ăn kiêng thành công không phải cứ vài tuần thực hiện một lần - chúng yêu cầu thay đổi lối sống liên tục. Tương tự, quản lý dữ liệu yêu cầu các quy trình liên tục cam kết để thành công. Chắc chắn, các sáng kiến về chất lượng dữ liệu đặc biệt đôi khi là cần thiết, nhưng hãy đảm bảo sử dụng những sáng kiến này làm cơ hội để đưa các phát hiện và bài học của bạn vào thực tiễn dữ liệu của bạn.
Ví dụ: nếu bạn có yêu cầu từ doanh nghiệp để làm phong phú hồ sơ của tổ chức bằng các giá trị miền URL, việc thực hiện điều này theo cách thủ công chỉ một lần sẽ mang lại lợi ích trước mắt / ngắn hạn cho các bên liên quan của bạn, tạo ảo giác về việc khắc phục sự cố. Nhưng còn các số liệu mới? Việc khoảng cách này mở rộng sẽ chỉ là vấn đề thời gian. Hãy đảm bảo rằng tập hợp dữ liệu miền của bạn được giải quyết khi có các số liệu mới. Nó cũng phải tuân theo một định dạng nhất định để được xem xét cho vào hồ sơ. Thêm trường tên miền URL trong báo cáo đầy đủ của bạn và cuối cùng, đảm bảo rằng có một nhịp độ làm giàu dữ liệu thường xuyên, bao gồm cả trường mới này, để cung cấp độ chính xác một cách tự nhiên. Xây dựng các phương pháp như vậy trong nền tảng dữ liệu của bạn khi có các yêu cầu mới.
Thay đổi là công việc khó khăn
Thách thức nỗ lực chất lượng dữ liệu của bạn để có sức lan tỏa. Làm cho nó có thể lặp lại, hiệu quả và hiệu suất. Chỉnh sửa phổ thông và chạm là những động tác mặc định rất hấp dẫn. Tại sao? Bởi vì tất cả chúng ta đều muốn “thắng nhanh” - kết quả ngay lập tức và nỗi đau sẽ biến mất trong thời gian ngắn. Nhưng điều này không thực sự giải quyết được bất cứ điều gì - nó khiến các nỗ lực dữ liệu của bạn gặp vấn đề theo chu kỳ như chế độ ăn kiêng yo-yo. Thực tế là các nỗ lực quản lý thủ công hoặc dữ liệu đột xuất không thể mở rộng. Lỗi dữ liệu chỉ là những dấu hiệu chỉ ra rằng cần phải thực hiện các điều chỉnh về thủ tục và chính sách. Đây là những gì bạn phải giải quyết. Để loại bỏ tình trạng này, hãy kết hợp bốn điểm này lại với nhau để tăng chất lượng dữ liệu. Cũng giống như bắt đầu một chế độ ăn kiêng, bạn sẽ giảm cân, tăng năng lượng và khỏe mạnh hơn, miễn là bạn tiếp tục cảnh giác và không thoái lui với những thói quen cũ.
(Nguồn: https://www.dnb.com/perspectives/master-data/data-quality-yo-yo-diet.html)
Liên hệ với CRIF D&B Việt Nam để được tư vấn:
-
Địa chỉ: Tầng 15, Tòa nhà Minh Long, số 17 Bà Huyện Thanh Quan, Phường 6, quận 3, TP.HCM, Việt Nam.
-
Hotline: 02839117288
-
Email: csvietnam@crif.com
-
Website: https://dnbvietnam.com