Что такое очистка данных в контексте базы данных?

Даже после прочтения " Очистки данных" в Википедии, я все еще не понимаю, что такое "Очистка данных", когда этот термин используется для базы данных.

Является ли формальный принцип разработки, что существует заранее определенный способ очистки данных? Если да, то какое ключевое слово мне следует исследовать?

-- или же --

Это общий или простой термин для простой очистки противоречивых данных в базе данных?

Что такое очистка данных?

2 ответа

Решение

В контексте базы данных это исправление данных, которое согласуется со схемой, но ошибочно на более высоком уровне, например, неверные номера кредитных карт и номера SSN, дублированные записи, несоответствия форматов и т. Д.

Это общий, свободный термин, который приобретает конкретное значение только в контексте конкретного случая.

Я создал подпрограммы "Очистка данных" для периодической проверки и исправления проблем с базой данных, которые могут быть непрактичными для проверки в режиме реального времени (т. Е. Проверка на наличие ошибок, несоответствий или дубликатов при вводе данных). Процедура очистки может исправить определенные типы ошибок, такие как проверка того, что запись почтового индекса соответствует городу / штату, или, возможно, поиск вариаций имени клиента (дубликата клиента) с учетом адреса.

Иногда, когда база данных ненормализована (по соображениям производительности), процедура очистки может проверять базу данных в непиковое время, чтобы убедиться, что данные остаются согласованными.

Другие вопросы по тегам