Как зайти в Даркнет?!
25th January, 01:11
5
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
893
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
912
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
905
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4381
0
Помогите пожалуйста решить задачи
24th November, 23:53
6085
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4350
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4395
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Создание тестовых данных в базе данных
Я знаю о некоторых генераторах тестовых данных, но большинство из них, похоже, просто заполняют базы данных стилей имен и адресов [не стесняйтесь поправлять меня].
У нас есть большое интегрированное и нормализованное приложение - например, счета-фактуры имеют номера деталей, связанные с таблицами запасов, номера клиентов, связанные с таблицами клиентов, журналы изменений, связанные с информацией аудита, и т. д., которые, очевидно, трудно заполнить случайным образом. В настоящее время мы запутываем реальные данные, чтобы получить тестовые данные (но не очень хорошо).
Что tools\methods вы используете для создания больших объемов данных для тестирования?
Там, где я работаю, мы используем генератор данных RedGate для генерации тестовых данных.
Так как мы работаем в банковской сфере. Когда нам приходится работать с номинативными данными (номера кредитных карт, личные ID, телефонные номера), мы разработали приложение, которое может маскировать эти поля базы данных, чтобы мы могли работать с ними как с реальными данными.
Я могу сказать, что с Redgate вы можете приблизиться к тому, как ваши реальные данные могут выглядеть на производственном сервере, так как вы можете настроить каждое поле каждой таблицы в вашем BD.
Вы можете создавать планы данных с помощью VSTS Database Edition (с помощью последних средств Power tools 2008).
Он включает в себя мастер генерации данных, который позволяет автоматизировать генерацию данных, указывая на существующую базу данных, чтобы вы получили что-то реалистичное, но содержащее совершенно другие данные
Я запустил свой собственный генератор данных, который генерирует случайные данные, соответствующие регулярным выражениям. Основная идея состоит в том, чтобы использовать правила проверки дважды. Сначала вы используете их для генерации допустимых случайных данных, а затем используете их для проверки новых входных данных в производстве. Я заявил о переписывании утилиты, поскольку это кажется хорошим учебным проектом. Он доступен в googlecode .
Я только что завершил проект по созданию 3 500 000+ линий страховых выплат по медицинскому страхованию. Из-за ограничений HIPPA и PHI использование даже очищенных реальных данных является PITA. Для этого я использовал инструмент Datatect ( http://www.datatect.com/).
Некоторые из вещей, которые мне нравятся в этом инструменте:
- Использует ODBC, так что вы можете генерировать данные в любой источник данных ODBC. Я использовал это для баз данных Oracle, SQL и MS Access, плоских файлов и электронных таблиц Excel.
- Расширяемый через VBScript. Вы можете написать крючки в различных частях рабочего процесса генерации данных, чтобы расширить возможности инструмента. Я использовал эту функцию для "sync up" зависимых столбцов в базе данных и для управления частотным распределением значений, чтобы выровнять их с реальными наблюдаемыми частотами.
- Совершенно известно. При заполнении столбцов внешнего ключа извлекает допустимые ключи из родительской таблицы.
Продукт Red Gate good...but не идеален.
Я обнаружил, что сделал это лучше, когда написал свои собственные инструменты для генерации данных. Я использую его, когда хочу сгенерировать, скажем, Customers...but это не очень хорошо, если вы хотите имитировать случайность, которую клиенты могут использовать, например, создавая orders...some с одним элементом или с несколькими элементами.
Доморощенные инструменты дадут больше всего 'realistic' данных, я думаю.