| imho.ws |
![]() |
|
|
|||||||
|
Сообщения:
Перейти к новому /
Последнее
|
Опции темы |
|
|
# 1 |
|
Full Member
Регистрация: 26.06.2005
Сообщения: 935
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
отсеивание дубликатов из двух текстовых файлов, но...
Ищется программа!
Есть два текстовых файла, содержащих в себе по несколько десятков тысяч строк Нужна программа, которая может "проглотить" оба файла, затем отсеять из второго файла такие же строки которые есть в первом и в результате получить очищенный от дублей второй файл (или можно вывести в новый/третий файл)... Спасибо |
|
|
|
|
# 2 |
|
Advanced Member
Регистрация: 21.06.2004
Сообщения: 403
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
traktorist
Если честно, то ответа на Ваш вопрос не знаю, но задача примитивная, поэтому сам бы сделал так - А что мешает написать самостоятельно скрипт, например на VBScript, который: 1) имеет примитивный HTA интерфейс, с тремя кнопками 2) Первая Кнопка. Берет первый файл и загоняет его в SQL таблицу (при этом сначала очистив ее) 3) Вторая Кнопка. Берет второй файл и построчно сравнивает с данными из таблицы, и если строка не найдена, то вносит ее в третий файл. 4) Третья кнопка. Просто небольшой отчет-статистика, сколько и что отсеялось из второго файла (на основе шага сравнения строк с таблицей, фильтруем по полю [int] вхождения) На первый взгляд кажется ужасть как кропотливо (время которое никогда не бывает лишним), да если еще никогда не занимался программированием, но повторюсь, сделав однажды (главное начать), потом ...
__________________
Из библии: И даны вам будут такие доказательства, что не поверить будет невозможно, но вы все равно не поверите |
|
|
|
|
# 3 |
|
Migel Mod Volos
Регистрация: 09.09.2003
Адрес: МПЛ-в почетной д
Сообщения: 7 486
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
traktorist, правила читаем? Поднятие темы у нас не приветствуется.
Тем не менее могу нечто подобное нарисовать на двиге 1С77. Если устроит - пиши в приват. Желательно с более детальным описанием задачи.
__________________
Все "спасибы" - в приват и в репутацию! не засоряйте форум!!!! © Plague Небьющаяся игрушка - это игрушка, которой ребенок может разбить все свои остальные игрушки. |
|
|
|
|
# 4 |
|
Moderator
Регистрация: 29.04.2002
Адрес: Moscow
Пол: Male
Сообщения: 2 980
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
traktorist, склеивем 2 файла в один, потом берем Text Dublicate Killer, прогоняем на нем и получаем результирующий файл, очищенный от дубликатов и отсортированный по алфавиту.
Офф сайт уже не работает, программа старенькая, 2003 года, но в сети найти не сложно. Если не найдешь, пиши, пришлю... Сам недавно озабачивался чисткой файлов под squid
__________________
Есть две бесконечные вещи, Вселенная и глупость. Впрочем, на счет Вселенной, я не уверен Последний раз редактировалось Merlin Cori; 07.04.2009 в 21:18. |
|
|
|
|
# 5 |
|
Migel Mod Volos
Регистрация: 09.09.2003
Адрес: МПЛ-в почетной д
Сообщения: 7 486
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Merlin Cori, насколько я понял задача получить из второго файла только те строки, которые отсутствуют в первом. Так что это немного не то.
__________________
Все "спасибы" - в приват и в репутацию! не засоряйте форум!!!! © Plague Небьющаяся игрушка - это игрушка, которой ребенок может разбить все свои остальные игрушки. |
|
|
|
|
# 7 |
|
СуперМод
IMHO Консультант 2005-2009 Регистрация: 14.08.2002
Адрес: Московская ПЛ, ракетный отс
Пол: Male
Сообщения: 14 523
![]() |
Чисто технически, задача реализуема даже встроенными средствами Windows...
![]() process.cmd Код:
@echo off for /f "tokens=" %%A in (file2.txt) do ( find "%%A" file1.txt if ERRORLEVEL 1 echo %%A >>result.txt ) И, заметьте: если в нём самом есть дубли, не встречающиеся в file1.txt - они и в result.txt будут дублями... P.S. А, нет, есть ещё стандартные ограничения виндовой консоли... На символы <>"& в том же file2.txt.
__________________
Не засоряйте форум "спасибами"! Для выражения благодарности существуют ПС и репутация! Соблюдайте Правила! Распространенье наше по планете Особенно заметно вдалеке: В общественном парижском туалете Есть надписи на русском языке В. Высоцкий |
|
|