Как зайти в Даркнет?!
25th January, 01:11
6
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
895
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
914
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
906
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4381
0
Помогите пожалуйста решить задачи
24th November, 23:53
6086
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4351
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4396
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Есть ли модуль python для сопоставления regex в файлах zip
У меня есть более миллиона текстовых файлов, сжатых в 40 zip файлов. У меня также есть список из около 500 наименований моделей телефонов. Я хочу узнать, сколько раз конкретная модель была упомянута в текстовых файлах.
Есть ли какой-либо модуль python, который может выполнить сопоставление regex с файлами, не распаковывая его. Есть ли простой способ решить эту проблему без распаковки?
Там нет ничего, что автоматически сделает то, что вы хотите.
Тем не менее, существует модуль python zipfile, который сделает это легко сделать. Вот как перебирать строки в файле.
#!/usr/bin/python
import zipfile
f = zipfile.ZipFile('myfile.zip')
for subfile in f.namelist():
print subfile
data = f.read(subfile)
for line in data.split('\n'):
print line
Чтобы получить доступ к содержимому файла zip, вы должны распаковать его, Хотя пакет zipfile делает это довольно легко, так как вы можете распаковать каждый файл в архиве по отдельности.
Модуль Python zip-файл
Разве это не возможно (по крайней мере теоретически) прочитать в кодировке Хаффмана ZIP-х годов и затем перевести регулярное выражение в код Хаффмана? Может быть, это более эффективно, чем сначала снять сжатие данных,а затем запустить регулярное выражение?
(Примечание: Я знаю, что это было бы не так просто: вам также придется иметь дело с другими аспектами макета ZIP coding—file, блочными структурами, back-references—but можно представить, что это может быть довольно легким.)
EDIT: Также обратите внимание, что, вероятно, гораздо разумнее просто использовать решение zipfile .