Список вопросов
Как зайти в Даркнет?!
25th January, 01:11
4
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
892
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
912
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
905
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4380
0
Помогите пожалуйста решить задачи
24th November, 23:53
6084
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4350
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4395
0
Метода Крамера С++
23rd October, 11:55
4308
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2598
0
Алгоритм определения визуально скрытых HTMLDom элементов
Просмотров: 330
 
Ответов: 4
Есть задача: по коду html-страницы программно определить список скрытых (не видимых глазом) html элементов.
Первое что приходит в голову: взять node.js + jquery (http://habrahabr.ru/blogs/javascript/104761/) и поиграть с псевдоселектором :visible, но есть сомнение, что в данном случае не будут учитываться css файлы.
Вопрос знатокам: можно ли научить данную свзяку учитывать css файлы и как это сделать?
PS. также буду благодарен другим способам решения задачи на базе linux.
Если не ломает запускать на сервере полноценный браузер — посмотрите в сторону Selenium. Имели опыт написания парсеров/грабберов на нем — есть API для практически любого языка (сами на PHP писали).
Коротко о нем: запускается браузер, и работа ведется непосредственно с уже отрендеренной в браузере страницей. Так что обрабатываются и css, и $('#element').hide() всякие.
Плюс запуск «на поиграться посмотреть» достаточно прост, что не маловажно.
Это невозможно в рамках поставленной задачи. Формулируйте задачу конкретнее. Т.к. от ширины экрана отображающего устройства видимость объектов изменется. Когда я писал антиспам для ворпресса я стандартную форму ввода двинул на 3000 пикселей влево, а не выставлял :hidden, т.к. некоторые боты парсят :hidden. С точки зрения юзера же не видно ни то ни другое. Другое дело если вам надо найти элементы которые никогда не могут быть показаны, это уже более реальная задача.
Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться