Список вопросов
Как зайти в Даркнет?!
25th January, 01:11
8
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
899
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
952
0
Очень долго работает Update запрос Oracle
27th January, 09:58
916
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
907
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
942
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1727
0
период по дням
25th October, 10:44
3957
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3722
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4614
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4382
0
Помогите пожалуйста решить задачи
24th November, 23:53
6087
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4352
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4400
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Как сохранить HTML-страницу сгенерированную на JavaScript?
Просмотров: 415
 
Ответов: 5
Встречаются страницы, на которых есть динамические части получаемые Ajax или попросту какими-то функция Javascript (например, шаблонизаторами).
Так вот как сохранить скомпилированную страницу, т.е. со всеми выполненными js-функциями? В случае с Ajax скачивание может происходить через некоторое время после загрузки DOM-модели.
Решение желательно на ЯВУ (лучше C#) или через консоль Windows/Linux.
Например, нужно скачать вот эту forexite: Календарь на неделю.
Самый хакерский вариант — вбить javascript:alert(document.documentElement.innerHTML); в браузере… потом Ctrl+A ;)
а для сервера есть htmlunit.sourceforge.net/
Загляните в этот топик, есть несколько ссылок по теме.
habrahabr.ru/blogs/webdev/87705/
Для явы смотрите в эту сторону: download.oracle.com/javase/6/docs/technotes/guides/scripting/programmer_guide/index.html
Уточните вопрос: вам html сгенерённый нужно посмотреть или чтобы вот прям сохранить можно было на диск?
Если просто посмотреть, то в FF поможет выделение всей страницы с помощью Ctrl+A и далее в контекстном меню view Selection Source или можно даже установить WebDeveloper экстеншн, у него есть View Generated Source
на c#?
положи webBrowser на форму, прицепись на всякие обработчики загрузки, и выжидай пока не пройдет некоторое время с момента последнего срабатывания обработчиков загрузки. потом вытягивай innerHTML из document и сохраняй.
точнее не скажу, сейчас под рукой негде экспериментировать. знаю что ничего сложного в доступе к DOM через него нет, да и со слеением за процессами загрузки тоже проблем не было.
как вариант, если точно знаешь структуру сайта который будешь грабить можно подменить исходный HTML еще до рендеринга. в него вставить ссылку на свой JS в котором переопределяешь одну из оригинальных функций вызов которых можно считать маркером окончания загрузки. в переопределенных функциях вызываешь оригинальную а затем через window.external вызываешь метод контейнера(c#) который и сохранит все что нужно.
Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться