Сведения о вопросе

Pytdev

04:40, 15th August, 2020

Как сохранить HTML-страницу сгенерированную на JavaScript?

Просмотров: 443 Ответов: 5

Встречаются страницы, на которых есть динамические части получаемые Ajax или попросту какими-то функция Javascript (например, шаблонизаторами).
Так вот как сохранить скомпилированную страницу, т.е. со всеми выполненными js-функциями? В случае с Ajax скачивание может происходить через некоторое время после загрузки DOM-модели.
Решение желательно на ЯВУ (лучше C#) или через консоль Windows/Linux.
Например, нужно скачать вот эту forexite: Календарь на неделю.

Сведения об ответе

+-*/

22:23, 12th August, 2020

Самый хакерский вариант — вбить javascript:alert(document.documentElement.innerHTML); в браузере… потом Ctrl+A ;)

а для сервера есть htmlunit.sourceforge.net/

Сведения об ответе

JUST___

03:57, 20th August, 2020

Загляните в этот топик, есть несколько ссылок по теме.
habrahabr.ru/blogs/webdev/87705/

Для явы смотрите в эту сторону: download.oracle.com/javase/6/docs/technotes/guides/scripting/programmer_guide/index.html

Сведения об ответе

screen

00:25, 4th August, 2020

У меня тот же вопрос, но для анализа результатов выдачи Google.
Если дело в ajax и только — можно отсылать доп. запрос, и в респонсе получать сгенеренный
html…

P. S. догадываюсь, что на вопрос не ответил, но эта тема мне тоже интересна и я надеюсь, что на нее кто-то ответит поподробней.

Сведения об ответе

pumpa

19:12, 8th August, 2020

Уточните вопрос: вам html сгенерённый нужно посмотреть или чтобы вот прям сохранить можно было на диск?

Если просто посмотреть, то в FF поможет выделение всей страницы с помощью Ctrl+A и далее в контекстном меню view Selection Source или можно даже установить WebDeveloper экстеншн, у него есть View Generated Source

Сведения об ответе

DO__IT

23:30, 14th August, 2020

на c#?
положи webBrowser на форму, прицепись на всякие обработчики загрузки, и выжидай пока не пройдет некоторое время с момента последнего срабатывания обработчиков загрузки. потом вытягивай innerHTML из document и сохраняй.

точнее не скажу, сейчас под рукой негде экспериментировать. знаю что ничего сложного в доступе к DOM через него нет, да и со слеением за процессами загрузки тоже проблем не было.

как вариант, если точно знаешь структуру сайта который будешь грабить можно подменить исходный HTML еще до рендеринга. в него вставить ссылку на свой JS в котором переопределяешь одну из оригинальных функций вызов которых можно считать маркером окончания загрузки. в переопределенных функциях вызываешь оригинальную а затем через window.external вызываешь метод контейнера(c#) который и сохранит все что нужно.

Сведения о вопросе

Pytdev

04:40, 15th August, 2020

Теги

Как сохранить HTML-страницу сгенерированную на JavaScript?

Сведения об ответе

+-*/

22:23, 12th August, 2020

Самый хакерский вариант — вбить javascript:alert(document.documentElement.innerHTML); в браузере… потом Ctrl+A ;)

а для сервера есть htmlunit.sourceforge.net/

Сведения об ответе

JUST___

03:57, 20th August, 2020

Загляните в этот топик, есть несколько ссылок по теме.
habrahabr.ru/blogs/webdev/87705/

Для явы смотрите в эту сторону: download.oracle.com/javase/6/docs/technotes/guides/scripting/programmer_guide/index.html

Сведения об ответе

screen

00:25, 4th August, 2020

Сведения об ответе

pumpa

19:12, 8th August, 2020

Сведения об ответе

DO__IT

23:30, 14th August, 2020

Ответить на вопрос

Как зайти в Даркнет?! 25th January, 01:11 188 0

Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam 21st March, 17:43 1160 0

Очень долго работает Update запрос Oracle 27th January, 09:58 1068 0

не могу запустить сервер на tomcat HTTP Status 404 – Not Found 21st January, 18:02 1043 0

Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе? 2nd December, 09:48 1085 0

Разработка мобильной кроссплатформенной военной игры 16th July, 17:57 1881 0

период по дням 25th October, 10:44 4099 0

Пишу скрипты для BAS только на запросах 16th September, 02:42 3863 0

Некорректный скрипт для закрытия блока 14th April, 18:33 4791 0

прокидывать exception в блоках try-catch JAVA 11th March, 21:11 4527 0

Помогите пожалуйста решить задачи 24th November, 23:53 6284 0

Не понимаю почему не открывается детальное описание продукта 11th November, 11:51 4491 0

Нужно решить задачу по программированию на массивы 27th October, 18:01 4577 0

Метода Крамера С++ 23rd October, 11:55 4475 0

помогите решить задачу на C++ 22nd October, 17:31 4145 0

Помогите решить задачу на python с codeforces 22nd October, 11:11 4619 0

Python с нуля: полное руководство для начинающих 18th June, 13:58 2743 0

Все вопросы

Сведения о вопросе

Pytdev

04:40, 15th August, 2020

Теги

Как сохранить HTML-страницу сгенерированную на JavaScript?

Сведения об ответе

+-*/

22:23, 12th August, 2020

Самый хакерский вариант — вбить javascript:alert(document.documentElement.innerHTML); в браузере… потом Ctrl+A ;) а для сервера есть htmlunit.sourceforge.net/

Сведения об ответе

JUST___

03:57, 20th August, 2020

Загляните в этот топик, есть несколько ссылок по теме. habrahabr.ru/blogs/webdev/87705/ Для явы смотрите в эту сторону: download.oracle.com/javase/6/docs/technotes/guides/scripting/programmer_guide/index.html

Сведения об ответе

screen

00:25, 4th August, 2020

Сведения об ответе

pumpa

19:12, 8th August, 2020

Сведения об ответе

DO__IT

23:30, 14th August, 2020

Ответить на вопрос

Как зайти в Даркнет?!

25th January, 01:11

188

0

Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam

21st March, 17:43

1160

0

Очень долго работает Update запрос Oracle

27th January, 09:58

1068

0

не могу запустить сервер на tomcat HTTP Status 404 – Not Found

21st January, 18:02

1043

0

Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?

2nd December, 09:48

1085

0

Разработка мобильной кроссплатформенной военной игры

16th July, 17:57

1881

0

период по дням

25th October, 10:44

4099

0

Пишу скрипты для BAS только на запросах

16th September, 02:42

3863

0

Некорректный скрипт для закрытия блока

14th April, 18:33

4791

0

прокидывать exception в блоках try-catch JAVA

11th March, 21:11

4527

0

Помогите пожалуйста решить задачи

24th November, 23:53

6284

0

Не понимаю почему не открывается детальное описание продукта

11th November, 11:51

4491

0

Нужно решить задачу по программированию на массивы

27th October, 18:01

4577

0

Метода Крамера С++

23rd October, 11:55

4475

0

помогите решить задачу на C++

22nd October, 17:31

4145

0

Помогите решить задачу на python с codeforces

22nd October, 11:11

4619

0

Python с нуля: полное руководство для начинающих

18th June, 13:58

2743

0

Самый хакерский вариант — вбить javascript:alert(document.documentElement.innerHTML); в браузере… потом Ctrl+A ;)

а для сервера есть htmlunit.sourceforge.net/

Загляните в этот топик, есть несколько ссылок по теме.
habrahabr.ru/blogs/webdev/87705/

Для явы смотрите в эту сторону: download.oracle.com/javase/6/docs/technotes/guides/scripting/programmer_guide/index.html