Как зайти в Даркнет?!
25th January, 01:11
6
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
895
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
914
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
906
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4381
0
Помогите пожалуйста решить задачи
24th November, 23:53
6086
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4351
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4396
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
DOM манипуляции в PHP
Я ищу хорошие методы манипулирования HTML в PHP. Например, проблема, с которой я в настоящее время имею дело, - это проблема с деформированным HTML.
Я получаю входные данные, которые выглядят примерно так:
<div>This is some <b>text
Как вы заметили, в HTML отсутствуют закрывающие теги. Я мог бы использовать парсер regex или XML для решения этой проблемы. Тем не менее, вполне вероятно, что в будущем мне придется делать другие манипуляции DOM. Интересно, есть ли какие-нибудь хорошие библиотеки PHP, которые обрабатывают манипуляции DOM подобно тому, как Javascript справляется с манипуляциями DOM.
PHP имеет расширение PECL, которое дает вам доступ к функциям HTML Tidy . Tidy-это довольно мощная библиотека, которая должна быть способна принимать такой код и закрывать теги разумным образом.
Я использую его для очистки искаженных XML и HTML, отправленных мне секретной рекламной системой перед импортом.
Я нашел PHP Simple HTML DOM самой полезной и прямолинейной библиотекой на сегодняшний день. Лучше, чем ПЕКЛ, я бы сказал.
Я написал статью о том, как использовать его, чтобы соскрести даты гастролей MySpace artist (просто пример.) Вот ссылка на php simple html dom parser.
Библиотека DOM, которая теперь встроена, может легко решить эту проблему. Метод loadHTML будет принимать искаженные XML, а метод load-нет.
$d = new DOMDocument;
$d->loadHTML('<div>This is some <b>text');
$d->saveHTML();
На выходе будет:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html>
<body>
<div>This is some <b>text</b></div>
</body>
</html>