Список вопросов
Как зайти в Даркнет?!
25th January, 01:11
8
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
898
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
951
0
Очень долго работает Update запрос Oracle
27th January, 09:58
916
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
907
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
941
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1726
0
период по дням
25th October, 10:44
3957
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3722
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4614
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4382
0
Помогите пожалуйста решить задачи
24th November, 23:53
6087
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4352
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4398
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Почему хабрахабр блокирует запросы по RSS основываясь на user-agent информации?
Просмотров: 360
 
Ответов: 1
В качестве агрегатора RSS новостей использую akregator, но уже около полугода не удаётся получить ленту. Легко удостовериться, что во всём виноват User-Agent:
$ wget -U "Akregator/1.6.5; syndication" <a href="http://habrahabr.ru/rss/">habrahabr.ru/rss/</a><br/>
--2010-09-15 17:52:52-- <a href="http://habrahabr.ru/rss/">habrahabr.ru/rss/</a><br/>
Resolving habrahabr.ru... 212.158.166.234<br/>
Connecting to habrahabr.ru|212.158.166.234|:80... connected.<br/>
HTTP request sent, awaiting response... ^C<br/>
<br/>
$ wget <a href="http://habrahabr.ru/rss/">habrahabr.ru/rss/</a><br/>
--2010-09-15 17:53:06-- <a href="http://habrahabr.ru/rss/">habrahabr.ru/rss/</a><br/>
Resolving habrahabr.ru... 212.158.166.234<br/>
Connecting to habrahabr.ru|212.158.166.234|:80... connected.<br/>
HTTP request sent, awaiting response... 200 OK<br/>
Length: unspecified [text/xml]<br/>
Saving to: `index.html'<br/>
<br/>
[ <=> ] 38,878 71.1K/s in 0.5s <br/>
<br/>
2010-09-15 17:53:07 (71.1 KB/s) - `index.html' saved [38878]
PS в первом случае — таймаут
$ wget -U "Akregator/1.6.5; syndication" <a href="http://habrahabr.ru/rss/">habrahabr.ru/rss/</a><br/>
--2010-09-15 17:52:52-- <a href="http://habrahabr.ru/rss/">habrahabr.ru/rss/</a><br/>
Resolving habrahabr.ru... 212.158.166.234<br/>
Connecting to habrahabr.ru|212.158.166.234|:80... connected.<br/>
HTTP request sent, awaiting response... ^C<br/>
<br/>
$ wget <a href="http://habrahabr.ru/rss/">habrahabr.ru/rss/</a><br/>
--2010-09-15 17:53:06-- <a href="http://habrahabr.ru/rss/">habrahabr.ru/rss/</a><br/>
Resolving habrahabr.ru... 212.158.166.234<br/>
Connecting to habrahabr.ru|212.158.166.234|:80... connected.<br/>
HTTP request sent, awaiting response... 200 OK<br/>
Length: unspecified [text/xml]<br/>
Saving to: `index.html'<br/>
<br/>
[ <=> ] 38,878 71.1K/s in 0.5s <br/>
<br/>
2010-09-15 17:53:07 (71.1 KB/s) - `index.html' saved [38878]
Видимо, кто-то активно флудил сайт с юзерагентом, содержащим слово akregator
И блокируются не только запросы к rss, а целиком все на сервер, видимо. Да и не блокируются, а просто тормозятся, видимо — у меня начало качаться со скоростью 5 байт в секунду :)
Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться