Как работают механизмы обнаружения контента, такие как Zemanta и Open Calais?

Мне было интересно, как семантический сервис, такой как Open Calais, вычисляет названия компаний или людей, технологические концепции, ключевые слова и т. д. из отрывка текста. Это потому, что у них есть большая база данных, с которой они сопоставляют текст?

Как такая служба, как Zemanta, может знать, какие изображения предложить, например, фрагменту текста?

python   ruby   semantics   zemanta    

408   3   18:24, 26th August, 2020


Параметры ffmpeg?

Здравствуйте.


Конвертирую видео в flv через ffmpeg.


Пытаюсь подобрать параметры максимально близкие к тем, которые используюся вконтакте(отчасти уже чисто спортивный и образовательный процесс).


Сейчас жму с помощью параметров

ffmpeg.exe -i input.avi -threads 24 -vcodec libx264 -b 450k -bt 450k -ab 128k -ar 44100 -ac 2 -vol 256 -skip_frame none -coder 0 -async 1 -flags +loop+mv4 -maxrate 10000 -bufsize 10000 -me_method tesa -nr 0 -wpredp 0 -g 250 -qcomp 0.60 -qmin 10 -qmax 50 -bf 16 -sc_threshold 40 -qdiff 4 -keyint_min 25 -deblockalpha 0 -deblockbeta 0 -b_strategy 2 -coder 1 -cmp chroma -me_range 24 -flags2 +wpred+dct8x8+mixed_refs+mbtree -trellis 0 -partitions +parti8x8+parti4x4+partp8x8+partb8x8 -i_qfactor 1.41 -psnr -y output.mp4



Mediainfo по моему файлу выводит вот такие данные:
Encoding settings : cabac=1 / ref=1 / deblock=1:0:0 / analyse=0x3:0x113 / me=tesa / subme=8 / psy=1 / psy_rd=1.00:0.00 / mixed_ref=0 / me_range=24 / chroma_me=1 / trellis=0 / 8x8dct=1 / cqm=0 / deadzone=21,11 / fast_pskip=1 / chroma_qp_offset=-2 / threads=24 / sliced_threads=0 / nr=0 / decimate=1 / interlaced=0 / constrained_intra=0 / bframes=16 / b_pyramid=0 / b_adapt=2 / b_bias=0 / direct=2 / weightb=1 / open_gop=0 / weightp=0 / keyint=250 / keyint_min=25 / scenecut=40 / intra_refresh=0 / rc_lookahead=40 / rc=cbr / mbtree=1 / bitrate=450 / ratetol=1.0 / qcomp=0.60 / qpmin=10 / qpmax=50 / qpstep=4 / vbv_maxrate=450 / vbv_bufsize=18 / ip_ratio=0.71 / aq=1:1.00 / nal_hrd=none



Но когда начинаю сравнивать данные видеофайла полученные с помощью программы mediainfo никак не могу понять:

1. Для аудио выдает битрейт Bit rate: 153 Kbps, но я же четко прописал -ab 128k

2. Как изменить параметры:

— cabac

— bframes

— ratetol

— ip_ratio (несмотря на то, что в ффмпег прописано ip_ratio=0.71 в конечно файле все-равно выходит

— i_qfactor 1.41)


И интересуют насколько данные параметры могут повлиять на конечное качество/размер файла?


Спасибо

FFmpeg    

323   1   18:24, 26th August, 2020


Разработка календарной системы наподобие Google Calendar

Мне нужно создать что-то похожее на Google Календарь, поэтому я создал таблицу событий, которая содержит все события для пользователя.

Самое сложное-это обработка повторных событий, строка в таблице событий имеет поле event_type, которое говорит вам, что это за событие, так как событие может быть только для одной даты, OR повторное событие каждые x дней.

Основная задача проектирования-это обработка повторных событий.

Когда пользователь просматривает календарь, используя представление месяца, как я могу отобразить все события за данный месяц? Запрос будет сложным, поэтому я подумал, что будет проще создать другую таблицу и создать строку для каждого события, включая повторные события.

А вы, ребята, что думаете?

algorithm   calendar    

550   16   17:53, 26th August, 2020


Продолжит ли развитие Google App Inventor?

Всем привет.

Хотел бы поинтересоваться вашим мнением относительно App Inventor. У Google есть почившие проекты, загнётся ли этот? Мне, как не программисту, но человеку, имеющему что сделать под Android, проект интересен. Стоит ли покопаться в нём или же пытаться разбираться в Java и Android SDK?

Спасибо.

Google   Android    

310   1   17:52, 26th August, 2020


Динамическая Алфавитная Навигация

Я использую ColdFusion , чтобы вернуть результирующий набор из базы данных SQL и превратить его в список.

Мне нужен какой-то способ создать алфавитную навигационную панель для этого списка. У меня есть библиотека ColdFusion и jQuery.

Я ищу, чтобы создать что-то вроде этого:

A | B | C | ...      
- A
- A
- B
- B
- B
- C
- D

Где нажатие на одну из букв опускает вас вниз по странице до первого элемента для этой буквы. Не все 26 букв алфавита обязательно используются.

javascript   jquery   sql   html   coldfusion    

535   4   17:51, 26th August, 2020


Тактика использования PHP на высоконагруженном сайте

Прежде чем вы ответите на этот вопрос, я никогда не разрабатывал ничего достаточно популярного, чтобы достичь высоких нагрузок на сервер. Относитесь ко мне как к инопланетянину, который только что приземлился на планету, хотя и знает PHP и несколько методов оптимизации.


Я разрабатываю инструмент в PHP , который может охватить довольно много пользователей, если он работает правильно. Однако, хотя я полностью способен разрабатывать программу, я в значительной степени невежествен, когда речь заходит о создании чего-то, что может справиться с огромным трафиком. Поэтому вот несколько вопросов по этому вопросу (не стесняйтесь превратить этот вопрос в поток ресурсов).

База данных

На данный момент я планирую использовать функции MySQLi в PHP5. Однако как я должен настроить базы данных в отношении пользователей и контента? Действительно ли мне нужно несколько баз данных? На данный момент все перемешано в одной базе данных - хотя я рассматривал возможность распространения пользовательских данных в одну, фактического контента в другую и, наконец, основного контента сайта (мастера шаблонов и т. д.) до другого. Я рассуждаю так: отправка запросов в разные базы данных облегчит нагрузку на них, поскольку одна база данных = 3 источника нагрузки. Кроме того, было бы это все еще эффективно, если бы они все были на одном сервере?

Кэширование

У меня есть система шаблонов, которая используется для построения страниц и замены переменных. Основные шаблоны хранятся в базе данных, и каждый раз при вызове шаблона вызывается его кэшированная копия (документ html). На данный момент у меня есть два типа переменных в этих шаблонах - статический var и динамический var. Статические VAR-это обычно такие вещи, как названия страниц, название сайта - вещи, которые не часто меняются; динамические VAR-это вещи, которые меняются при каждой загрузке страницы.

Мой вопрос по этому поводу:

Скажем, у меня есть комментарии к разным статьям. Что является лучшим решением: хранить простой шаблон комментария и отображать комментарии (из вызова DB) каждый раз, когда страница загружается или хранить кэшированную копию страницы комментариев как страницу html - каждый раз, когда комментарий является added/edited/deleted, страница повторно кэшируется.

Окончательно

Есть ли у кого-нибудь советы/указатели для запуска высоконагруженного сайта на PHP. Я почти уверен, что это рабочий язык для использования - Facebook и Yahoo! дайте ему большое преимущество - но есть ли какие-то переживания, которые я должен остерегаться?

php   performance   high-load    

571   23   17:49, 26th August, 2020


Вам приходил спам "Is me Judy from (habrahabr.ru)"?

Пару минут назад пришел спам со странным названием — Is me Judy from (habrahabr.ru). В самом письме текст на английском и корявый перевод на русский. Письмо о том как оно меня нашло на хабре и страстно ждет ответа. В конце письма фотокарточка не особо симпатичной афро-американки.

Кому-нибуть такие письма приходили?? Что оно таки хочет, в смысле что оно продает/предлагает??

Борьба   со   спамом    

349   6   17:39, 26th August, 2020


Редирект в зависимости от User Agent средствами Apache

Здравствуйте,

скажите, пожалуйста, есть ли возможность в конфиге виртуального-хоста проверить наличие в user agent слов iphone, ipod, ipad и если да, то перекинуть его на другой домен?

iPhone   Apache    

282   3   17:39, 26th August, 2020


Синхронизация браузера на многих компьютерах

Все помнят Google browser sync правильно? Я думал, что это было здорово. К сожалению, Google решил не обновлять сервис до Firefox 3.0. Mozilla разрабатывает замену для Google browser sync, которая будет частью проекта Weave. Я пробовал использовать Weave и обнаружил, что он очень медленный или полностью неоперабельный. Конечно, они находятся на ранней стадии развития прямо сейчас, поэтому я не могу жаловаться.

Эта конкретная проблема синхронизации браузера заставила меня задуматься. Что вы все думаете о Mozilla или о ком-то, кто делает пакет сервера/клиента, который мы, пользователи, могли бы запустить на вашей машине 'main'? Теперь вам просто нужно знать свой собственный IP или иметь какой-то способ объявить об этом вашим клиентским браузерам на работе или где-то еще.

Есть несколько проблем, которые я могу придумать с этим: нестатический IPs, открытие портов на вашем локальном компьютере и т. д. Просто кажется, что Mozilla не хочет обрабатывать этот трафик, созданный многими людьми, синхронизирующими свои браузеры. Для них нет способа монетизировать этот трафик, так как все загруженные данные должны быть зашифрованы.

firefox   browser   synchronization    

382   4   17:37, 26th August, 2020


Порекомендуйте SSD под систему

Хочется ускорить работу системы, поэтому прошу порекомендовать SSD под системный диск, ось Windows 7. Интересуют как советы о конкретных моделях, так и общая статистика о производителях, спасибо.

Твердотельные   накопители    

337   7   16:48, 26th August, 2020