Как зайти в Даркнет?!
25th January, 01:11
5
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
893
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
912
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
905
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4381
0
Помогите пожалуйста решить задачи
24th November, 23:53
6086
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4350
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4396
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Что такое хорошая библиотека естественного языка, чтобы использовать для перефразирования?
Я ищу существующую библиотеку для обобщения или перефразирования контента (я нацелен на сообщения в блоге) - есть ли опыт работы с существующими библиотеками обработки естественного языка?
Я открыт для различных языков, поэтому меня больше интересуют способности & точность.
Там шел какой-то разговор о Гроке. Это теперь поддерживается как OpenCCG, и будет повторно реализовано в OpenNLP также.
Вы можете найти OpenCCG по адресу http://openccg.sourceforge.net/ . Я бы также предложил парсер Curran and Clark CCG, доступный здесь: http://svn.ask.it.usyd.edu.au/trac/candc/wiki
В принципе, для перефразирования вам нужно будет написать что-то, что сначала разбирает предложения сообщений в блоге, извлекает семантическое значение этих сообщений, а затем ищет в пространстве слов vocab, которые композиционно создают то же самое семантическое значение, а затем выбирает то, что не соответствует текущему предложению. Это займет много времени, и это может не иметь большого смысла. Не забывайте, что для этого вам понадобится почти идеальное разрешение анафоры и способность улавливать выводы на уровне дискурса.
Если вы просто хотите сделать записи в блоге, которые не содержат идентифицируемого машиной дубликата контента, вы всегда можете просто использовать преобразования темы и фокуса и синонимы WordNet. Безусловно, были сайты, которые заработали деньги на AdWords, которые делали это раньше.
Я думаю, что он хочет генерировать сообщения в блогах, автоматически перефразируя то, что было в блогах, которые эта система отслеживает.
Это было бы действительно интересно, если бы вы могли объединить от 2 до 10 сообщений в блоге, которые похожи, но из разных источников, а затем автоматически сделать перефразированное резюме "real" (размер 1 сообщения в блоге).
Это также может быть отлично подходит для домашних работ. К сожалению, это не так просто сделать.
Единственный способ, который я мог бы увидеть, - это разложить каждое предложение на "meaning", а затем случайным образом изменить структуру предложения и некоторые слова, сохраняя значение.
Эти предложения означают одно и то же:
- Я ненавижу этого парня, он такой тупой.
- Этот парень глуп, я его ненавижу.
- Я презираю этого тупого парня.
- Он тупой, я его ненавижу.
Было бы нетривиально написать программу для преобразования одного из этих предложений в другие, и это простые предложения, реальные предложения из блогов гораздо сложнее.
Ваше попадание в очень далекий домен типа AI. Я проделал обширную работу по преобразованию текста в машинное знание, в основном используя английский язык с контролем попыток (см.: http://attempto.ifi.uzh.ch/site/), это естественный язык (английский), который полностью компьютерно обрабатывается в несколько различных онтологий, таких как OWLDL.
Хотя, похоже, это было бы чересчур...
Есть ли причина для того, чтобы не просто взять первые несколько предложений Вашего сообщения в блоге, а затем добавить эллипс для вашего резюме?
Спасибо за эти ссылки. Похоже, что GROK мертв - но он все еще может работать для моих целей.
Еще 2 ссылки:
Попытка контролировать английский язык-это интересная концепция, поскольку это совершенно обратный взгляд на проблему. Не очень практично для того, что я пытаюсь сделать.
@mmattax что касается предложения взять несколько предложений - я не пытаюсь представить резюме: в противном случае это было бы хорошим решением дзюдо . Я хочу на самом деле обобщить содержание, чтобы использовать его для других целей оценки.