Список вопросов
Как зайти в Даркнет?!
25th January, 01:11
6
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
895
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
914
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
905
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4381
0
Помогите пожалуйста решить задачи
24th November, 23:53
6086
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4351
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4396
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Анализ и разбор текста
Просмотров: 438
 
Ответов: 1
Добрый день. Помогите задать правильное направление в исследовании.
Есть задача анализа предложений, то есть перевод их в комманды понятные программе. Например «В первую среду января пойти в магазин» — разобрать что нужно сделать и когда. Буду рад абсолютно любым ссылкам на любые материалы.
В частности, интересуют алгоритмы, которыми можно такое достичь. Понимаю что это очень сложная задача, но текст и предложения будут простыми и с некоторой однотипной структурой, поэтому интересует направление куда следует копать.
Спасибо.
У Apple в Newton'е был такой assistant, небольшой системный сервис, которому пишешь, например, «fax Bob», и он соображал, что нужно взять текущий документ, найти в адресной книге Боба и отправить ему этот документ по факсу. Принцип там был несложный, детали можно найти в Newton Programmer's Reference v2.0, ch. 18, Intelligent Assistant. (PDF можно найти в Google.)
Если будете сами писать, советую присмотреться к такому методу разбора CYK — это универсальный bottom-up метод разбора, начинающий с выделения токенов в строке, и затем сворачивающий их по правилам грамматики. Целиком CYK вам не потребуется, скорее всего, потому что у вас основная проблема как раз в отсутствии грамматики, но основной принцип можно использовать примерно так:
— Разбираете строку на слова
— Классифицируете каждое слово. Например, пусть «ПН» будет порядковый номер, «ДН» — день недели, «М» месяц, "?" — неопредленное слово. Ваша фраза будет "?-ПН-ДН-М-?-?-?".
— Ищете в строке паттерны (собственно, это как раз фаза свертки и получается). В данном случае паттерн «ПН-ДН-М», он у вас будет зарегистрирован для парсера дат. В другой строке у вас будет, например, «В среду по первому кино» — "?-ДН-?-ПН-?". Паттерна «ДН-?-ПН» в датах у вас не будет (вряд ли такая комбинация может обозначать дату), поэтому парсеру дат пойдет только «ДН», а «ПН» либо проигнорует, либо отдаст, например, парсеру телеканалов.
Такой подход удобен тем, что грамматика не нужна, а подходящие паттерны вы можете определить по мере обработки данных. Я как-то писал такой парсер для адресов — неплохо разбирал, грамотно различая, например, разные «St» в «St Patrick St». Хотя и не со стопроцентной точностью, попадались там двусмысленные паттерны.
Чтобы ответить на вопрос вам нужно войти в систему или зарегистрироваться