Forum.iFiction.Ru

iFiction.Ru · ifHub · FAQ · IFWiki · QSP · URQ · INSTEAD · AXMA

форум об interactive fiction, текстовых приключенческих играх и всём таком...

Вы не зашли.

0    0    #1
30.06.2007 10:58

Eten
Участник (+9, -307)
Откуда: Балаково, Санкт-Петербург.
Зарегистрирован: 21.05.2007
Сообщений: 1416
Вебсайт

---

Поднимем тему "О Русском парсере", но в другую сторону и конкретно.

Скажем вместо введения в тему ниже следующие.
Все на форуме, уже раз говорили о построении русского парсера и пока парсеры на ныне сущевствующих платформах еще не могут считаться полноценными, потому как русский язык сложнее и богаче в описаниях действия. Единственное отличия русского языка от европейских то, что к примеру английский язык основывается на контексте, а русский на сути слова, а не его форме (могу ошибаться, но всегда именно это и проглядывается, кто не понял вспомните, кто написал толковый словарь мата на русском языке и почему. Об этом даже анекдот старый был wink  ). Ясное дело, что предложение на парсере начинается по другому, нежели в традиционном варианте. Оно начинается с глагола и связывается с сущевствительным с помощью предлогов и иногда даже наречий, местоимения и так должны занимать свое место. Но если подходить к проблеме еще конкретней, то в русском языке три части речи, а это: сущевствительное, глагол, прилагательное (причем в некторых случаях оно может быть и глаголом); склоняются по падежам, числам ед. и множ., родам, (для глаголов забыл). И плюс ко всему этому каламбуру сущ. и глаголы имеют приставки, суффиксы, а это уже словообразование.
Получается из выше перечисленного возникает три делемы:

  • нужно ли опираться полностью на грамматику языка или использвать уже перенятые традиции парсеров?
  • до какой степени учитывать словообразование и образование словосочетаний?
  • и стоит ли при такой конкретике создавать определенную базу слов русского языка, банк знаний своего рода или бибилиотека?

З.Ы.
Разворачивание этой темы, вставки с приведением грамматики русского языка, может помочь не только мне, но и тем кто хочет написать игру самостоятельно с применением парсера. А с другой стороны вместо того, чтобы говорить вокруг да около лучше бы проанализировали (кто в парсерах хорошо разбирается) и выложили бы свои знания об этом, т.к. без свободного обмена у нас не получится создать хотя бы систему и стандарты для русского парсера и останемся так и дальше довольствоваться самоделками tongue. Это своего рода дружеский пинок с разворотом в другую грань темы.

Неактивен

0    0    #2
02.07.2007 00:06

uux
Участник (+884, -80)
Откуда: Москва
Зарегистрирован: 02.12.2006
Сообщений: 1624

Re: Поднимем тему "О Русском парсере", но в другую сторону и конкретно.

Eten написал:

как ты, в основном, используешь  глагол (как ИГРОК) больше "Класть" или "Положить"? Покласть партбилет на стол или, таки,  положить его?  Если тебе так необходимо "класть деньгу в банк ",  то никто тебе не мешает создать в ТАДС новый глагол : класть, помещать, вкладывать, пристраивать и т.д.  Если "выкласть печку"  то, ради бога, - привяжи к "построить, выстроить, сделать .и т.д .. " В чем проблема?

Ды к вот-с, положить книгу на стол - это нормальное словосояетание, а ложить книгу на стол - полная безгамотность (без всякого там Ожегова)

О, блин! Да у нас пол-района так говорит! (А как говорит вторая половина, и воспроизвести-то страшно;)).

Eten написал:

Ясный пень, что писать в ТАДС граммотный парсер, то же самое что научить обезъяну ехать (получится, но каковы последствия, о-о-о-о...даже говорить не стану). И еще в ТАДС такую безграмостность, как применение не допустимых окончаний к слову "класть" самая норма вещей (прошу не обижаться всех кто почитает ТАДС, в качестве Идола).

Мне вот это совсем не ясный пень. Да, в TADS надо ручками довольно солидно поработать, чтобы задать достаточное количество синонимов для команд, встречающихся в игре, и не напортачить с грамматикой, но, во-первых, львиная доля работы уже проделана ГрАндом (и вполне себе грамотно, между прочим), а во-вторых, намек про последствия вообще, честно говоря, непонятен. А насчет распознавания "ложить"... Все-таки ИЛ - это игра, а не обучающая русскому языку программа. Поэтому, если парсер, наряду со всеми возможными грамотными сочетаниями, воспринимает еще и некоторую часть неграмотных, это можно записать ему только в плюс. ИМХО, конечно (хотя многие игроки, уверен, со мною согласятся).

"Применение недопустимых окончаний к слову класть" в (R)TADS - это не "самая норма вещей", а исключительно желание/нежелание автора: какие синонимы для глагола (и других объектов) автор сочтет нужным прописать, те и будут распознаваться. Захочет "ложить" - будет "ложить", не захочет - не будет. Говорю Вам это без всякого идолопоклонничества.

Что касается реализации в парсере всего богатства русского языка... По-моему, уважаемый Eten, Вы что-то путаете. В своей основе парсер не должен блистать литературными изысками, его задача - максимально правильно воспринять команду игрока. Стандартом де-факто в ИЛ (не только в русской) стал парсер, воспринимающий следующие форматы команды: (a) глагол без всего (напр., "ждать"); (b) глагол + объект ("взять кирпич"); (c) глагол + объект (+ предлог) + объект ("надеть кольцо на палец", "ударить тролля мечом"). Связано это еще, помимо прочего, и с удобством для игрока (все-таки более-менее короткие команды набирать в общем случае проще и удобнее, чем "навороченные", особенно, если это приходится делать многократно). И (R)TADS, и Inform заточены именно под такой формат команд, и дело свое, надо сказать, знают туго. Конечно, можно посетовать на то, что такой формат общения слишком ограничен, однако, смею Вас заверить, задача полнотекстового распознавания ввода игрока (в смысле, распознавание всех возможных языковых конструкций, или хотя бы более-менее обширного подмножества их) не решена в рамках ИЛ ни для одного языка. Более того, вроде бы никто решать ее и не собирается, поскольку это просто никому не нужно, по крайней мере, на данном этапе. Это тем более касается русского языка: нам бы дай Бог набрать критическую массу игр, использующих на всю катушку возможности современных парсеров...

Если Вы, уважаемый Eten, запустили эту ветку обсуждения в прикладных целях - понять, что именно нужно реализовать в STK - то вот Вам мой совет: начните хотя бы с базовой функциональности, описанной выше. А потом уже задумывайтесь о "кренделях небесных".

Неактивен

0    0    #3
02.07.2007 03:15

uux
Участник (+884, -80)
Откуда: Москва
Зарегистрирован: 02.12.2006
Сообщений: 1624

Re: Поднимем тему "О Русском парсере", но в другую сторону и конкретно.

Sus_scrofa написал:

Насчет красочности - тут действительно все субъективно. В русском языке богато словообразование, зато в английском самих слов в несколько раз больше...

На самом деле, язык сильнее всего развивается в тех областях, в которых наиболее преуспел народ-носитель.

В частности, русский действительно непревзойден по количеству необычайно ярких и образных синонимов, описывающих процесс принятия внутрь крепких алкогольных напитков, а также драку;).

Неактивен

Powered by PunBB
© copyright 2001–2024 iFiction.Ru