Байт-код «Цифор» для любого языка из номера основы слова и номера грамматической формы

расскажет о необычном проекте Дмитрий Тюрин, путешественник

Машины мыслят идентификаторами, и построение интерфейса человек-машина требует перенумеровать слова. При этом негоже загромождать поток идентификаторов свойствами самого языка, куда логичнее свойства вынести в системные таблицы операционной системы.

Так образование словоформы в общем случае состоит в придании основе предлога, префикса, трансфикса, постфикса, послелога, катализатора (могущего стоять в любой части предложения) – «зубцов». Их комбинаций около тысячи в каждом языке. Изолирующие, аналитические и синтетические языки отличаются только тем, какие зубцы есть в комбинации.

В зависимости от того, между какими соседними зубцами главного слова (в какой «лакуне») стоит основа зависимого, и в каком порядке идут зубцы главного и зависимого слов, получаем языки инкорпорирующие и неинкорпорирующие, с левым или с правым ветвлением.

Грамматические категории (а вместе с ними и граммемы) могут быть категориальным аппаратом, с помощью которого мы описываем окружающий мир, а могут быть приписаны частям речи чисто формально и копироваться на зависимое или главное слово, указывая связь слов в предложении – последним не место в перенумеровываемых комбинациях.

Эти и многие другие вопросы (группировку взаимозаменяемых супплетивов и субморфов, унификацию «склонение числительного vs. существительного», форму Бэкуса-Наура для клаузы и т.п.) мы и рассмотрим в докладе.