Для облегчения поиска соответствий в строках на языке оригинала и перевода каждое слово и его перевод делятся на слоги. Поскольку мы не имеем никакой информации о структуре языка и правилах слогоделения в этом языке, деление производится по формальным признакам. В порождении правил участвуют только слова, для которых установлено взаимно однозначное соответствие слогов в оригинале и переводе.
Разделение слова на слоги
Термин «слог» в данном контексте употребляется в смысле, отличном от того, в котором он используется в трудах по фонетике. Поэтому необходимо дать его определение. Слог — это непустое множество букв, содержащее один или более символов, обозначающих гласные звуки. Слово делится на слоги по следующим правилам:
деление осуществляется по гласной букве. Граница слога — после гласной;
- 2 и более гласных подряд не разделяются;
- 2 и более согласных не разделяются;
множество элементов, среди которых нет гласной, не выделяется в отдельный слог;
символы начала и конца слова считаются согласными буквами;
(для русского) не отделять «ь» от предыдущей согласной.
Таким образом, слог — это цепочка вида C*V+, где С — буква, обозначающая согласный звук, V — буква, обозначающая гласный звук. Слог может иметь вид C*V+C+ только случае, если это последний слог в слове и заключительное множество согласных не может быть выделено в отдельный слог, так как среди них нет слогообразующего символа.
Полученные таким образом слоги (кроме последнего) формально являются открытыми (то есть, заканчиваются на гласную). Несмотря на это, у слога присутствует параметр открытости/закрытости, определяемый при делении: для каждого слога проверяется количество начальных согласных в следующем слоге и если их больше одной, слог считается закрытым.
Введение
этого параметра связано с тем, что во многих языках он может влиять на правила чтения гласных букв.