Диалог с компьютером.
Фоносемантический анализ текста.
Различные оттенки значения слова компьютер постепенно осваивает. Но этого мало. Для овладения языком нужно переходить к тексту. Нужно-то нужно, да только переход весьма и весьма не прост. Текст — не сумма значений слов, а принципиально новый семантический уровень. В текстах почти любое слово может изменять свое, казалось бы, вполне определенное значение самым невероятным образом. Невесть откуда появляются новые оттенки смысла, изменяются понятийные ядра слов, как угодно могут преобразовываться качественные ореолы. И только фоносемантика остается более или менее устойчивой, да и то с ней могут приключиться разные неожиданности.
Вот к примеру, метаморфозы яблочка:
— Съешь-ка яблочко. В этой фразе яблочко — действительно фрукт, яблоко.
— Молодец — прямо в яблочко! Но это уже не фрукт, а мишень.
— Запевай «Яблочко»! Это уже песня.
— Ах ты! Ну прямо яблочки! А это что? Кто его знает. Только ситуация подскажет, что это, может быть, раскрасневшиеся щечки.
Слово в тексте живет, пульсирует, высвечивает разные свои грани, меняет и характер, и лицо, и платье. Как угнаться компьютеру за этими прыжками понятийного ядра и качественного ореола, как постичь этот калейдоскоп перемен, как разгадать тайну формирования вполне определенного смысла текста из неопределенных, изменчивых смыслов слов?
Вопросы есть, ответов пока нет. Относительно компьютерного анализа, а тем более имитации семантики текста высказываются лишь самые общие соображения, далекие еще от практической реализации.
Но с фоносемантикой опять получилось легче всего. Оказалось, что достаточно длинные отрезки текста могут обладать единым фоносемантическим рисунком, который поддается компьютерному анализу.
Как можно было убедиться на примерах анализа звуковой содержательности слов, фоносемантика создает дополнительные возможности для повышения эмоциональной насыщенности, выразительности, образности слов. Не всем типам текстов в одинаковой мере нужно к этому стремиться. Ясно, что эффективнее всего такое свойство фоносемантики может быть использовано в художественной, а особенно в поэтической речи.
Поэт и сознательно и подсознательно (а может, сверхсознательно?) стремится использовать все средства, все ресурсы языка для того, чтобы как можно глубже воздействовать на восприятие читателя, особенно на его чувства, эмоции, подсознание. И содержательность языковой формы предоставляет для этого прекрасные возможности. Поэтому форма стихотворной речи особенно отточена и все ее аспекты глубоко содержательны — ритмика, рифмы, синтаксическое строение, даже графическая форма стиха своеобразна и значима. И конечно, мелодика звучания — само дыхание, душа стиха. Если уж в слове звуки оказались не просто упаковкой значения, но важной его составной частью, то в стихе и подавно. Недаром говорят, что стихи — это музыка речи. А в музыке только и есть что содержательность звучания.
Не в одной поэзии играет свою роль фоносемантика. Воздейственность речи важна для ораторского искусства, для публицистики, часто необходима и в специальных видах речи (например, в юридической практике), да и обычная разговорная речь имеет целью постоянное воздействие на слушателя. Но все же в поэзии все выразительные возможности языка проявляются особенно полно, поэтому поэтическая речь — лучший материал для анализа фоносемантической организации текста.
Разумеется, тот метод, который разработан для вычисления суммарных оценок фоносемантики отдельных слов, теперь уже не годится — и «слова» стали слишком длинные (целые тексты), и закономерности взаимодействия звуков в тексте несколько иные, чем в слове. Пришлось искать новую систему расчетов и примерять полученные результаты на новые манекены.
Набор шкал, который использовался для характеристики фоносемантических ореолов слов, тоже не совсем подходит для описания звуковой содержательности поэтических текстов. Шкалы типа «гладкое — шершавое», «длинное — короткое» или «округлое — угловатое» слишком предметны, прозаичны. Более подходящи признаки экспрессивно-оценочного характера: «нежное — грубое», «радостное — печальное» и т. п. Отобранные шкалы для удобства можно расщепить на половинки, чтобы компьютер оперировал не парой антонимов, а отдельными признаками. Из стилистических соображений (все-таки анализируется поэзия!) некоторые из признаков можно заменить более «художественными» синонимами. Например, признак «красивое» заменить на синоним «прекрасное»; «величественное» на «возвышенное» и т. д.
В результате сформировался такой лексикон компьютера:
прекрасное бодрое печальное
светлое яркое темное
нежное сильное тоскливое
радостное стремительное угрюмое
возвышенное минорное устрашающее
Словарь машины, прямо скажем, небогат. Но следует учесть одно очень важное обстоятельство. В поэзии, как и вообще в языке, главными являются основные аспекты семантики — понятийный и качественно-признаковый. Фоносемантика, хотя и играет в поэтической речи очень существенную роль, все же остается подсобным семантическим аспектом и ни в какое сравнение не идет с богатством и разнообразием содержания, выражаемым основными аспектами языкового значения. Она создает лишь общий фоновый тон, поддерживающий, обогащающий основной художественный смысл текста. Так что 15 признаков компьютерного лексикона в их разнообразных сочетаниях вполне опишут общий фоносемантический тон текста.
Основную роль в создании фоносемантического рисунка стихотворения играет частота звуков (точнее, звукобукв) в данном тексте. Поэт подсознательно нагнетает в стихотворении те звуки, содержательность которых ему нужна, он усиливает, обогащает фоносемантикой образы, впечатления и чувства, выраженные основной семантикой текста. И напротив, он избегает звуков с неподходящей в данном случае содержательностью, снижает их частоту.
Несколько неожиданным оказалось то, что ударные звуки в новой системе расчетов не играют особенно существенной роли: увеличение их веса мало что прибавляет к полученным результатам. Пожалуй, это объяснимо — звуков стало больше, и ударные «потерялись» в общей сумме, да и основной фоносемантический рисунок стиха ведут согласные, а не гласные. Видимо, ударение особенно важно для выстраивания ритма, а не фоносемантики.
Против ожидания не понадобилось как-то выделять и звуки рифм. Во-первых, трудно решить, какие звуки в рифмах следует подчеркивать. Ведь не всегда же бывает, как в стихотворении Д. Минаева «В Финляндии»:
Область рифм — моя стихия, И легко пишу стихи я; Без раздумья, без отстрочки Я бегу к строке от строчки, Даже к финским скалам бурным Обращаясь с каламбуром.Ну, если «розы — морозы» или «бежать — лежать», то тут тоже все ясно. Но как быть, когда как у В. Маяковского:
Где найдешь, на какой тариф, рифмы, чтоб враз убивали, нацелясь? Может, пяток небывалых рифм только и остался что в Венецуэле.А сейчас в ходу вообще весьма вольная рифма, где возникает не точное эхо, а лишь некий отзвук. Например, у А. Вознесенского:
В аду в сковородки долдонят и вышлют к воротам патруль, когда на предельном спидометре ты куришь, отбросивши руль.Во-вторых, только представьте себе, как осложнится ввод текста в компьютер, сколько будет мороки. А выигрыш все равно невелик. Нет, пусть лучше какие-то несущественные нюансы фоносемантики будут потеряны, зато ввод текста сохранится в самом обычном печатном виде. Даже в более привычном, чем ввод слов: там нужно было ударение указывать, а здесь просто печатный текст. Когда у компьютеров будут хорошо работать читающие устройства, с которыми сейчас много экспериментируют, то вообще ничего не нужно будет вводить, компьютер сам прочитает любой печатный материал.
Анализируется текст по-прежнему в звукобуквенной форме, то есть компьютер сам определяет мягкость и твердость согласных, а в остальном ориентируется на буквы.
Как-то под влиянием критиков, считавших почему-то, что для стихов важно только звучание, а написание вообще ни при чем, мы затранскрибировали несколько стихотворений (то есть записали их не буквами, а значками, изображающими звучание), затем закодировали транскрипцию цифрами (ведь знаков фонетической транскрипции нет на клавиатуре компьютеров), переделали программу под новый ввод информации, переделали таблицы оценок и частот звуков и после стольких мучений просчитали тексты «по звучанию». Но наши труды и муки оказались напрасными — результаты практически не изменились. Единственное утешение: «нулевой» результат в данном случае можно рассматривать как доказательство того, что для стихотворения важно как звучание, так и написание.

Общая схема разработанной системы автоматического анализа фоносемантики текста сводится в основном к следующему.
В памяти компьютера имеются таблицы оценок звукобукв по 15 признакам лексикона и нормальных частотностей (частостей, вероятностей) звукобукв в обычной разговорной речи. Обе таблицы несколько отличаются от тех, которые использовались в работе со словами. Таблица оценок выполнена так, что в ней указаны не сами средние оценки звукобукв по шкалам, а отклонения оценок от центра шкал (от 3,0) в положительную (левую) и отрицательную (правую) стороны шкал. В таблице нормальных частотностей не выделяются ударные гласные.
Компьютер определяет мягкость согласных и вычисляет частотности всех звукобукв в данном тексте. Затем полученные частотности сравниваются с нормальными. Все существенные (статически значимые) отклонения частотностей от нормы фиксируются, и дальнейшая работа идет только с ними.
Это очень важная операция, поэтому она требует пояснений.
Фоносемантический рисунок текста создается именно теми звуками, частотность которых резко отклоняется от нормы. Пока звук встречается в тексте стихотворения не чаще, чем обычно, он не останавливает на себе внимания. Но резкое превышение частотности подчеркивает данный звук, делает его заметным, выделенным. Его фоносемантика как бы вспыхивает и окрашивает собой звуковую содержательность текста. Если же звук необычно редко попадается в анализируемом тексте, его содержательность гаснет, и тем самым еще более высвечивается фоносемантика высокочастотных звуков.
Следующую, самую важную операцию можно назвать семантизацией отклонений. Здесь происходит вот что. Для звуков, отобранных по статистически значимым отклонениям частотностей от нормы, выбираются из таблицы оценки фоносемантики. Но как мы помним, эти оценки представлены в виде их отклонений от центра шкал. Если теперь сопоставить отклонения звуков по частотности от нормы и отклонения их же оценок от центра шкал, то возможны следующие ситуации. Допустим, что звук встречается в тексте стихотворения гораздо чаще, чем ему «положено» по норме. Значит, это отклонение со знаком « + ». Допустим далее, что и по какой-то шкале (скажем, «светлый — темный») оценка этого звука тоже отклоняется в положительную («светлую») сторону. Значит, в тексте нагнетается этот «светлый» звук, и путем перемножения отклонений компьютер соединяет оценку с частотностью, как бы набирая очки за «светлое» звучание текста (плюс на плюс дает плюс). Если в то же время какой-то «темный» звук (отрицательная оценка) по частотности отклоняется в отрицательную сторону, то есть встречается гораздо реже, чем «положено», то это еще более «высветляет» общую фоносемантическую картину, так как перемножение двух отрицательных величин тоже дает плюс. Но если звук «светлый» (положительное отклонение), а встречается меньше нормы (отрицательное отклонение), значит, данный звук «сыграл» против «светлой» фоносемантики (плюс на минус дает минус).
Так, подсчитывая очки за «светлое» звучание и против него, компьютер и обнаруживает ведущую тенденцию. Скажем, в тексте большинство «светлых» звуков встречается больше нормы, а большинство «темных» — меньше нормы. В результате очков за «светлое» звучание будет больше, и компьютер выдаст в качестве характеристики фоносемантики текста признак «светлый». Анализ идет по всем признакам лексикона, и в конце концов компьютер выдает набор признаков, характеризующих общий фоносемантический тон всего произведения.
Схема анализа есть. Но нужно еще убедиться в том, что она выявляет действительно фоносемантический, а не какой-нибудь другой аспект общего смысла текста. Возникает задача, сходная с той, которая уже решалась в предыдущей главе для отдельных слов. Там мы придумали разные слова-манекены, лишенные всех аспектов значения, кроме фоносемантического. Хорошо бы и здесь поступить так же. Да только как придумать «стихотворения-манекены» ?

Помощь пришла из... докомпьютерного прошлого. Стихотворные манекены не пришлось конструировать, они обнаружились в творчестве удивительного поэта — Вели-мира Хлебникова. Он написал поэму «Зангези», среди действующих лиц которой есть боги. Спрашивается, на каком языке они должны общаться между собой? Само собой понятно, что ни на каком из человеческих языков им разговаривать не пристало. У них должен быть свой, недоступный людям язык. Поэтому их речь лишена всех аспектов «человеческих» значений (понятийного и качественно-признакового), кроме, разумеется, фоносеманти-ческого, от которого в звучащей речи даже боги избавиться не могут. А нам только того и нужно: прекрасный материал для проверки компьютерных расчетов. «Манекенные» тексты (фрагменты бесед богов) предлагались информантам для оценки по 15 признакам компьютерного лексикона. Результаты измерений служили эталоном для разработки системы автоматического анализа фоносемантики текста.
Приведем полученные по этой схеме результаты анализа фоносемантики текстов и заодно оценим окончательную примерку результатов на манекенах.
Итак, разговор богов в поэме В. Хлебникова «Зангези». Первым начинает беседу Эрот. Он говорит так:
Мара-рома, биба-буль! Укс кукс эль! Редэдиди дидиди! Пири пэпи, па па пи! Чоги гуна, гени-ган! Аль, Эль, Иль! Али, Эли, Или!..Ну и так далее.
Информанты по предложенным признакам оценили это «божественное откровение» как нечто «нежное», «яркое» и «стремительное». Компьютер дал те же характеристики, добавив к ним признак «прекрасное». Ну что же, с компьютером трудно не согласиться: ведь Эрот юный и прекрасный бог любви. И остальные признаки явно ему подходят. Как свидетельствует энциклопедия «Мифы народов мира», Эрот златокрыл, золотоволос (значит, «яркий»), подобен ветру (значит, «стремительный»).
После ветреного греческого бога в беседу вступает серьезный славянский бог Велес, покровитель домашних животных и вообще всякого богатства. Его речь звучит совсем иначе:
Бруву ру ру ру ру ру! Пице цане сэ сэ сэ! Бруву руру ру-ру-ру! Сици, л иди, ци-ци-ци! Пенч, панч, пенч!Информанты уловили ворчливый тон «высказывания» и дали ему характеристики «минорное», «темное», «устрашающее». Правда, последний признак получил в суждениях информантов небольшой вес, но все же выделился как характеризующий.
Компьютер тоже не сплоховал — заметил смену тональности и выдал все те характеристики, которые дали отрывку информанты, да и «от себя» добавил еще «печальное» и «тоскливое». Разница, как видим, невелика. Главное, что все признаки минорного тона.
Ворчание Велеса прерывает Юнона — римская богиня женщин, брака и материнства. Она щебечет довольно мило:
Пирарара-пируруру! Лео лоло буароо! Вичеоло сесесэ! Вичи! Вичи! Иби би! Зизазиза изазо! Эпсь Апс Эпс! Мури-гури рикоко! Мио, мао, мум! Эп!Информантам ее речь понравилась, и они наградили ее характеристиками «прекрасное», «светлое», «нежное». Компьютер же выдал только один признак «светлое». Признаки «прекрасное» и «нежное» тоже имеют положительный вес, но они чуть-чуть не доходят до значимой границы. Однако в целом суждения информантов и компьютера вполне согласованы, поскольку в оценке основного тона отрывка наблюдается единство линий. Интересно, что в римской мифологии Юнону называли еще и Луцина, то есть «светлая».
Божественная болтовня, видимо, но нравится мрачному богу народа зулу Ункулункулу, что в переводе означает «очень, очень старый». Он разражается жуткой тирадой:
Рапр, гралр, апр! жай Каф! Бзуй! Каф! Жраб, габ, бокв-кук Ртупт! тупт!Ясно, что это, с позволения сказать, выступление никаких положительных эмоций у информантов вызвать не могло. Неудивительно, что они охарактеризовали его признаками «устрашающее», «угрюмое», «темное», «минорное», «сильное». Компьютер был с ними вполне солидарен и только добавил признаки «тоскливое», «печальное», «стремительное». Может быть, компьютер и погорячился, наговорив лишнего, но в целом в противоречие с информантами он не вступил.
Таким образом, это международное совещание богов дало возможность проверить процедуру расчета фоносемантики текста. Проверка показала, что боги недооценили людей, посчитав свой язык недоступным для смертных: компьютер вполне справился с расшифровкой «божественного языка», что открывает возможность переноса процедуры анализа на «человеческие» поэтические тексты.