Блог Игоря Шевченко

Расчлененка и сноб

Решил попробовать читать Воннегута в оригинале.

Мысль возникла где-то на середине «Завтрака для чемпионов», который я читал пару месяцев назад. Переводили «Завтрак» в Советском Союзе, ну и, разумеется, цензура сократила роман на несколько абзацев. Пропущенные куски восстановил только создатель электронной версии, оставив их на английском. Я их чудесно понял, и подумал, что надо было мне без перевода читать, раз я могу. Было слегка скучно, а так хоть какая-то польза. Это во-первых. Во-вторых, в «Бойню» и «Колыбель», которые я читал раньше, никто таких примечаний не добавлял, хотя непонятно, почему бы советские цензоры не могли вырезать что-нибудь и там. Утерянное надо компенсировать, а чтобы вы поняли, как высоко его стоит оценивать, приведу одну вырезанную часть:

Dwayne Hoover, incidentally, had an unusually large penis, and didn’t even know it. The few women he had had anything to do with weren’t sufficiently experienced to know whether he was average or not. The world average was five and seven-eighths inches long, and one and one-half inches in diameter when engorged with blood. Dwayne’s was seven inches long and two and one-eighth inches in diameter when engorged with blood.

Dwayne’s son Bunny had a penis that was exactly average.

Kilgore Trout had a penis seven inches long, but only one and one-quarter inches in diameter.

...

Harry LeSabre, Dwayne’s sales manager, had a penis five inches long and two and one-eighth inches in diameter.

Cyprian Ukwende, the black physician from Nigeria, had a penis six and seven-eighths inches long and one and three-quarters inches in diameter.

Don Breedlove, the gas-conversion unit installer who raped Patty Keene, had a penis five and seven-eighths inches long and one and seven-eighths inches in diameter.

И так далее. Очень важный момент.

И, наконец, как же не проверить тезис о том, что романы Курта проигрывают в оригинале, который высказал кто-то у Довлатова. Сергей Довлатов выглядел так:

Довлатов

О Довлатове существует легенда, упоминая которую, иногда ссылаются на Андрея Арьева. Говорят, что он писал так, чтобы в каждом предложении все слова начинались с разных букв. Это формальное правило он использовал, чтобы замедлить появление текста. Необходимость следить за его соблюдением заставляла Довлатова останавливаться на каждой фразе, совершенствовать ее, подбирать лучшие слова. Иногда ради этого приходилось жертвовать правдой. Здесь можно вспомнить отредактированную цитату из Пушкина в «Заповеднике»:

— Исполнилось пророчество; «Не зарастет священная тропа!..»

Слово народная никак не могло появиться в одном предложении с не.

Но если читать внимательно, то можно заметить, что предложения со словами на одну букву порой встречаются. Читая других авторов, я никогда ни о чем подобном не думал, поэтому трудно сказать, но кажется, что у других чаще. Гарантировать это не стал бы. Чтобы понять однозначно, я применил немного современных технологий.

Инновационные средства исследования включают в себя два модуля на пайтоне. Первый состоит из класса, который получает куски текста, обрабатывает их, а затем сообщает, сколько в этих кусках было предложений и сколько из них содержат слова на одну букву. Второй открывает по очереди файлы с текстами и отдает их на анализ классу из первого. Он получился не то чтобы красивым, потому что электронные книги имеют странные форматы, ну и с кодировками понадобилась кое-какая возня. Посмотреть код можно на гитхабе.

Сперва я посчитал статистику по тридцати случайным произведениям.

Статистика по 30 случайным произведениям

Здесь обращать внимание стоит в первую очередь на проценты у Довлатова. Остальные — просто для точечного сравнения с конкретными произведениями, и показывать что-то не могут, потому что их всего тридцать, а текстов на русском языке немного больше. Например, в архиве с рутрекера их шестьдесят две тысячи. Но в анализе участвовали не все. Небольшую сомнительную часть я удалил сразу. Некоторые файлы не смогли обработаться, потому что в них был какой-то непостижимый иврит. Наконец, уже получив результат, я исключил тексты, содержащие менее двадцати предложений. В том числе и пелевинскую «Водонапорную башню», в одном предложении которой двести девяносто семь слов на букву с. В итоге, осталось шестьдесят две тысячи шесть текстов. Обработка заняла три с половиной часа. Ее итоги таковы:

Статистика по всем произведениям

Здесь видно, что в девяноста восьми процентах текстов два предложения из пяти содержат слова на одну букву. Среднее значение — шестьдесят семь с половиной процентов таких предложений. Более конкретные результаты приводить не буду, потому что книги из этого сборника могут содержать влияющие ошибки (уверен, что если и есть что-то неправильное, то только там; для своего кода я написал прекрасные юнит-тесты). Но количество должно сделать средний результат достоверным. Но в любом случае, даже с расхождениями на пару процентов, у Довлатова предложений со словами на одну букву настолько меньше этого среднего, что это вряд ли могло получиться случайно. Confirmed.

Confirmed

«Сирен Титана» я бросил после двенадцати страниц. Невыносимо стало перечитывать одно и то же, и понимать, что еще долго ничего не произойдет. А может, Гор Видал и прав, действительно проигрывают.

Plausible.

29 февраля 2012 21:28

Оставить комментарий

Вы можете войти через Твитер или ВКонтакте