Пропавшее одиннадцатое число (drhagen.com)
В 1140 выпуске xkcd Рэндел Манро сравнил, как часто различные даты встречаются в англоязычных книгах. Оказалось, что 11 числа всех месяцев, кроме сентября, упоминаются аномально редко. Дэвид Хаген рассказывает, почему так получилось.
Причина этого в ошибках распознавания символов в корпусе Google, на котором производилось исследование. Цифра 1 похожа на латинские буквы I и l, и алгоритм распознавания принимает 11th за IIth, Ilth, iith, lith, llth, 1lth, 1ith или l1th. Еще он часто читает 11th как nth. Где-то ошибка происходит из-за того, что на старых печатных ошибках не было цифры 1, и вместо нее набирали букву l.
Эти факторы относятся и к другим числам (в 12, 13 и т.д. тоже есть единицы), но в 11 единиц две, поэтому вероятность ошибки больше, и одиннадцатых чисел получается заметно меньше, чем ожидается статистически.
Поделиться ссылкой:
9 января 2016 23:13