"Яндекс" - читать интересную книгу автора (Садовский Александр)

2. Сказка об отношении полов

Помните, когда-то… как сейчас вспоминаю — 26 мая 1998 года, а было на часах 2 часа 59 минут… я строил гипотезы об отношении М и Ж на основе исследования словаря Multilex. Взяв мою идею на вооружение, не заплатив, конечно, ни ломаного цента, эти Яндексуки получили следующее:

=== Cut ===

А теперь наш статистический анализ. И, как всегда, инструмент анализа поисковая машина yandex.ru.

Как известно, на десять девчонок по статистике девять ребят (математически выраженное, данное соотношение составляет девчонки/ребята = 1,11). Вот это-то и захотелось проверить. Что в итоге получилось, смотрите сами:

девчонка [1982] / ребята [10111] = 0,2

девка [968] / парень [7548] = 0,13

дивчина [40] / (парубок [26] + хлопец [173]) = 0,2

То есть для текстов русского Интернета — совсем другая статистика. С возрастом несколько повышается "женская доля":

баба [3886] / мужик [9802] = 0,4

(старуха [1737] + старушка [1763]) / старик [7125] = 0,49

Женщины выигрывают, если сравнивать употребление слов не разговорного, а "книжного" языка:

девочка [9669] / мальчик [12043] = 0,8

девушка [19437] / (юноша [4698] + "молодой человек" [3376]) = 2,4

женщина [53586] / мужчина [29389] = 1,82

В английских текстах, при незначительной роли слова "woman" большой удельный вес занимает слово "girl". (No comments)

woman [14702] / man [41871] = 0,35

girl [7216] / boy [5240] = 1,4

Интересные результаты получились при изучении национальных групп.

Так, слово "госпожа" используется несопоставимо меньше, чем "господин":

госпожа [1107] / господин [13016] = 0,085

А "сударыня" и "сударь" — почти на равных:

сударыня [172] / сударь [230] = 0,75

Джентльменов выручают сэры:

(леди [1876] + миледи [163]) / (джентльмен [1369] + сэр [3465]) = 0,42

Hемцы немножко отстают:

(фрау [173] + фрекен [33]) / гер [622] = 0,33

Hаиболее уравновешенные, как всегда, американцы:

(мисс [2589] + миссис [1926]+ мэм [114]) / мистер [4720] = 0,98

А наиболее куртуазные — французы:

(мадам [1539] + мадемуазель [148]) / месье [282] = 5,98

Обнаружилась большая недостача кавалеров (увы! и здесь тоже!):

дама [8380] / кавалер [847] = 9,9

И абсолютно обратная ситуация:

чувиха [46] / чувак [464] = 0,099

Осталось только рассмотреть чистую биологию:

самка [1353] / самец [1507] = 0,9

Кстати, очень близко к американцам.

А бесполого слова "товарищ" в Интернете чуть меньше (10169), чем "господь" (10956).

=== Cut ===