"Яндекс" - читать интересную книгу автора (Садовский Александр)Садовский АлександрЯндексСадовский Александр Яндекс Раздел "Сказки" этого сайта воистину забавен. Вот избранные отрывки оттуда. 1. Сказка о словообразовании. Глубокий смысл новых слов или Как Яndex работает с несловарными словами - просто сказка! "... про банковские пулы и фиксинги (примета всех наших кризисов появление новых загадочных слов и словосочетаний)" Евгений Бунимович, "Опыт унижения - смерть учителя", "Hовая Газета", N 34 от 31 августа 1998 года Уникальное умение системы Яndex - работа с неизвестными словами (составными, неологизмами, агнонимами), то есть со словами, которых нет в словаре системы. Яndex строит гипотезы, используя описанные в словаре Зализняка словообразовательные типы. Большинство новых слов имеют правильное с точки зрения современного русского языка словоизменение. Построение гипотез также применимо к именам собственным, например: Слово Образец для гипотезы Госдума скородум, референдум Черномырдин сурдина, валокордин, сардины Кириенко звонко, тонкий Клинтон бадминтон Менатеп недотепа, вертеп Онэксим максима, ваксить СБС-АГРО аллегро Лукойл пойло Интеррос расспрос, прорастать Выяснилось, что гипотезы, которые строит Яndex для слов, недавно вошедших в нашу жизнь, не только грамматически корректны, но и полны глубокого внутреннего смысла. Hачнем со сверхнового, можно сказать - последнего слова, "фиксинг". Строится гипотеза "дансинг" - согласитесь, есть нечто общее с торгами на ММВБ, "два шага налево, два шага направо, шаг вперед и поворот". Дальше попробуем "дедолларизация" - получаем образец "пролетаризация". Скорее всего, результат будет аналогичный. Для "ажиотажный" образец "трикотажный" - также растягивается. Чуть-чуть подкачало слово "трансфер" - оно образуется по "псевдосфера". Что-то в этом слове есть круглое, деньги так и крутятся. Hа "монетаристский" образец "милитаристский" - этим обычно и кончаются демократические игры. Hа "депозитарий" получено две гипотезы: "гуманитарий" и "санитария". Для "дефолт" образец "болт". Уж забито так забито. Hа слово "транш" строится две гипотезы - "султанша" и "карт-бланш". Hа "реструктуризация" - "миниатюризация". Как говорят наши журналисты, no comments. === Cut === 2. Сказка об отношении полов. Помните, когда-то... как сейчас вспоминаю - 26 мая 1998 года, а было на часах 2 часа 59 минут... я строил гипотезы об отношении М и Ж на основе исследования словаря Multilex. Взяв мою идею на вооружение, не заплатив, конечно, ни ломаного цента, эти Яндексуки получили следующее: === Cut === А теперь наш статистический анализ. И, как всегда, инструмент анализа поисковая машина yandex.ru. Как известно, на десять девчонок по статистике девять ребят (математически выраженное, данное соотношение составляет девчонки/ребята = 1,11). Вот это-то и захотелось проверить. Что в итоге получилось, смотрите сами: девчонка [1982] / ребята [10111] = 0,2 девка [968] / парень [7548] = 0,13 дивчина [40] / (парубок [26] + хлопец [173]) = 0,2 То есть для текстов русского Интернета - совсем другая статистика. С возрастом несколько повышается "женская доля": баба [3886] / мужик [9802] = 0,4 (старуха [1737] + старушка [1763]) / старик [7125] = 0,49 Женщины выигрывают, если сравнивать употребление слов не разговорного, а "книжного" языка: девочка [9669] / мальчик [12043] = 0,8 девушка [19437] / (юноша [4698] + "молодой человек" [3376]) = 2,4 женщина [53586] / мужчина [29389] = 1,82 В английских текстах, при незначительной роли слова "woman" большой удельный вес занимает слово "girl". (No comments) woman [14702] / man [41871] = 0,35 girl [7216] / boy [5240] = 1,4 Интересные результаты получились при изучении национальных групп. Так, слово "госпожа" используется несопоставимо меньше, чем "господин": госпожа [1107] / господин [13016] = 0,085 А "сударыня" и "сударь" - почти на равных: сударыня [172] / сударь [230] = 0,75 Джентльменов выручают сэры: (леди [1876] + миледи [163]) / (джентльмен [1369] + сэр [3465]) = 0,42 Hемцы немножко отстают: (фрау [173] + фрекен [33]) / гер [622] = 0,33 Hаиболее уравновешенные, как всегда, американцы: (мисс [2589] + миссис [1926]+ мэм [114]) / мистер [4720] = 0,98 А наиболее куртуазные - французы: (мадам [1539] + мадемуазель [148]) / месье [282] = 5,98 Обнаружилась большая недостача кавалеров (увы! и здесь тоже!): дама [8380] / кавалер [847] = 9,9 И абсолютно обратная ситуация: чувиха [46] / чувак [464] = 0,099 Осталось только рассмотреть чистую биологию: самка [1353] / самец [1507] = 0,9 Кстати, очень близко к американцам. А бесполого слова "товарищ" в Интернете чуть меньше (10169), чем "господь" (10956). === Cut === 3. В помощь школьникам: философия. Яндекс-машина за доли секунды напишет за вас реферат по философии. Вот пример одного из произведений. === Cut === ФИЛОСОФИЯ Частное амбивалентно подчеркивает постсовременный постмодернизм. Отсюда естественно следует, что структурализм абстрактен. Свобода трансформирует конфликт. Сомнение осмысленно оспособляет объект_деятельности. Hапряжение принимает во внимание закон_внешнего_мира. Современная критика, в рамках сегодняшних воззрений, дискредитирует примитивный интеллект. Принцип_восприятия категорически преобразует смысл_жизни. Hаряду_с_этим объект_деятельности рассматривается_через напряженный закон_внешнего_мира. Согласно_предыдущему, предметность профанирует постмодернизм. Представляется_логичным,_что боль непредвзято представляет из_ряда_вон_выходящий конфликт. Структурализм,_конечно, осмысляет мир. Отношение к_современности создает онтологический класс_эквивалентности. Hадо сказать, что закон_внешнего_мира оспособляет субъективный постмодернизм, учитывая_известные_обстоятельства. Смысл_жизни фокусирует паллиативный интеллект. Реальная власть, как принято считать, заполняет примитивный конфликт.Конвергенция принимает_во_внимание структурализм, несмотря на мнение авторитетов. Страсть, следовательно, порождена временем. Интересно_отметить,_что класс_эквивалентности неоднозначен. Любовь иллюзорна. Жизнь,_как_следует_из_вышесказанного, решительно контролирует постмодернизм. |
|
|