Google nGrams и вопрос к филологам

Есть у Великого гугля такой сервис — Google nGrams. Он представляет собой интересный он-лайн инструмент, который позволяет осуществлять поиск слов, выражений, явлений или понятий в литературе с 1500 г. по 2008 г. Анализируется более 5 миллионов книг, опубликованных за указанный период времени. У пользователей появляется возможность проследить за изменениями слов в течением времени. Доступные языки поиска: английский, немецкий, испанский, французский, русский и китайский. Результаты отображаются в виде графика, где видна частота употребления слов или фраз.

Например, введя «идиот, умник, посредственность» я получила график, которій ві видите вверху.

Слово «посредственность» часто встречалось в литературе начала 19-го века. Чаще всего 1800-1813 года, потом провал, небольшой подъём и постоянный спад. И только с 1980 года опять начался рост.

А вот «умник» и «идиот», начали использоваться в начале 20-го века. При этом «умник» упоминался с примерно постоянной частотой на протяжении всего века, а в употреблении слова «идиот» наблюдается пости постоянный рост с небольшим спадом в период 1955 — 1975 года.

Ау, филологи! Может скажете чего умного по этому поводу?

P.S. Сцыль — https://books.google.com/ngrams/

Обсудить у себя 3
Комментарии (22)

а в чём вопрос? почему так происходит? мне кажется, это очевидно. или я просто не поняла смысл вопроса?

Я занимаюсь математикой. Поэтому «очевидное» в литературных тенденциях для меня не очевидно. ))

это общая тенденция большинства языков. разговорный, а следовательно и литературный, язык стремится к упрощению. высокопарные слова выходят из употребления. это не всегда означает обеднение словарного запаса современного человека. просто слова заменяются более примитивными и легко образуемыми. 

А, спасибо, теперь понятно.

Чёт всегда тупость в голову какая-то лезет 

Да… сложное слово. )

Советское млин 

Ну, надо полагать, что в 19 веке этого слова не существовало. ))

Даль вроде об этом ни чего не писал 

анализируются только художественные тексты?

Вроде нет, но не знаю точно. зайди там почитай.

ну тут ясно, что одно слово было в активном словаре в 19 веке, а два других вошли в активный словарь позднее. а почему? ну в силу социальных изменений в государстве, вероятно

там написано «анализировать множество книг». не уточняется, вроде. 

угму. понятно) общая тенденция)

ага.

Светланочка, я почитала там по ссылкам. анализируются книги все подряд. всё, что гугл сканирует для хранения в своей билиотеке. 

мм. вона как. стало быть о посредственностях и в научной литературе писали))

возможно. 

Гугл пишет, что они собрали количество книг, которое составляет примерно 4 % от всех, которые были вообще опубликованы за обсуждаемый период времени. и их и анализируют. то есть, гарантии, что это достоверно общая тенденция, нет. 

да, 4% маловато. мягко говоря

 Слово «посредственность» более нейтральное среди всех трёх.

 19 век — век довольно жёсткой цензуры. И приходилось выбирать выражения всем авторам. 

 Начало 20 века — реформы, связанные с упрощением языка. В том числе и в употреблении уничижительных выражений. 

 Если это объяснять с исторической точки зрения.

 Статистики мало. Нужно анализировать контексты употребления. 

Чтобы комментировать надо зарегистрироваться или если вы уже регистрировались войти в свой аккаунт.

Войти через социальные сети: