Тамбовский Волк ([info]tambov_wolf) wrote,
@ 2009-06-16 13:19:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Entry tags:Ежедневное, Публицистика

Про миллион слов в английском языке
10 июня USA Today на первой странице опубликовала следующую информацию о количестве слов в разных языках:
Английский: 999 985
Китайский(с диалектами): 500 000+
Японский: 232 000
Испанский: 225 000
Русский: 195 000

Что меня сильно удивило. Во-первых, только у Даля более двухсот тысяч слов, а с тех пор в русском языке появилось немало новых слов; во-вторых, словарь Merriam-Webster знает "всего" около четырехсот семидесяти тысяч слов в американском английском. Аналогичный Оксфордский словарь британского содержит "сравнимое количество слов".

Примечание: На самом деле, во втором издании Оксфордского словаря перечислено 171 476 слов современного британского английского и 47 156 устаревших слов. Всего - 218 632.

Про японский обнаружилась следующая информация:
Министерство просвещения Японии определило 1850 иегроглифов для повседневного использования, а 881 из них - для изучения в начальных и средних школах. Однако существует ряд иероглифов, применявшихся до конца Второй мировой войны, которые еще нужны для написания имен и адресов. Ежедневные газеты используют около 400 иероглифов. По статистике, 2500-3000 иероглифов составляют 99,9% от общего количества появляющихся в газетах и журналах. Наиболее полный японский словарь содержит 50 000 иероглифов.

Про русский русские же лингвисты утверждают что в русском около 500 000 слов, со специальными и научными терминами - около миллиона слов. Откуда в газете взялось число 195 тысяч слов мне установить не удалось.

Широко известно, что Шекспир использовал 31 534 различных слова в своих произведениях. Самый лексически богатый писатель в русского языка - Пушкин, примерно 24 000 слов. Однако, если считать различные формы одного и того же глагола (go-going-gone, walk-walks-walking) одним и тем же словом, то количество слов использованных Шекспиром будет не более 20 000. Если же применять к Пушкину те же правила что применяются для подсчета слов у Шекспира то Пушкин использовал не менее 100 000 слов (умножаем количество существительных и прилагательных на 5, глаголов - минимум на 3).

Возвращаясь к миллиону слов в английском языке: очевидно, информация в газете появилась с сайта The Global Language Monitor. На этом сайте в тот же день, 10 июня было объявлено что английский язык преодолел рубеж одного миллиона слов. Миллионным словом стало слово "Web 2.0". Миллион-первым: "Financial Tsunami". Среди околомиллионных слов также: "Jai Ho", "N00b" (через два нуля), "cloud computing", "carbon neutral", "zombie banks". Если бы подходящего слова не нашлось, то миллионным словом было бы назначено слово "MillionWordWord".




(8 comments) - (Post a new comment)


[info]sevaa
2009-06-16 05:30 pm UTC (link)
Ерунда, по-моему. В общем случае вопрос "сколько слов в языке" ответа не имеет. Потому что гибкие правила словообразования бывают.

А конкретно в японском куча слов записывается сочетаниями из 2 и более иероглифов, а еще куча записываются вообще без иероглифов (буквами алфавита). Так что сравнение некорректно.

(Reply to this)


[info]olesar
2009-06-16 07:59 pm UTC (link)
Поскольку я и есть тот самый "русские же лингвисты утверждают" и автор нового частотного словаря русского языка, то должна прокомментировать, что на самом деле все зависит от методики подсчетов. В корпусах английского языка "словом" считается отдельная форма (даже в самом продвинутом варианте, с объединением форм единственного и множественного числа в одно, я видела, что foot и feet считаются разными словами), а также так называемые multi-word expressions.
Если считать только словоформы, то в Национальном корпусе русского языка их больше миллиона. Но согласитесь, что сравнение по этому критерию русского и английского неуместно.
195 000 лексем - это приблизительно объем грамматических словарей, встроенных в современные системы автоматического анализа руских текстов. Специальные термины и прочие случайные словоупотребления там отсутствуют.

(Reply to this) (Thread)


[info]p_chuchundrin
2009-06-17 06:24 am UTC (link)
[Я в лингвистике строго равен нулю, так что не серчайте, если вопрос глупый]: то есть, по этой методике каждый суффикс создает новое слово? "старуха"-"старушка"? Это ж у нас в языке в таком случае должно быть просто чудовищное количество слов?

(Reply to this) (Parent)(Thread)


[info]olesar
2009-06-17 11:51 am UTC (link)
да, именно так.

(Reply to this) (Parent)(Thread)


[info]p_chuchundrin
2009-06-17 03:26 pm UTC (link)
Спасибо. А учитываются всяческие жаргонизмы? И вообще, что требуется, чтобы слово было признанным в этом качестве? Допустим, "бомж", "беспредел" или "монстрюган" в учитываемое множество входят? А если нет, то при каких условиях могут войти?

(Reply to this) (Parent)


[info]tambov_wolf
2009-06-17 03:05 pm UTC (link)
Я, в общем, тоже. Но мне кажется что, в отличие от склонения существительного по падежам, которое нового слова не создает (точно так же как и изменение глагола по временам), суффиксы именно создают новые слова:
старуха-старушка-старушенция обозначают разные оттенки смысла.

Кроме того в русском слова образуются соединением, типа однокрылый-двукрылый, трехкрылый, четырехкрылый, пятикрылый, шестикрылый. В английском, несмотря на германские корни, такое редкость.

Именно поэтому меня и удивило заявление что в русском языке слов в 5 раз меньше чем в английском.

(Reply to this) (Parent)(Thread)


[info]p_chuchundrin
2009-06-17 03:28 pm UTC (link)
Вот я и подумал тоже, что это странно. Потом увидел, какие слова - околомиллионные, и понял так, что наши аналогичные словеса просто не были посчитаны.

(Reply to this) (Parent)(Thread)


[info]p_chuchundrin
2009-06-17 03:30 pm UTC (link)
И, кстати. "Околомиллионный" - тоже вполне себе пример слова, полученного соединением:)

(Reply to this) (Parent)


(8 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…