Полный (объединённый) словарь-справочник русского языка и сравнительный анализ мощи языков Русской и Западной (Англосаксонской) цивилизаций

6 лет назад /

Тришин Виталий Николаевич, к.ф.-м.н., председатель Совета директоров компании
«Оценка крупных предприятий» («ОКП»), г. Москва

Cайты: http://www.trishin.ru/,
http://www.trishin.net

Е-mail: mail@trishin.ru

(сокращённый вариант статьи напечатан в журнале «Символ науки», 2017, №10, стр. 47-48)

Статья посвящена краткому описанию Полного (объединённого) словаря-справочника русского языка и его политико-мировоззренческого значения. Подчеркивается необходимость создания при государственной поддержке небольшого коллектива из лингвистов и программистов для его дальнейшего развития.

Ключевые слова: Полный (объединённый) словарь-справочник русского языка Виталия Тришина, компьютерная обработка текстов, интеллектуальный поиск информации, сколько слов в русском языке

В 1783 году указом Екатерины II по инициативе княгини Екатерины Романовны Дашковой была создана Российская академия (не путать с Императорской Академией наук, созданной в 1724 году) — центр по изучению русского языка и словесности в Петербурге (директор Е. Р. Дашкова, президент К. Г. Разумовский). Перед центром Екатериной II была поставлена задача создания Полного словаря русского языка.

Результатом деятельности Российской академии стало издание в 1794 году Российского академического словаря в шести томах, включающих около 43 тысяч слов, второе издание выходило в 1806—1822 годах и включало 51 тыс. слов. В 1841 году академия была преобразована в отделение русского языка и словесности Императорской Санкт-Петербургской Академии наук. О необходимости создания Полного словаря русского языка писал президент Российской академии с 1813 года, Государственный секретарь и министр народного просвещения адмирал, академик А. С. Шишков, а в советское время - русский литературовед и лингвист-русист, академик АН СССР В. В. Виноградов. Однако в бескомпьютерное время создание Полного словаря русского языка было практически невыполнимой задачей.

Мой объединённый словарь-справочник является попыткой эту задачу решить.

На 12.12.2018 в электронной версии словаря-справочника [1-5] имеется 624 тыс. слов и словосочетаний, из которых 496 тыс. записей снабжены связями, и 2274 тыс. синонимических, квазисинонимических и парадигматических связей, в демонстрационной (неполной) электронной версии словаря имеется 526 тыс. записей и 1974 тыс. связей, а в онлайн-версии словаря имеется 526 тыс. записей, 1955 тыс. связей. Работа над словарём продолжается.

Словарь-справочник используется в поисковом механизме компьютерной системы ASIS® (Appraiser Support Info System) для оценки основных фондов предприятий-гигантов начиная ещё с 1992 года.

Так как словарь-справочник проектировался для компьютерного распознавания различных текстов, то в него вошли не только нормативные (цензурированные) словари РАН (орфографические, синонимические, толковые, литературного языка и др.), но и слова и словосочетания из словарей и справочников по всем отраслям знаний - от астрономии до японской живописи, с введёнными дополнительно синонимическими, квазисинонимиическими и парадигматическими связями. При составлении словаря использованы также и другие изданные словари: «Словарь русского языка XVIII в.», «Толко?вый слова?рь живо?го великору?сского языка?» В.И. Даля (полностью в версии 7.1), словари церковно-славянских слов, словари-справочники серии «Новые слова и значения по материалам прессы и литературы 60-90 годов XX века» (т.е. примерно за последние триста лет), а также иностранных слов, неузуальных слов, арго (кроме заведомо ненормативной лексики), и т.п. Кроме того, для пополнения словаря активно использовались газеты, журналы, Интернет, словари поисковиков Yandex и Google путём анализа выдачи их автоподсказчиков слов (с проверкой по другим источникам).

Словарь-справочник является самым большим словарём русского языка, который намного (в разы) опережает конкурентов по количеству записей и связей между записями. А введение даже всех нормативных словарей РАН в компьютерную систему распознавания текстов без дополнительного введения слов и словосочетаний из других «ненормативных» словарей не сможет помочь распознать даже обычный, обыденный текст, не говоря уже о специализированных текстах различных наук, направлений деятельностей.

При создании словаря-справочника была проведена также отдельная научная и программистская работа по поиску слов, фразеологизмов, синонимов и квазисинонимов русского языка.

Количество слов и связей в словарях русского и английского языков является важной характеристикой Русской и Западной цивилизаций, элементом борьбы цивилизаций согласно концепции этнокультурного разделения цивилизаций директора Центра международных отношений, президента Американской Ассоциации политических наук Сэмюэля Хантингтона [6] (умер в 2008 году), см. также [7].

Неудивительно, что по этому вопросу распространяется масса дезинформации и спекуляций «либеральными» и западными филологами (обычно пишут, что в русском языке имеется 200-230 тыс. слов и словосочетаний, а в английском – 1 млн., - сделайте запрос в Яндексе «сколько слов в русском языке», чтобы в этом убедиться). 

При этом авторы работ по количественному сравнению английского и русского языков совершают подлог и умалчивают о том, что самые крупные словари английского языка включают и специализированные слова из различных отраслей знаний, т.е. являются объединёнными, а сравниваемые с этими словарями русские словари, например: Русский орфографический словарь Лопатина (230 тыс. слов и словосочетаний), Большой академический словарь (150 тысяч), семнадцатитомный словарь современного русского литературного языка (131 тысяч), словарь С. И. Ожегова (57 тысяч) и др. - специализированных слов практически не включают. Полный (объединённый) словарь русского языка этими авторами замалчивается, да и интернет-поисковики по соответствующим общим запросам, например, «сколько слов в русском языке», преднамеренно игнорируют размещённые в Интернете мои статьи о словаре-справочнике, да и сайт www.trishin.ru выдается ими где-то на 20 экране выдачи, хотя на главной его странице это словосочетание упоминается три раза.

Зато по этому запросу поисковики выдают статьи, где это словосочетание даже не встречается, с говорящими названиями типа «у русского языка нет будущего», «русский язык оказался примитивнее английского», «русский язык происходит от украинского» и даже статья о том, что мужская прыть якобы украинского мужчины (это кто же такой, чем он отличается от русского мужчины?) в разы (это как?) больше прыти русского мужчины. Это и не удивительно, если знать, кому в реальности принадлежат так называемые российские национальные поисковики и как запрограммирован (и скорректирован вручную) поиск в них по политико-мировоззренческим запросам.

Приведу только одну цитату из статьи американского лингвиста М. Н. Эпштейна: «словарный фонд русского языка <…> составляет всего около 40 тысяч. Для языка многомиллионного народа, занимающего седьмую часть земной суши, живущего большой исторической жизнью и воздействующего на судьбы человечества, это удручающе мало», см. http://magazines.russ.ru/znamia/2006/1/ep13-pr.html. То есть этот «филолог» фактически обозвал русских людей интеллектуально неразвитыми. Также он утверждает в статье, что количество слов в словарях русского языка завышено при помощи приписок.

В реальности его статья, помимо явной русофобской ангажированности (заказанности), свидетельствует о том, что по каким-то причинам у нас отсутствуют полные словари русского языка.

Цель подобных статей на русском языке для граждан России – попытка привить гражданам России чувство неполноценности, уныния, воспитания неуважения граждан к языку, культуре своей родины, сломе мировоззренческой матрицы Русской цивилизации. Это часть постоянных деструктивных информационных воздействий, манипуляций, которым подвергается население России через телевизор, Интернет. Этим занимаются и инфицированные пессимизмом русскоязычные зомби, которые пишут на различных форумах. 

Но нужно понимать, что на русскоязычных форумах, в комментариях к новостям пишут за деньги, занимаются манипуляциями и профессионалы-психологи, русскоязычные граждане других стран в рамках информационных войн [6,7]. Информационные бойцы возбуждают взаимную ненависть на Украине среди русских (малорусов и великорусов). Их действиями в немалой степени вызвана война на Донбассе. Около 500 участников так называемой "антитеррористической операции" совершили суицид по возвращении с Донбасса - можно предположить, что многие из этих самоубийц осознали, как их обманули и заставили стрелять в своих.

15-летний М.Ю. Лермонтов написал в письме М. А. Лопухиной от 2 сентября 1832 года из Петербурга в Москву (в переводе с французского): «люди вовсе не созданы мыслить, потому что мысль сильная и свободная — такая для них редкость!», http://lermontov-lit.ru/lermontov/pisma/pismo-21.htm.

Жёсткие, но, к сожалению, справедливые слова.

То есть Полный (объединённый) словарь-справочник русского языка имеет и политико-мировоззренческое значение как противодействие русофобской клевете на русский язык, на русский мир.

Работы по созданию объединённого словаря английского языка ведут, по крайней мере, три группы английских и американских лингвистов и программистов по государственным грантам с бюджетами в десятки (до пятидесяти) миллионов долларов.

В электронной версии Оксфордского полного словаря английского языка, см. http://www.oed.com/, http://dic.academic.ru/dic.nsf/ruwiki/212818, имеется около 600 тыс. слов и словосочетаний. Словарь включает все слова, бытующие или бытовавшие в английском языке начиная с 1150 года. Online-версию Оксфордского словаря намечают выпустить в 2017 году.

Имеется две Online-версии словаря английского языка Уэбстера, в которых быстро выдаётся то, что мы понимаем под синонимами, синонимическими связями (Related Words):

1) http://www.merriam-webster.com/ (примерно на 600 тыс. слов и словосочетаний);

2) Разработка Принстонского университета http://www.webster-dictionary.org/definition/irrelevant (примерно на 240 тыс. слов и словосочетаний) c фонетическими транскрипциями слов, их звучанием, переводом на другие европейские языки.

Поиск слов в этих Online-словарях осуществляется только по началу слова.

Из интервью с одним из авторов Большого академического словаря русского языка доктором филологических наук Людмилой Евгеньевной Кругликовой [9] (почитайте также другие интереснейшие интервью с ней [10], [11]):

«вывод о бедности русского языка и богатстве английского на том основании, что Большой академический словарь русского языка (БАС), который начал выходить в 2004 году (опубликовано 22 тома (сейчас опубликовано уже 24 тома, – В.Т.) из предполагаемых 33), будет содержать 150 000 слов, а Оксфордский (Тhe Oxford English Dictionary, сокращенно OED) - 600 000, не что иное, как ОБМАН.

БАС отражает лексику только современного литературного языка, а Оксфордский словарь - слова всех разновидностей и всех вариантов (американского, канадского и т.д.) английского языка начиная с 1150 года, включая мертвые»;

«Над БАСом работают 5 штатных лингвистов, 3 совместителя и несколько сотрудников издательства. В год выходит в среднем по два тома.

Над Оксфордским словарем работают 78 лингвистов, 46 внештатных сотрудников, а также 200 консультантов, штат программистов, маркетологов».

Словарь-справочник может быть использован не только как словарь синонимов и близких по смыслу слов, но и в качестве орфографического и толкового словарей русского языка с целью проверки правильности написания и определения значений незнакомых слов, синонимайзера текста, а также как обратный словарь. Словарь также может служить инструментом для филологических наблюдений и исследований языка благодаря развитой системе запросов по разным признакам слова (по началу, фрагменту, окончанию слов, количеству связей и т.д.).

Другие возможные направления коммерческого использования словаря описаны в Приложении №3 к моей статье «Мощь русского языка по данным синонимического словаря-справочника компьютерной оценочной системы ASIS®», указанной на моих двух сайтах.

Удивительно, что работа по созданию объединённого (Exe и Online) словаря русского языка никем в России, кроме меня, не ведётся (вернее, мне подобные работы не известны). Для дальнейшего развития словаря-справочника необходимо создание небольшого коллектива из лингвистов и программистов и государственная поддержка.

В течение ближайших 3-4 лет я рассчитываю достичь в словаре 700 тыс. записей и 2400 тыс. связей. Расчёт основан на том, что в специализированных словарях (по физике, химии, биологии и т.д.) часто для имеющихся в этих словарях существительных нет прилагательных, для прилагательных нет существительных и наречий, а в Интернете, согласно надёжным источникам, такие вторичные (производные) слова часто имеются. После нахождения в Интернете таких производных слов для слов из словаря на букву «А» мною было добавлено в словарь около 3 тыс. слов. А всего слова на букву «А» занимают в моём словаре примерно одну сороковую часть. Из чего следует, что добавление недостающих слов из специализированных словарей даст прибавку в количестве записей в моём словаре примерно 120 тысяч. А ещё не вышли 9 томов БАС, 8 томов словаря 18 века, из которых я черпаю новые слова, толкования, связи…

Но так как при добавлении производных слов на букву «А» мною добавлялись производные слова и на другие буквы, то прогнозируемое число записей в словаре-справочнике не 750 тыс. а 700 тыс.

Именно выявление этих цифр для полного словаря русского языка, т.е. выявление реальной мощи русского языка, является одной из главных задач при разработке данного словаря-справочника.

Так как основную массу слов в полных словарях европейских языков занимают специализированные слова (по медицине, биологии, физике и т.д.), которые имеют в этих языках соответствующие аналоги, то и количество слов в них примерно одинаково.

Что же касается греческого языка (примерно якобы 5 млн. слов), в котором нет синонимии, и арабского языка (примерно якобы 13 млн. слов), то по ним имеется противоречивая литература, к тому же их количественные характеристики обычно замалчиваются, либо эти характеристики подвергаются сомнению.

Этот словарь-справочник практически показывает, что по количеству слов русский язык относится к наиболее развитым языкам мира, а по масштабу и плотности пространства синонимов и квазисинонимов (а также рифм, интонаций) ему, по мнению автора, нет равных среди европейских языков.

Именно синонимия является, по-видимому, одной из причин создания не имеющей в мире аналога великой русской поэзии, а также народной философии Русской цивилизации – русского лиризма (А. Н. Васин-Макаров «Антология русского лиризма», см. сайт http://www.studia-vasin.ru).

  1. Тришин В.Н. Электронный словарь-справочник синонимов русского языка системы ASIS. // В книге "Владимир Даль в счастливом доме на Пресне" , М.: изд-во "Academia", 2010, стр. 158-165.

  2. Тришин В.Н. Мощь русского языка по данным синонимического словаря-справочника системы ASIS. // Журнал «Вестник УМО. Экономика, Статистика и Информатика», №6, 2013, стр. 7-13, http://www.audit-it.ru/articles/soft/a119/597862.html .

  3. Куянов Ю.В., Тришин В.Н. Количественный анализ Большого словаря-справочника синонимов русского языка. // Журнал «Научное обозрение: гуманитарные исследования», №9, 2015, стр. 105-111, http://www.audit-it.ru/articles/soft/a118/838916.html.

  4. Куянов Ю.В. и Тришин В.Н. Эволюция автономного словаря ASIS® к интерактивному общедоступному веб-словарю. // Журнал «Научное обозрение: гуманитарные исследования», №10, 2016, стр. 225-237, http://www.audit-it.ru/articles/soft/a118/838916.html.

  5. Тришин В.Н. Две рецензии на статью «Эволюция автономного словаря ASIS® к интерактивному общедоступному веб-словарю» и комментарий к ним, https://www.audit-it.ru//club/user/5/blog/12854/.

  6. Хантингтон С. Столкновение цивилизаций, М.: ООО «Издательство АСТ», 2003. – 603 стр.

  7. Русская и Англосаксонская цивилизации. Части № 1-2, https://rusvolvo.livejournal.com/8040.html,https://rusvolvo.livejournal.com/8228.html.

  8. Елена Новосёлова. Что у нас с БАСом? Почему английские словари толще русских? (Интервью с Л.Е. Кругликовой). // «Российская газета», №6504 (232), 10.10.2014, https://rg.ru/2014/10/10/slovari.html.

  9. Л. Е. Кругликова. «У каждого поколения должен быть свой словарь» (интервью интерактивному информационно-обучающему сайту для детей и взрослых «Русский язык на 5», http://russkiy-na-5.ru/articles/852).

  10. Л. Е. Кругликова. «Ни о каком лексическом оскудении русского языка не может быть и речи» (интервью интерактивному информационно-обучающему сайту для детей и взрослых «Русский язык на 5», см. http://russkiy-na-5.ru/articles/853).

Назад

Есть бизнес – задача? Доверьте ее решение нам!

Оставьте заявку на бесплатную консультацию.

Заполните указанные ниже поля или позвоните по бесплатному номеру 8 (800) 200 - 33 - 08, чтобы один из наших специалистов мог связаться с Вами и ответить на все вопросы, связанные с оценкой бизнеса или другими нашими услугами. Это абсолютно бесплатно.

Отправляя заполненную форму, я даю своё согласие на обработку моих персональных данных в соответствии с законом № 152-ФЗ «О персональных данных» от 27.07.2006.

Другие материалы рубрики

4 года назад / Финансы и аудит

Бюджетирование функции внутреннего аудита: сколько достаточно?

4 года назад / Финансы и аудит

Очередное возвращение к определению понятия «стоимость» предприятия

4 года назад / Финансы и аудит

Практические аспекты учета сделок по объединению бизнеса в топливно-энергетическом секторе