Почему слово «артиллерия» Петр I писал восьмью способами
Чиновникам и студентам разобраться в нормах русского языка поможет Национальный словарный фонд

Работа над созданием информсистемы «Национальный словарный фонд» (НСФ) подошла к экватору. Лингвисты завершают самую сложную часть проекта — ручную разметку данных и вскоре передадут эстафету программистам. Тендер для них Минобрнауки объявит в ближайшее время, сообщила нашему изданию руководитель проекта — доктор филологических наук, главный научный сотрудник Института русского языка имени Виноградова РАН Мария Каленчук.
Все на одном ресурсе
Закон о Национальном словарном фонде принят в 2024 году. Проект завершится в 2027 году, а частично цифровая платформа заработает к концу 2025 года.
Единый цифровой ресурс позволит разобраться в нормах русского языка и проследить их развитие за последние три века. Это сложный продукт, который создают с привлечением информационных технологий, сказал «Парламентской газете» зампред Комитета Госдумы по культуре Александр Шолохов. Отличительные черты платформы — легкая навигация, бесплатность и доступность для пользователей. База будет обновляться каждые пять лет.

Словарный фонд станет официальным источником знаний о нормах и правилах современного русского литературного языка для школьников, студентов, экспертов и представителей СМИ.
На сегодня в базу вошло 33 нормативных словаря, рассказала Мария Каленчук. Они оцифрованы. Четыре из них утвердил Минобрнауки, 29 — рекомендовал профильный ученый совет при РАН, например Большой академический словарь русского языка из 32 томов, Русский орфографический словарь под редакцией О. Ивановой и В. Лопатина, Большой орфоэпический словарь русского языка М. Каленчук, Л. Касаткина и Р. Касаткиной, Словарь народных говоров. В фонде вместе с современными словарями представлены исторические — от словаря Даля до словарей, выпущенных в наше время, но посвященных истории языка.
Тем, кто хочет повысить свою грамотность и словарный запас, эксперты советуют читать не только художественную литературу, но и почаще заглядывать в словари. По данным социологов, словарный запас у образованного россиянина — 7-9 тысяч слов, а у обычного россиянина — 2 тысячи. Для сравнения: в лексиконе Пушкина — 24 тысячи слов, в неизданном словаре Ленина — около 30 тысяч, у Шекспира — до 20 тысяч.
Бесплатный доступ и легкая навигация
В работе со словарями есть жесткое правило: ничего не менять, кроме устранения технических ошибок. Каждый словарь — памятник, слепок времени и должен сохранить свою аутентичность. При сканировании допускаются ошибки, поэтому вычитка текста — сложнейший труд, объяснила Мария Каленчук. Так, в Этимологическом словаре, например, встречаются слова из десятков языков — древнегреческого, иврита, персидского, арабского и других, а также множество шрифтов.

В архитектуре словарного фонда лингвисты сделали упор на легкую навигацию с интерактивными элементами, которая позволит пользователю нырнуть в базе на разную временную глубину. Одно дело — посмотреть написание слова «апелляция», другое — проследить, как изменялось слово на протяжении 300 лет, или погрузиться в первую треть XIX века. Для удобства пользователей предложено пять модулей.
Человек набирает слово в поисковой строке и открывает словарную статью. Ее содержание делится на десять зон: заголовочная, информация о формах данного слова, ударение, толкование значения, иллюстрация, фразеология. Специальная система знаков — тегов — помогает пользователю найти то, что ему нужно. Эта работа — результат ручной разметки, произведенной лингвистами с языковой единицей.
Словарный фонд показывает как современное состояние слова, так и его историю с древнерусского периода, динамику его жизни, отметила лингвист. Это ведь интересно не только языковедам, но и обычным людям. Язык живой. Меняются значения слов, грамматические формы и даже ударение. Это показывают орфоэпические словари 1983 и 2015 годов.
Дело не в моде, не в невежестве пользователей, а во внутренних закономерностях развития языка. Ударение становится подвижным, причем в разных словах оно меняется с разной скоростью. Например, ударение в слове «дружишь» было на втором слоге, а потом перешло на первый, так же как «варит», «солит», «катит» («уж зима катит в глаза« — у Крылова).
Языковой дайвинг во тьму веков
Первый модуль — базовый, поэтому он рассчитан на самую широкую аудиторию, включая «чайников». Рядовой пользователь при обращении к словарю прежде всего интересуется четырьмя опциями: правописание, ударение, значение, изменение по формам. Чаще спрашивают, как пишется «брюнет» — через «е» или «э» или на каком слоге ударение в слове «жалюзи».

Остальные модули предназначены для знатоков. Второй, расширенный, представляет слово в различных аспектах: в сочетании с другими словами, вхождение в фразеологизмы, синонимы, антонимы и так далее.
Третий модуль раскрывает историю и этимологию слова. Для исполнителей он оказался самым сложным, призналась Мария Каленчук. Причина в том, что в поиске слово пишется в современной орфографии, а в словарях разных эпох оно обозначено иначе. Так, слово «артиллерия» Петр I писал восемью способами, потому что в XVIII веке устойчивой орфографии не было. Разработчикам пришлось искать вариант, как примирить орфографии, чтобы поиск находил искомое. Таких сложных случаев много, и они требуют ручной работы, с которой алгоритмы не справляются. Вот еще пример: слово „пескарь“ от латинского рisces (»рыба»). Раньше его писали через «и», сегодня — через «е».
Не надо заходить в архивы
Четвертый модуль — простой. Захотел журналист сверить слово со словарем Ушакова — его и запрашивает. Последний, пятый, модуль — сопоставительный. Он позволяет сравнить данные из разных словарей, например, о месте ударения, написании, вхождении во фразеологизмы и прочее.
Программистам придет на помощь искусственный интеллект. Хотя с алгоритмами сильно не разгуляешься из-за обилия исключений в русском языке, заметила Мария Каленчук. Ударение, например, свободное, да еще меняется во времени в отличие от других языков — французского, чешского, польского.

В феврале Минобрнауки подготовило проекты двух ведомственных приказов — о порядке определения списка словарей для наполнения ГИС НСФ и порядке обновления информации в словарях. Ведомство будет формировать список словарей на основе предложений экспертной рабочей группы, а РАН — согласовывать. Право рекомендовать словари получат научные организации и вузы, в составе которых не менее десяти кандидатов и докторов филологических наук. На рассмотрение отводится пять дней в ведомстве и 30 - в РАН.
Если словарный фонд в целом должен способствовать повышению грамотности россиян, то осторожность в использовании заимствованных слов — еще одна линия защиты нашего языка. Правительственная комиссия по русскому языку дала поручение проверить иностранные заимствования, которые имеют синонимы в русском языке, и создать словари для использования языка в государственной функции, сообщила Мария Каленчук, входящая в эту комиссию.
Стоп дублетам при «равносильных словах»
Лингвисты из Санкт-Петербурга уже выполнили задание Правительства и отправили на экспертизу новый электронный словарь иностранных слов. О нем «Парламентской газете» рассказала его автор - замдиректора по научной работе Института лингвистических исследований РАН Марина Приемышева.
В России уже полтора десятка лет не обновлялся словарь иностранных слов, рассказала лингвист. Ее институт уже 50 лет ведет направление — неография и выпускает словари новых слов. За полвека они зафиксировали 120 тысяч новых слов. Особенно их поток увеличился в последнее десятилетие. Экспансия англицизмов — явление мировое и идет из нескольких сфер — экономики, бизнеса, культуры, информационных технологий, объяснила эксперт. К тому же увеличилось количество людей, знающих английский язык.

«Мы по заданию Правительства подготовили словарь иноязычных по происхождению слов, у которых нет общеупотребительных русских эквивалентов», — рассказала Марина Приемышева. Это требование закона о государственном русском языке поддерживает традиция, заложенная еще первым академическим толковым Словарем Академии Российской 1789-1793 годов. Лексикографы и сегодня исповедуют принцип — «без нужды при равносильных Славенскiх или Россійскіх словах не включать заимствования». Под ними подразумеваются дублирующие наименования, которые появляются под влиянием языковой моды.
Новички — брускетта и траволатор
Словарь иностранных слов содержит базовую часть иноязычной современной лексики из научной, политической, деловой, социальной и других областей жизни. Выбрано около 20 тысяч слов, где много терминологии. Полных синонимов, пояснила лингвист, в языке практически не бывает. Они хоть чем-то, но отличаются — либо стилистикой, либо значением. А вот заимствования, которые имеют общеупотребительные аналоги, в словник не попали. Оказывается, больше всего их в устной речи и жаргоне специалистов из сферы информационных технологий, интернета, экономики и бизнеса.
Марина Приемышева уверена, что словарь найдет место в НСФ по мере расширения платформы. В него, кстати, вошли новые слова: «брускетта», «абьюз», «квест», «вок«, а еще „модал“ — ткань, »начос« — мексиканские чипсы из кукурузы. Среди новичков также „палаццо“ в значении «брюки», »траволатор», «тортилья», «фриланс» и другие. Приживутся ли неологизмы в языке, как когда-то школа, тетрадь, портфель, кровать, пришедшие из Греции и Франции, покажет время. Интересно, что траволатор — горизонтально движущаяся дорожка — впервые появился в 1973 году в построенном тогда новом терминале ленинградского аэропорта Пулково. Но тогда его никто не называл траволатором. Для него вообще никакого слова не было, говорили, что это горизонтальный эскалатор, несмотря на явную нелепость такого определения.
Мы воюем за русский язык
Депутат Госдумы Александр Шолохов одобряет последние шаги государства по охране русского языка. «У нас будет словарный фонд, единые учебники по русскому языку и литературе, — напомнил он. — В феврале мы приняли в первом чтении закон о защите русского языка».
Очень важно, уверен он, чтобы в России русский язык как государственный использовался в информации для потребителей и рекламе, звучал в информационном эфире госСМИ, ТВ и радиоканалов. Россияне хотят слышать нормативную речь и не хотят, чтобы нам резали глаза иноязычные названия в сфере недвижимости. Те, что уже есть сегодня, останутся, но новых «кантри клабов», «гринвудов», «форест хаусов» не появится.
Иные скептики иронизируют, что депутатам больше заняться нечем, кроме как надписями на иностранном, усмехнулся парламентарий: «Они что, не понимают, что русский язык определяет идентичность и объединяет наш народ? Президент Владимир Путин не случайно заявил, что Россия в СВО, на линии боевого соприкосновения, борется за традиционные ценности и русский язык».
Но не надо беспокоиться, что защита русского языка законсервируют его. Осторожное регулирование не помешает свободе развития языка, уверен Шолохов. Оно позволит найти баланс между сохранением традиций и адаптацией к новым реалиям.