Как просканировать сайт на англицизмы: полное руководство
Вступление 168-ФЗ в силу поставило перед владельцами сайтов конкретную задачу: найти и устранить все необоснованные англицизмы и иноязычные заимствования. Но как это сделать, если на сайте сотни или тысячи страниц? В этой статье мы разберём все доступные методы сканирования — от ручной проверки до автоматизированных инструментов.
Почему ручная проверка не подходит для большинства сайтов
На первый взгляд кажется, что достаточно просто просмотреть каждую страницу сайта и отметить англицизмы. Однако на практике этот подход сталкивается с серьёзными ограничениями:
- Масштаб. Средний коммерческий сайт содержит от 50 до 500 страниц. Каталог интернет-магазина может включать тысячи карточек товаров.
- Скрытые элементы. Англицизмы могут скрываться в meta-тегах, alt-атрибутах, placeholder-текстах форм, уведомлениях и модальных окнах.
- Человеческий фактор. Люди привыкли к англицизмам и часто не замечают их. Слово «менеджер» может показаться русским, но у него есть аналог — «управляющий».
- Обновления. Контент сайта постоянно обновляется, и проверка, проведённая месяц назад, может быть уже неактуальной.
Подробнее о различиях между методами проверки читайте в нашей статье Разница между ручной и автоматической проверкой.
Что именно ищет сканер
Прежде чем запускать проверку, важно понимать, какие элементы анализируются. Качественный сканер проверяет следующие области:
Видимый контент
- Заголовки всех уровней (h1–h6)
- Основной текст страниц
- Подписи к изображениям и видео
- Тексты кнопок и ссылок
- Элементы навигации и меню
- Футер и боковые панели
Скрытые элементы
- Meta title и meta description
- Alt-атрибуты изображений
- Placeholder-тексты в формах ввода
- Сообщения об ошибках валидации
- Всплывающие подсказки (tooltips)
- Cookie-баннеры и уведомления
Динамический контент
- Модальные окна
- Выпадающие меню
- Содержимое табов и аккордеонов
- Результаты AJAX-запросов
- Чат-виджеты
Пошаговая инструкция: сканирование через КириллоСкан
Наш сервис КириллоСкан создан специально для проверки сайтов на соответствие 168-ФЗ. Вот как им пользоваться:
Шаг 1: Введите адрес сайта
Перейдите на главную страницу и введите URL вашего сайта в поле сканера. Можно указать как конкретную страницу, так и домен целиком. При сканировании домена система автоматически обойдёт все доступные страницы.
Шаг 2: Дождитесь результатов
Сканирование занимает от 30 секунд (для одной страницы) до нескольких минут (для крупного сайта). В процессе вы увидите индикатор прогресса и текущее количество найденных проблем.
Шаг 3: Изучите отчёт
Отчёт содержит детальную информацию о каждом нарушении:
- Тип нарушения (англицизм, отсутствие перевода, размер шрифта)
- Местоположение на странице (URL и CSS-селектор)
- Текст, содержащий нарушение
- Рекомендация по исправлению
- Приоритет (критический, важный, рекомендация)
Шаг 4: Исправьте нарушения
Начните с критических проблем — они с наибольшей вероятностью приведут к штрафу. Для замены англицизмов используйте наш словарь замен, который содержит сотни русских аналогов распространённых заимствований.
Шаг 5: Повторите сканирование
После внесения исправлений запустите сканер повторно, чтобы убедиться, что все проблемы устранены и не появились новые.
Альтернативные методы проверки
Сканирование через Telegram-бота
Если вам удобнее работать в мессенджере, воспользуйтесь нашим Telegram-ботом. Просто отправьте URL — и получите краткий отчёт прямо в чат. Это удобно для быстрых проверок отдельных страниц.
Браузерные расширения
Для оперативной проверки во время работы над сайтом можно использовать браузерные расширения, которые подсвечивают иноязычные элементы прямо на странице. Однако они не заменяют полноценное сканирование, так как работают только с текущей страницей.
Поиск по коду
Разработчики могут использовать регулярные выражения для поиска латиницы в исходном коде. Этот метод хорош для поиска технических элементов (meta-теги, alt-атрибуты), но требует технических навыков и не учитывает контекст.
Какие слова являются нарушением, а какие — нет
Не все иноязычные слова на сайте являются нарушением. Закон разграничивает допустимые и недопустимые заимствования:
| Допустимо | Нарушение |
|---|---|
| Интернет, компьютер, файл | Дедлайн, фидбек, митинг |
| Зарегистрированные товарные знаки | Английские слоганы без перевода |
| Научные термины без аналога | Маркетинговые англицизмы |
| Слова из нормативных словарей | Жаргонизмы и сленг |
Частые вопросы о сканировании
Как часто нужно сканировать сайт?
Рекомендуем проводить полное сканирование после каждого обновления контента, но не реже одного раза в месяц. Если на сайте часто появляются новые товары или статьи, настройте автоматическое сканирование по расписанию.
Сканер находит слишком много «нарушений» — как отфильтровать ложные срабатывания?
КириллоСкан использует систему исключений: зарегистрированные товарные знаки, научные термины и слова из нормативных словарей автоматически исключаются из отчёта. Если вы обнаружили ложное срабатывание, вы можете добавить слово в белый список.
Нужно ли сканировать мобильную версию отдельно?
Если ваш сайт использует адаптивный дизайн, достаточно просканировать основную версию — контент одинаковый. Если у вас отдельная мобильная версия (например, m.example.ru), её нужно проверить отдельно.
Что делать после сканирования
Получив отчёт, не торопитесь исправлять всё сразу. Составьте план действий:
- Оцените масштаб проблем — определите общее количество нарушений и их распределение по страницам.
- Разделите на приоритеты — критические нарушения на главной странице важнее мелких замечаний в глубоких разделах.
- Оцените ресурсы — возможно, вам понадобится помощь копирайтера для качественного перевода. Узнайте сколько стоит русификация сайта.
- Установите сроки — составьте календарный план исправлений.
- Контролируйте результат — после каждого этапа запускайте повторное сканирование.
Заключение
Сканирование сайта на англицизмы — это первый и обязательный шаг к соответствию 168-ФЗ. Автоматические инструменты вроде КириллоСкан делают этот процесс быстрым и точным. Не откладывайте проверку — запустите сканер сейчас и узнайте реальное состояние вашего сайта.