Авторизация
Забыли пароль?
Сброс пароля
Вернуться к авторизации

Как мы за день собрали инструмент для ии проверки сайта, уменьшили человеческий фактор и случайно нашли ошибку, скрывавшую полсайта от поисковиков

05 июня ‘26

Заказчик: АЙТИФОКС
Страница кейса/результат: https://itfox-web.ru/ru/cases/avtomatizirovali-proverku-saita-na-inostrannye-slova-s-pomoshchiu-ii-u?utm_source=ruward&utm_medium=referral

За 1 день собрали сценарий на Пайтоне для ии проверки сайта на иностранные слова и орфографию. 103 страницы проверяются за 10 минут. Попутно нашли баг, который годами скрывал полсайта от поисковиков. Весь проект — на бесплатных инструментах, без внешних подрядчиков.

Агентство-исполнитель кейса

АЙТИФОКС

Мы — ИТ-компания из Сочи. Не обещаем стопроцентной автоматизации там, где она невозможна — встраиваем проверку человеком. Используем создание кода с помощью ИИ для быстрого прототипирования. Наш подход: быстро проверить гипотезу и только потом масштабировать.

1. Вводная задача от заказчика, проблематика, цели

Мы — ИТ-компания из Сочи, развивающая собственный корпоративный сайт с материалами на русском и английском: десятки статей, историй, описаний услуг. С 1 марта 2026 года в России вступил в силу закон об ограничении иностранных слов. За использование слов не из разрешённого перечня — штраф. На сайте больше сотни страниц. Ручная вычитка такого объёма — гарантированно пропущенная ошибка: на сотой странице глаз уже не тот. Нам нужно было уменьшение человеческого фактора там, где оно критически влияет на риски для бизнеса.

Изначально всё выглядело проще. Мы пришли к тестировщикам с запросом на разовую проверку: просто найти англицизмы. Те быстро выгрузили текст, прогнали через сервисы и отдали список. Но почти сразу мы вернулись с новыми вводными: нужна не разовая акция, а постоянная система, которая проверяет ещё и орфографию, грамматику, пробелы, знаки препинания. И чтобы работала сама, по расписанию, без нашего участия.

Цель: быстро, без внешних подрядчиков и платных лицензий сделать инструмент для ии проверки сайта — систему, которая будет регулярно обходить сайт, выискивать запрещённые слова, орфографию и грамматику, и присылать готовый отчёт.

2. Описание реализации кейса и творческого пути по поиску оптимального решения

Тестировщик сел за ресёрч, выбрал ЛэнгвичТул — открытый сервис, смесь нейросетевого агента и лингвистической базы, — и за день написал сценарий на Пайтоне с использованием создания кода с помощью ИИ. Сценарий брал карту сайта, обходил страницы и прогонял текст через ЛэнгвичТул.

На старте мы упёрлись в неожиданную стену. Сценарий возвращал только 30 страниц из 103. Когда стали копать, выяснилось: половина сайта открывалась только по клику в браузере, а не по прямой ссылке. Для роботов — поисковых и нашего — эти страницы просто не существовали. Мы годами не знали, что контент не индексируется. Отправили баг команде фронтенда, те исправили — и сценарий впервые увидел все 103 страницы.

Дальше — итерационная доработка. ЛэнгвичТул ругался на заголовки без точек — добавили правило-исключение. Первая версия отчёта была неудобной, просто списком — переделали в структурированную страницу с аналитикой: где какое слово, на каких страницах, сколько всего уникальных заимствований. Настроили белый список разрешённых слов, которые система просто пропускает. Если завтра появится новый список — просто добавим его.

Мы не обещаем стопроцентной точности — это технологически невозможно. Поэтому в конвейере есть страховочный пояс — человек. Он открывает отчёт и принимает решение по каждой находке: исправить, пропустить или внести слово в белый список. Пара кликов — и сайт чист. Разница с ручной вычиткой колоссальная: раньше нужно было прочитать каждую из 103 страниц, теперь — просмотреть готовый список находок. На ручную вычитку ушли бы дни, здесь — минуты.

Сценарий полностью написан с использованием создания кода с помощью ИИ. Тестировщик описывал логику, нейросеть генерировала код, который тут же проверялся и дорабатывался. За счёт этого прототип собрали за день. Автоматизация ии разработки позволила не отвлекать серверную команду на раннем этапе.

Но есть нюанс: нейросеть не прибирает за собой, дописывает новое поверх старого. Кодовая база распухает. Мы прошли через несколько итераций: написали запрос — проверили — не подходит — добавили правки — проверили снова. Каждая итерация делала отчёт удобнее и точнее. Вывод: для прототипа — отлично, для стабильной работы — нужно профессиональное ревью и встройка в нормальную архитектуру.

Сейчас закладываем интеграцию в серверную часть: периодическая задача будет запускать сценарий раз в месяц и отправлять отчёт на почту. Никакого ручного запуска. Уменьшение человеческого фактора начинает работать на постоянной основе.

3. Результаты сотрудничества

103 страницы проверяются за 10 минут. Авторы, которые внутренне готовились к неделям ручной вычитки, получают готовый структурированный отчёт и точечно правят найденное. Мы ожидали, что машина отловит процентов 70 ошибок — по факту точность и полнота оказались выше.

Попутно нашли и исправили баг, который годами скрывал полсайта от поисковиков. Материалы для зарубежных заказчиков, статьи, истории — всё снова доступно для индексации.

Весь проект реализован на бесплатных инструментах, без внешних подрядчиков и платных лицензий. ЛэнгвичТул — бесплатный, Пайтон — открытый язык, создание кода через нейросеть — тоже без дополнительных затрат. Сценарий написан за 1 день силами одного тестировщика. Уменьшение человеческого фактора достигнуто: рутина ушла, риск штрафов под контролем, проверка работает на постоянной основе.

4. Заключение

Механика не привязана к заимствованиям или конкретному рынку. Та же связка «обход сайта + лингвистический анализ + отчёт» работает для наблюдения за терминологией бренда, требованиями поисковиков, обновлением контента после смены названия. ЛэнгвичТул поддерживает десятки языков — инструмент можно приспособить под законы любой страны. Заменили список запрещённых слов на список терминов бренда — получили контроль фирменного стиля. Добавили правила проверки метатегов — получили SEO-мониторинг.

Мы не обещаем стопроцентной точности — встраиваем проверку человеком и белые списки. Слышим боль бизнеса: штрафы, невидимые материалы, тонны рутины. Уменьшение человеческого фактора — наша цель, а не просто слова. Используем создание кода с помощью ИИ для быстрой разработки прототипа. Автоматизация ии разработки — наш подход: быстро проверить предположение и только потом расширять. И попутно проверяем техническое здоровье сайта — такого подарка от ручной проверки не дождёшься.

Если вам нужна ии проверка сайта, которая снимет риски, уберёт рутину и попутно проверит техническое здоровье проекта — оставляйте заявку. Мы собираем такие инструменты за 1 день.

Агентство-исполнитель кейса

АЙТИФОКС

Мы — ИТ-компания из Сочи. Не обещаем стопроцентной автоматизации там, где она невозможна — встраиваем проверку человеком. Используем создание кода с помощью ИИ для быстрого прототипирования. Наш подход: быстро проверить гипотезу и только потом масштабировать.