ООО «РУСКонсалт»

Подбор аналогов из Excel · внешние витрины

Сборка

сервер…

Параметры обработки

Порядок: нормализация (по желанию) → диапазон и постшаги → источники и фильтры → запуск. Кеши, параллельная проверка витрин и пороги релевантности задаются на сервере, не в этой форме.

Состояние формы (чекбоксы, радиокнопки, ползунок фильтрации, числа) запоминается в браузере на этом компьютере. Файл Excel и таблица результатов после перезагрузки страницы не восстанавливаются.

Настройки поиска

Шаг 1 · Нормализовать данные

Очистка строки и при совпадении с шаблоном — подстановка расшифровки из markings.json. «Нормализовать (предпросмотр)» показывает было / стало / текст запроса; «Применить и сохранить в Excel» перезаписывает колонку «Наименование» в копии файла. После этого переходите к шагу 2.

Шаг 2 · настройки поиска и подбора

Строки в диапазоне

На что влияет. Это «бюджет» времени на всю обработку одной строки Excel: запросы к поисковикам (DuckDuckGo HTML; при включённых опциях — Яндекс и расширенный DDG), загрузка и разбор страниц витрин (в т.ч. повтор через браузер при антиботе), перебор запасных формулировок запроса и при включённой галочке — поиск по прайсам на найденных сайтах. Когда лимит исчерпан, строка может закрыться как «не найдено», даже если ссылки из выдачи уже были, но цепочка проверок не успела до конца.

По умолчанию 750 с. Запас для «тяжёлых» позиций (трубопровод, крупные размеры, медленные магазины, несколько каналов поиска подряд). Так реже получаются обрывы посередине из‑за таймера, чем при коротких значениях вроде 240 с.

Когда уместно ~180–240 с. Быстрый тест настроек; простые однозначные товары; отключены расширенный поиск, Яндекс и прайсы; нужно ускорить весь файл ценой того, что сложные строки чаще упрутся в лимит и останутся без результата.

Когда поднять до 900–1200 с и выше. Турбо и при этом много запасных запросов; режим браузера «Расширенный»; частые отказы загрузки; длинная цепочка fallback по категории.

0 — без лимита (долгие или ночные прогоны). Приоритет: если в поле указано число (в т.ч. 750 по умолчанию), оно действует на прогон и перекрывает ANALOG_FINDER_MAX_ROW_SEC в среде. Переменная среды используется только когда поле пустое (например API без параметра).

Витрины: ссылки собираются из DDG (HTML), при включённых опциях — из Яндекса и расширенного DDG; списки выдачи на сервере кешируются на короткое время. Далее в пределе лимита проверяются страницы (часть URL — параллельно, см. сервер); среди прошедших фильтр выбирается карточка с учётом цены и схожести заголовка с запросом, а не только минимальной цены. Несколько источников увеличивают время на строку, но повышают шанс найти подходящую витрину.

География площадок

По умолчанию в выдаче DuckDuckGo и Яндекса берутся магазины из белого списка и домены .ru / .рф; часть зон (.de, .pl и др.) отсекается. Включите зарубежный режим, если нужны карточки на .com, в ЕС и т.п. Цены на странице могут быть не в рублях — проверяйте валюту.

Выключен по умолчанию: строки по одной, с задержкой — меньше 429 и обрывов; запасные формулировки запроса не урезаются отдельным полем (кроме общего потолка на сервере). Включённый турбо: несколько строк одновременно, быстрее весь файл, но выше нагрузка; у каждой строки короче хвост ссылок из выдачи и жёсткий лимит «запасных запросов» (поле ниже). При проблемах снижайте потоки и запасные запросы или отключите турбо.

Только при включённом турбо. Для стабильности обычно достаточно 4–5 потоков; 6–8 — если прогон без 429 и обрывов. 10–16 — только при очень устойчивом канале и готовности к блокировкам.

Учитывается только при включённом турбо. Если основной поиск не дал подходящей ссылки, по очереди пробуются альтернативные формулировки (сокращения артикула, без префиксов и т.п.) — не больше указанного числа. Больше значение повышает шанс найти аналог по «кривому» наименованию, но увеличивает число обращений к поисковикам и время на строку. Обычно хватает 8–12.

Для очень длинных прогонов большое число карточек в ленте раздувает память вкладки и может привести к её зависанию или сбросу. Включите опцию и задайте N — в DOM остаются только самые свежие N карточек строк; в Excel по-прежнему попадает полный результат (обрезка только визуальная).

Помимо основной ссылки и цены в колонках, в «Примечание» добавляются дополнительные витрины с ценой и URL (следующие по возрастанию цены, разные домены). Для строки можно задать своё число в колонке P файла (если есть); иначе используется это поле.

Браузер при антиботе

Если обычный запрос к витрине даёт пустую страницу или капчу, можно подгрузить HTML через встроенный браузер (Camoufox). Для оценки и КП при пометке «загрузка: браузер» цену и условия всё равно сверяйте по ссылке вручную.

0–1 — разная «глубина» проверки страницы; 2–3 в типовой установке сервера дают тот же охват, что и мягкий режим (смета/B2B, см. ANALOG_FINDER_VALIDATE_FS_CAP на сервере). 4 — нужны признаки заказа на сайте, пока не сработали исключения: «💰 Достаточно цены», «🧹 Прочее», короткая санитарная строка. Подробная таблица — в справке.

Для витрин с ценой без корзины: при ползунке 4 снимает обязательную кнопку «Купить». Имеет смысл для опта, прайсов на сайте, заявок по телефону. В примечании может быть пометка о типе загрузки.

Без «Достаточно цены»: для категорий Прочее, Трубопровод и Арматура цена с витрины принимается и без кнопки «Купить». Для остальных категорий используйте «💰 Достаточно цены».

Обработка... 0%

🎉 Обработка завершена!

Результаты в реальном времени

Найденные аналоги (в реальном времени)

Здесь появится прогресс по строкам

Ручной режим для строк без результата

Наименование в таблице можно прокручивать целиком. Не находит витрину — упростите формулировку (Ду, тип, без лишних кодов) и перезапустите строку в режиме «Весь диапазон заново». Если несколько строк с одним и тем же наименованием — заполните одну и нажмите «Скопировать в…» под полями.