Market NinjaMarket Ninja

Парсинг по списку ссылок

Как использовать режим Bulk List для массового сбора данных по списку URL-адресов или артикулов с маркетплейсов.

Режим «Список ссылок» позволяет за один запуск собрать данные сразу по множеству отдельных URL-адресов или артикулов — без необходимости открывать каждую страницу вручную.

Важно: Для запуска сбора данных расширение должно быть открыто именно на той странице маркетплейса, которую оно умеет парсить (так же, как и в режиме одиночной страницы). Если вы откроете расширение на пустой вкладке или на неподдерживаемом сайте, режим будет недоступен. Ознакомьтесь с перечнем таких страниц с примерами в разделе Что можно парсить.

Когда использовать этот режим

Используйте режим «Список ссылок», когда нужно:

  • Отслеживать цены и остатки по конкретному перечню товаров конкурентов;
  • Собрать данные с произвольного набора карточек, не связанных одной категорией;
  • Выгрузить отзывы для заранее отобранного списка SKU;
  • Автоматически обработать выгрузку из таблицы (CRM, Excel) с уже готовыми ссылками.

Если же нужно собрать всё содержимое категории или результатов поиска, используйте обычный режим парсинга списков.


Как активировать режим

В верхней части окна расширения расположен переключатель-«пилюля»:

  • Текущая страница — стандартный режим; расширение парсит страницу, открытую в браузере.
  • Список ссылок — режим пакетной обработки; вы вводите ссылки вручную.

Нажмите «Список ссылок», чтобы перейти в этот режим. Переключатель заблокирован во время активного парсинга.


Ввод ссылок

Вставьте ссылки в текстовое поле

Каждая ссылка — на отдельной строке. Поддерживаются:

  • Полные URL карточек товаров (например, https://www.wildberries.ru/catalog/12345678/detail.aspx);
  • Полные URL страниц листингов (категории, поиск, витрины продавцов);
  • Числовые артикулы (SKU) для Wildberries и Ozon (например, 12345678);
  • Буквенно-цифровые артикулы для Lamoda (например, RTLADJ766102).

Артикулы автоматически конвертируются в полные URL для текущего маркетплейса.

Проверьте счётчик валидных ссылок

В правом нижнем углу поля ввода отображается счётчик N / лимит, показывающий, сколько корректных ссылок распознано и какой у вас лимит по тарифу.

Исправьте ошибки валидации (если есть)

Под полем ввода появятся предупреждения при наличии:

  • Некорректных строк — строки, не являющиеся валидным URL или артикулом;
  • Ссылок с другого маркетплейса — только ссылки на текущий сайт принимаются за один запуск;
  • Строк сверх лимита — лишние строки игнорируются.
Ссылки должны быть с одного маркетплейса. Если расширение открыто на вкладке Wildberries, принимаются только ссылки на wildberries.ru.

Загрузка ссылок из файла (Premium)

Пользователи тарифа Premium могут загрузить файл вместо ручного ввода:

  1. Нажмите кнопку «Прикрепить файл» в нижней части поля ввода;
  2. Выберите файл в формате .txt или .csv — каждая ссылка на отдельной строке;
  3. Содержимое файла автоматически попадёт в поле ввода и пройдёт валидацию.

На бесплатном тарифе кнопка загрузки файла недоступна.


Лимиты по тарифам

ТарифМаксимум ссылок за запускЗагрузка файла
Бесплатный3
Premium500
Ссылки сверх лимита отбрасываются автоматически. Увеличить лимит можно, перейдя на тариф Premium.

Выбор режима данных

После ввода ссылок в панели управления появится выпадающий список «Режим данных» с двумя вариантами:

Сбор расширенных данных о товарах: характеристики, цены, информация о продавце, рейтинги и прочее.

Соответствует режиму «Расширенные данные» для листингов и «Только этот артикул» для карточек товаров.

Доступен на бесплатном тарифе и Premium.

Сбор текстов отзывов для каждой ссылки из списка.

Этот режим доступен только на тарифе Premium. Бесплатные пользователи увидят ограничение в виде пробного режима (не более 5 отзывов на товар).

Системные колонки в режиме «Список ссылок»

В отличие от стандартного режима «Текущая страница», в режиме «Список ссылок» автоматически становятся видимыми две дополнительные колонки:

КолонкаОписание
МаркетплейсНазвание маркетплейса, с которого получена строка данных
URL источникаКонкретный URL, который был обработан для получения этой строки

Это позволяет точно определить происхождение каждой строки при работе с большим списком ссылок.

В режиме «Текущая страница» эти колонки скрыты, так как источник всегда один.

Обновлено

На странице