Workflow n8n Парсинг информации с сайта и ее обработка

Категория: Workflow n8n

Внимание!

Эти готовые Workflow для n8n представлены исключительно как примеры использования и демонстрации возможностей. Они не являются готовыми решениями для боевой эксплуатации.

Если вы хотите получить полноценную автоматизацию на базе n8n — мы с радостью поможем: адаптируем шаблон под ваши задачи, настроим интеграции, протестируем и внедрим решение.

Напишите, и обсудим детали.

Информация

У вас нет доступа к скачиванию файлов с нашего сервера, возможно необходимо зарегистрироваться или войти в свой аккаунт.

Регистрация

Наш Workflow автоматизирует процесс парсинга, очистки и обработки информации с сайта, используя AI-технологии, и сохраняет результаты в базу данных Supabase. Такой подход повышает эффективность работы с большими объемами данных и обеспечивает их актуальность.

Этот Workflow логическое продолжение автоматизации Загрузка структуры сайта CMS DataLife Engine в Supabase.

Логика работы: забираем ранее загруженный список страниц, очищаем от лишних данных, обрабатываем с помощью AI агента и загружаем в ту же таблицу базы данных.

Описание нод workflow

Get many rows - забираем список страниц из базы данных

Filter - в базе данных страницы разделены на katalog, static, news. Отфильтровываем нужное значение, это понадобится в очистке html кода т.к. селекторы на страницах могут быть разные.

Loop Over Items - цикл обработки страниц

Edit Fields - присваивается переменная url страницы и id записи

HTTP extract - парсинг страницы

HTML news (HTML main, HTML kategory) - очистка страницы по селекторам. Это одинаковые ноды, но разные по настройкам селекторов - для категории, для статических страниц, для новостей

AI Agent - обрабатывает полученный текст

Edit Fields1 - присваиваются переменные Заготовок, Текст, ID записи

Update a row - обновление той же таблицы базы данных, дозапись в соответствующие поля

После того, как в нашей базе данных есть вся информация по каждой странице сайта, то далее ее можно уже обрабатывать для дальнейшего использования, например выгружать в векторную базу данных.

Код sql запроса для создания таблицы:

CREATE TABLE sitepage ( id bigint NOT NULL, linkurl text, vid text, title text, fulltext text, imgurl text);

Поделиться с друзьями

Для стабильной работы всех наших разработок рекомендуем хостинг NetAngels

Интересное в Знаниях

Истории

Или войти через

Присоединяйтесь

Войти на сайт

Регистрация

Восстановить пароль

Или войти через

Workflow n8n Парсинг информации с сайта и ее обработка

Внимание!

Информация

Поделиться с друзьями

Навигация

Интересное в Знаниях

Забытая революция: как LISP изменил лицо ИИ навсегда

Веб-аналитика для бизнеса: какие метрики отслеживать кроме трафика

Как Норберт Винер и кибернетика изменили наше представление о ИИ

Забытый гений: как Элизабета Найт предсказала ИИ в 1951 году

Создайте свой собственный комикс за считанные минуты с AI Comic Factory

Услуги

Проекты

Компания