Материал из Chipwiki
Перейти к: навигация, поиск
Мануал:Парсинг альбомов с bandcamp
Версия от 08:08, 26 декабря 2025; Pixelrat (обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

icon back.png Обратно

Для парсинга страниц релизов с bandcamp возможно использовать python-скрипт:

Требования:

  • установить python3;
  • установить через pip необходимые библиотеки: pip install beautifulsoup4 selenium ;
    • в версии для скачивания обложек может понадобиться модуль requests: pip install requests;
  • в зависимости от используемого бразуера скачать драйвер и положить его в папку со скриптом;
    • Chromedriver - для Chrome;
    • Geckodriver - для Firefox;
    • при необходимости в строчке с geckodriver_path или chrome_driver_path пропишите полный путь к драйверу;
  • создать файл links.txt - в этот файл прописывать ссылки на альбомы.

По желанию можно создать bat-файл/кнопку запуска с командой "python chipwiki-bandcamp.py".

Извлечённые данные будут загружены в папку bandcamp_output в почти готовом виде.

Внимание! Скрипт:

  • не заполняет поля Формат, Лейбл, Каталог;
  • не разделяет исполнителей, если их несколько;
  • не переводит описание альбома и дополнительную информацию;
  • не ищет ссылки в других сервисах и на discogs.

Также для сборников требуется убрать поле Исполнитель и поменять {{Альбом на {{Сборник

Всё это надо выполнять в ручном режиме.