Материал из Chipwiki
Перейти к: навигация, поиск
Мануал:Парсинг альбомов с bandcamp — различия между версиями
м
 
Строка 2: Строка 2:
  
 
Для парсинга страниц релизов с bandcamp возможно использовать python-скрипт:
 
Для парсинга страниц релизов с bandcamp возможно использовать python-скрипт:
* [https://chipwiki.ru/static/script-windows/chipwiki-bandcamp.py chipwiki-bandcamp.py] (Windows, Chrome/Chromedriver)
+
* Без скачивания обложки
* [https://chipwiki.ru/static/script-linux/chipwiki-bandcamp.py chipwiki-bandcamp.py] (Linux, Firefox/Geckodriver)
+
** [https://chipwiki.ru/static/script-windows/chipwiki-bandcamp.py chipwiki-bandcamp.py] (Windows, Chrome/Chromedriver)
 +
** [https://chipwiki.ru/static/script-linux/chipwiki-bandcamp.py chipwiki-bandcamp.py] (Linux, Firefox/Geckodriver)
 +
* Со скачиванием обложки:
 +
** [https://chipwiki.ru/static/script-windows/chipwiki-bandcamp-cover.py chipwiki-bandcamp-cover.py] (Windows, Chrome/Chromedriver)  
 +
** [https://chipwiki.ru/static/script-linux/chipwiki-bandcamp-cover.py chipwiki-bandcamp-cover.py] (Linux, Firefox/Geckodriver)
  
 
Требования:
 
Требования:
 
* установить python3;
 
* установить python3;
* установить через pip необходимые библиотеки: pip install beautifulsoup4 selenium;
+
* установить через pip необходимые библиотеки: pip install beautifulsoup4 selenium ;
 +
** в версии для скачивания обложек может понадобиться модуль requests: pip install requests;
 
* в зависимости от используемого бразуера скачать драйвер и положить его в папку со скриптом;
 
* в зависимости от используемого бразуера скачать драйвер и положить его в папку со скриптом;
 
** [https://googlechromelabs.github.io/chrome-for-testing/ Chromedriver] - для Chrome;
 
** [https://googlechromelabs.github.io/chrome-for-testing/ Chromedriver] - для Chrome;
 
** [https://github.com/mozilla/geckodriver/releases Geckodriver] - для Firefox;
 
** [https://github.com/mozilla/geckodriver/releases Geckodriver] - для Firefox;
 +
** при необходимости в строчке с geckodriver_path или chrome_driver_path пропишите полный путь к драйверу;
 
* создать файл links.txt - в этот файл прописывать ссылки на альбомы.
 
* создать файл links.txt - в этот файл прописывать ссылки на альбомы.
  
 
По желанию можно создать bat-файл/кнопку запуска с командой "python chipwiki-bandcamp.py".
 
По желанию можно создать bat-файл/кнопку запуска с командой "python chipwiki-bandcamp.py".
  
Извлечённые данные будут загружены в папку bandcamp_output в виде текстовых файлов в почти готовом виде.
+
Извлечённые данные будут загружены в папку bandcamp_output в почти готовом виде.
  
Внимание! Скрипт:
+
<red>Внимание!</red> Скрипт:
* не скачивает обложки (в России блокировка по их адресам);
 
 
* не заполняет поля Формат, Лейбл, Каталог;
 
* не заполняет поля Формат, Лейбл, Каталог;
 
* не разделяет исполнителей, если их несколько;
 
* не разделяет исполнителей, если их несколько;
 
* не переводит описание альбома и дополнительную информацию;
 
* не переводит описание альбома и дополнительную информацию;
 
* не ищет ссылки в других сервисах и на discogs.
 
* не ищет ссылки в других сервисах и на discogs.
 +
 +
Также для сборников требуется убрать поле Исполнитель и поменять <nowiki>{{Альбом</nowiki> на <nowiki>{{Сборник</nowiki>
  
 
Всё это надо выполнять в ручном режиме.
 
Всё это надо выполнять в ручном режиме.

Текущая версия на 08:08, 26 декабря 2025

icon back.png Обратно

Для парсинга страниц релизов с bandcamp возможно использовать python-скрипт:

Требования:

  • установить python3;
  • установить через pip необходимые библиотеки: pip install beautifulsoup4 selenium ;
    • в версии для скачивания обложек может понадобиться модуль requests: pip install requests;
  • в зависимости от используемого бразуера скачать драйвер и положить его в папку со скриптом;
    • Chromedriver - для Chrome;
    • Geckodriver - для Firefox;
    • при необходимости в строчке с geckodriver_path или chrome_driver_path пропишите полный путь к драйверу;
  • создать файл links.txt - в этот файл прописывать ссылки на альбомы.

По желанию можно создать bat-файл/кнопку запуска с командой "python chipwiki-bandcamp.py".

Извлечённые данные будут загружены в папку bandcamp_output в почти готовом виде.

Внимание! Скрипт:

  • не заполняет поля Формат, Лейбл, Каталог;
  • не разделяет исполнителей, если их несколько;
  • не переводит описание альбома и дополнительную информацию;
  • не ищет ссылки в других сервисах и на discogs.

Также для сборников требуется убрать поле Исполнитель и поменять {{Альбом на {{Сборник

Всё это надо выполнять в ручном режиме.