1.7 KiB
ChatGPT Project Context – Bookscraper / Celery Branch
(Plaatsen in /docs/CHATGPT_CONTEXT.md of in de repo root)
- Scraper Status (NIET AANPASSEN ZONDER TOESTEMMING)
De Python-based bookscraper is volledig functioneel. De volgende onderdelen zijn stabiel en mogen niet worden overschreven, herschreven of opgeschoond zonder expliciete toestemming:
prepare_scripts() genereert drie scripts:
say.txt: alleen het TTS-script (bash, timestamps, Sinji voice, safe)
makebook.txt: alleen m4b merge + move
allinone.txt: TTS + merge + move
Volume-structuur: v1, v2, v3, …
Chapter-output:
Chapter 1 bevat een header:
URL: Description:
Overige chapters hebben alleen de tekst
Rate limiter werkt
Chapter parsing werkt
Description parsing werkt
Cover download werkt
Skiplogica werkt correct
- Ontwikkelregels voor ChatGPT
Nooit bestaande werkende code verwijderen
Geen stille rewrites
Geen herstructurering zonder toestemming
Wijzigingen worden minimalistisch en doelgericht toegepast
Bij voorkeur veranderingen in diff/patch-stijl
Altijd aangeven welke bestanden worden geraakt
Directorystructuur behouden: output///v1 etc.
- Huidige Focus: celery_branch
ChatGPT moet zich richten op:
Celery worker architectuur verbeteren
Queueing & retry policies
Stabiliteit & observability
Integratie met scraping tasks
Zonder scraperfunctie te breken
- Omgeving
Project draait in VS Code Dev Containers
Docker Compose structuren aanwezig
Celery + queue + worker containers in gebruik
Gebruik deze context in alle antwoorden.
find .
-not -path "/pycache"
-not -name ".pyc"
-print | sed -e 's;[^/]/; |;g;s;|;|--;'