From f5fdcbebf9734c02cb0d9c314cebba1358d1b4f6 Mon Sep 17 00:00:00 2001 From: "peter.fong" Date: Sat, 29 Nov 2025 21:19:45 +0000 Subject: [PATCH] chatgpt context meegegeven. --- bookscraper/CHATGPT_CONTEXT.md | 87 ++++++++++++++++++++++++++++++++++ 1 file changed, 87 insertions(+) create mode 100644 bookscraper/CHATGPT_CONTEXT.md diff --git a/bookscraper/CHATGPT_CONTEXT.md b/bookscraper/CHATGPT_CONTEXT.md new file mode 100644 index 0000000..4aeb9d6 --- /dev/null +++ b/bookscraper/CHATGPT_CONTEXT.md @@ -0,0 +1,87 @@ +ChatGPT Project Context – Bookscraper / Celery Branch + +(Plaatsen in /docs/CHATGPT_CONTEXT.md of in de repo root) + +1. Scraper Status (NIET AANPASSEN ZONDER TOESTEMMING) + +De Python-based bookscraper is volledig functioneel. +De volgende onderdelen zijn stabiel en mogen niet worden overschreven, herschreven of opgeschoond zonder expliciete toestemming: + +prepare_scripts() genereert drie scripts: + +say.txt: alleen het TTS-script (bash, timestamps, Sinji voice, safe) + +makebook.txt: alleen m4b merge + move + +allinone.txt: TTS + merge + move + +Volume-structuur: v1, v2, v3, … + +Chapter-output: + +Chapter 1 bevat een header: + +URL: +Description: + + +---------------------------------------- + + +Overige chapters hebben alleen de tekst + +Rate limiter werkt + +Chapter parsing werkt + +Description parsing werkt + +Cover download werkt + +Skiplogica werkt correct + +2. Ontwikkelregels voor ChatGPT + +Nooit bestaande werkende code verwijderen + +Geen stille rewrites + +Geen herstructurering zonder toestemming + +Wijzigingen worden minimalistisch en doelgericht toegepast + +Bij voorkeur veranderingen in diff/patch-stijl + +Altijd aangeven welke bestanden worden geraakt + +Directorystructuur behouden: +output///v1 etc. + +3. Huidige Focus: celery_branch + +ChatGPT moet zich richten op: + +Celery worker architectuur verbeteren + +Queueing & retry policies + +Stabiliteit & observability + +Integratie met scraping tasks + +Zonder scraperfunctie te breken + +4. Omgeving + +Project draait in VS Code Dev Containers + +Docker Compose structuren aanwezig + +Celery + queue + worker containers in gebruik + +Gebruik deze context in alle antwoorden. + +find . \ + -not -path "*/__pycache__*" \ + -not -name "*.pyc" \ + -print | sed -e 's;[^/]*/; |;g;s;|;|--;'