kmftools

1.7 KiB

Raw Permalink Blame History Unescape Escape

ChatGPT Project Context – Bookscraper / Celery Branch

(Plaatsen in /docs/CHATGPT_CONTEXT.md of in de repo root)

Scraper Status (NIET AANPASSEN ZONDER TOESTEMMING)

De Python-based bookscraper is volledig functioneel. De volgende onderdelen zijn stabiel en mogen niet worden overschreven, herschreven of opgeschoond zonder expliciete toestemming:

prepare_scripts() genereert drie scripts:

say.txt: alleen het TTS-script (bash, timestamps, Sinji voice, safe)

makebook.txt: alleen m4b merge + move

allinone.txt: TTS + merge + move

Volume-structuur: v1, v2, v3, …

Chapter-output:

Chapter 1 bevat een header:

URL: Description:

Overige chapters hebben alleen de tekst

Rate limiter werkt

Chapter parsing werkt

Description parsing werkt

Cover download werkt

Skiplogica werkt correct

Ontwikkelregels voor ChatGPT

Nooit bestaande werkende code verwijderen

Geen stille rewrites

Geen herstructurering zonder toestemming

Wijzigingen worden minimalistisch en doelgericht toegepast

Bij voorkeur veranderingen in diff/patch-stijl

Altijd aangeven welke bestanden worden geraakt

Directorystructuur behouden: output///v1 etc.

Huidige Focus: celery_branch

ChatGPT moet zich richten op:

Celery worker architectuur verbeteren

Queueing & retry policies

Stabiliteit & observability

Integratie met scraping tasks

Zonder scraperfunctie te breken

Omgeving

Project draait in VS Code Dev Containers

Docker Compose structuren aanwezig

Celery + queue + worker containers in gebruik

Gebruik deze context in alle antwoorden.

find .
-not -path "/pycache"
-not -name ".pyc"
-print | sed -e 's;[^/]/; |;g;s;|;|--;'

1.7 KiB Raw Permalink Blame History Unescape Escape

1.7 KiB

Raw Permalink Blame History Unescape Escape