Administration

← Retour

Log : 20260420_140000

OK
Durée : 8090s 8 OK 5367 annonces
clio_4 i20 berlingo c4 scenic 5008 fiesta nv200
2026-04-20 14:41:18 [INFO] [c4] [LLM DESC] [4/8] C4 (brand=citroen, pages=auto)
2026-04-20 14:41:18 [INFO] [c4] [LLM DESC] URL: https://www.leboncoin.fr/recherche?category=2&text=c4&price=min-11000&regdate=20...
2026-04-20 14:41:18 [INFO] [c4] [SEARCH] $ /home/ubuntu/app/.venv/bin/python /home/ubuntu/app/crawler/leboncoin_search_export.py --output-file /home/ubuntu/app/leboncoin_ads.csv --model c4
2026-04-20 14:41:19 [INFO] [c4] [SEARCH] Recuperation de la page 1 avec l'URL: https://www.leboncoin.fr/recherche?category=2&text=c4&price=min-11000&regdate=2013-max&mileage=min-150000&u_car_brand=CITROEN&seats=999999&u_car_model=CITROEN_C4%2CCITROEN_C4+Aircross%2CCITROEN_C4+Cactus%2CCITROEN_C4+Picasso%2CCITROEN_C4+SpaceTourer%2CCITROEN_C4+X&page=1
2026-04-20 14:41:21 [INFO] [c4] [SEARCH] 35 annonces recuperees (total: 35)
2026-04-20 14:41:21 [INFO] [c4] [SEARCH] Recuperation de la page 2 avec l'URL: https://www.leboncoin.fr/recherche?category=2&text=c4&price=min-11000&regdate=2013-max&mileage=min-150000&u_car_brand=CITROEN&seats=999999&u_car_model=CITROEN_C4%2CCITROEN_C4+Aircross%2CCITROEN_C4+Cactus%2CCITROEN_C4+Picasso%2CCITROEN_C4+SpaceTourer%2CCITROEN_C4+X&page=2
2026-04-20 14:41:24 [INFO] [c4] [SEARCH] 35 annonces recuperees (total: 70)
2026-04-20 14:41:24 [INFO] [c4] [SEARCH] Recuperation de la page 3 avec l'URL: https://www.leboncoin.fr/recherche?category=2&text=c4&price=min-11000&regdate=2013-max&mileage=min-150000&u_car_brand=CITROEN&seats=999999&u_car_model=CITROEN_C4%2CCITROEN_C4+Aircross%2CCITROEN_C4+Cactus%2CCITROEN_C4+Picasso%2CCITROEN_C4+SpaceTourer%2CCITROEN_C4+X&page=3
2026-04-20 14:41:27 [INFO] [c4] [SEARCH] 35 annonces recuperees (total: 105)
2026-04-20 14:41:27 [INFO] [c4] [SEARCH] Recuperation de la page 4 avec l'URL: https://www.leboncoin.fr/recherche?category=2&text=c4&price=min-11000&regdate=2013-max&mileage=min-150000&u_car_brand=CITROEN&seats=999999&u_car_model=CITROEN_C4%2CCITROEN_C4+Aircross%2CCITROEN_C4+Cactus%2CCITROEN_C4+Picasso%2CCITROEN_C4+SpaceTourer%2CCITROEN_C4+X&page=4
2026-04-20 14:41:29 [INFO] [c4] [SEARCH] 35 annonces recuperees (total: 140)
2026-04-20 14:41:29 [INFO] [c4] [SEARCH] Recuperation de la page 5 avec l'URL: https://www.leboncoin.fr/recherche?category=2&text=c4&price=min-11000&regdate=2013-max&mileage=min-150000&u_car_brand=CITROEN&seats=999999&u_car_model=CITROEN_C4%2CCITROEN_C4+Aircross%2CCITROEN_C4+Cactus%2CCITROEN_C4+Picasso%2CCITROEN_C4+SpaceTourer%2CCITROEN_C4+X&page=5
2026-04-20 14:41:33 [INFO] [c4] [SEARCH] 35 annonces recuperees (total: 175)
2026-04-20 14:41:33 [INFO] [c4] [SEARCH] Recuperation de la page 6 avec l'URL: https://www.leboncoin.fr/recherche?category=2&text=c4&price=min-11000&regdate=2013-max&mileage=min-150000&u_car_brand=CITROEN&seats=999999&u_car_model=CITROEN_C4%2CCITROEN_C4+Aircross%2CCITROEN_C4+Cactus%2CCITROEN_C4+Picasso%2CCITROEN_C4+SpaceTourer%2CCITROEN_C4+X&page=6
2026-04-20 14:41:35 [INFO] [c4] [SEARCH] 35 annonces recuperees (total: 210)
2026-04-20 14:41:35 [INFO] [c4] [SEARCH] Recuperation de la page 7 avec l'URL: https://www.leboncoin.fr/recherche?category=2&text=c4&price=min-11000&regdate=2013-max&mileage=min-150000&u_car_brand=CITROEN&seats=999999&u_car_model=CITROEN_C4%2CCITROEN_C4+Aircross%2CCITROEN_C4+Cactus%2CCITROEN_C4+Picasso%2CCITROEN_C4+SpaceTourer%2CCITROEN_C4+X&page=7
2026-04-20 14:41:36 [INFO] [c4] [SEARCH] 2 annonces recuperees (total: 212)
2026-04-20 14:41:36 [INFO] [c4] [SEARCH] Recuperation de la page 8 avec l'URL: https://www.leboncoin.fr/recherche?category=2&text=c4&price=min-11000&regdate=2013-max&mileage=min-150000&u_car_brand=CITROEN&seats=999999&u_car_model=CITROEN_C4%2CCITROEN_C4+Aircross%2CCITROEN_C4+Cactus%2CCITROEN_C4+Picasso%2CCITROEN_C4+SpaceTourer%2CCITROEN_C4+X&page=8
2026-04-20 14:41:38 [INFO] [c4] [SEARCH] Page 8 : aucune annonce, arret de la pagination.
2026-04-20 14:41:38 [INFO] [c4] [SEARCH] Termine : 212 annonces au total dans /home/ubuntu/app/leboncoin_ads_c4_20260420_144119.csv
2026-04-20 14:41:38 [INFO] [c4] [SEARCH] CSV : leboncoin_ads_c4_20260420_144119.csv
2026-04-20 14:41:38 [INFO] [c4] [IMPORT] $ /home/ubuntu/app/.venv/bin/python -m db.migrate_csv --input /home/ubuntu/app/leboncoin_ads_c4_20260420_144119.csv --db /home/ubuntu/app/db/lbc.sqlite --model c4
2026-04-20 14:41:38 [INFO] [c4] [IMPORT] Model override : c4
2026-04-20 14:41:38 [INFO] [c4] [IMPORT] MIGRATION CSV -> SQLite unifie
2026-04-20 14:41:38 [INFO] [c4] [IMPORT] Fichier: leboncoin_ads_c4_20260420_144119.csv
2026-04-20 14:41:38 [INFO] [c4] [IMPORT] Schéma initialisé dans /home/ubuntu/app/db/lbc.sqlite
2026-04-20 14:41:39 [INFO] [c4] [IMPORT] 212 lus, 212 inseres, 0 ignores, 0 erreurs
2026-04-20 14:41:39 [INFO] [c4] [IMPORT] TOTAL : 212 lus, 212 inseres — Base : /home/ubuntu/app/db/lbc.sqlite
2026-04-20 14:41:39 [INFO] [c4] [IMPORT] 13599 annonces en base
2026-04-20 14:41:39 [INFO] [c4] [AVAILABILITY] $ /home/ubuntu/app/.venv/bin/python /home/ubuntu/app/scripts/check_availability.py --csv /home/ubuntu/app/leboncoin_ads_c4_20260420_144119.csv --brand citroen --model c4 --db /home/ubuntu/app/db/lbc.sqlite
2026-04-20 14:41:39 [INFO] [c4] [AVAILABILITY] CHECK DISPONIBILITE — CSV: leboncoin_ads_c4_20260420_144119.csv, Brand: citroen, Model: c4
2026-04-20 14:41:39 [INFO] [c4] [AVAILABILITY] 210 list_id lus dans le CSV.
2026-04-20 14:41:39 [INFO] [c4] [AVAILABILITY] 216 annonces actives en base pour citroen c4.
2026-04-20 14:41:39 [INFO] [c4] [AVAILABILITY] 6 annonce(s) marquées indisponibles.
2026-04-20 14:41:39 [INFO] [c4] [AVAILABILITY] CSV: 210, Actives DB: 216, Absentes: 6
2026-04-20 14:41:39 [INFO] [c4] [AVAILABILITY] Marquees indisponibles: 6
2026-04-20 14:41:39 [INFO] [c4] [DETAIL] $ /home/ubuntu/app/.venv/bin/python -m crawler.leboncoin_ad_detail --model c4 --delay 0.5 --limit 200
2026-04-20 14:41:39 [INFO] [c4] [DETAIL] ENRICHISSEMENT AD DETAIL — Modele: c4 — Limite: 200
2026-04-20 14:41:39 [INFO] [c4] [DETAIL] Schéma initialisé dans /home/ubuntu/app/db/lbc.sqlite
2026-04-20 14:41:39 [INFO] [c4] [DETAIL] 2 annonce(s) à enrichir (modèle: c4)
2026-04-20 14:41:42 [INFO] [c4] [DETAIL] RESULTAT : 2 traitee(s), 2 enrichies, 0 introuvables, 0 erreurs
2026-04-20 14:41:42 [INFO] [c4] [STATS] $ /home/ubuntu/app/.venv/bin/python -m stats.main --model c4 --skip-plots
2026-04-20 14:41:43 [INFO] [c4] [STATS] ANALYSEUR LEBONCOIN — Base: /home/ubuntu/app/db/lbc.sqlite, Figures: /home/ubuntu/app/stats/c4/figures, Modele: c4, Graphiques: Non
2026-04-20 14:41:45 [INFO] [c4] [STATS] Using categorical units to plot a list of strings that are all parsable as floats or dates. If these strings should be plotted as numbers, cast to the appropriate data type before plotting.
2026-04-20 14:41:45 [INFO] [c4] [STATS] Using categorical units to plot a list of strings that are all parsable as floats or dates. If these strings should be plotted as numbers, cast to the appropriate data type before plotting.
2026-04-20 14:41:46 [INFO] [c4] [STATS] M05 — Extraction LLM des titres (GPT-5 Nano)
2026-04-20 14:41:46 [INFO] [c4] [STATS] Annonces sans evaluation LLM : 2
2026-04-20 14:41:59 [INFO] [c4] [STATS] HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"
2026-04-20 14:41:59 [INFO] [c4] [STATS] LLM OUTPUT batch 1/1: 2 resultats extraits (modele=gpt-5-nano)
2026-04-20 14:41:59 [INFO] [c4] [STATS] Resultats extraits : 2
2026-04-20 14:41:59 [INFO] [c4] [STATS] PureTech flaggues : 1
2026-04-20 14:41:59 [INFO] [c4] [STATS] Evaluations inserees : 2
2026-04-20 14:42:00 [INFO] [c4] [STATS]   stats_descriptives : 5 lignes insérées
2026-04-20 14:42:00 [INFO] [c4] [STATS]   modele_regression : 2 lignes insérées
2026-04-20 14:42:00 [INFO] [c4] [STATS]   referentiel_prix : 32 segments insérés
2026-04-20 14:42:00 [INFO] [c4] [STATS]   ads.deal_columns : 495 annonces mises à jour
2026-04-20 14:42:00 [INFO] [c4] [STATS] M06 — Extraction LLM des descriptions (GPT-5 Nano)
2026-04-20 14:42:00 [INFO] [c4] [STATS] Schéma initialisé dans /home/ubuntu/app/db/lbc.sqlite
2026-04-20 14:42:00 [INFO] [c4] [STATS] Champs actifs : 8
2026-04-20 14:42:00 [INFO] [c4] [STATS] Annonces Excellente/Bonne affaire sans analyse description : 1
2026-04-20 14:42:00 [INFO] [c4] [STATS] ━━━ LLM DESC SYSTEM PROMPT ━━━
Tu es un expert automobile français. On te donne des descriptions d'annonces de véhicules d'occasion avec leur identifiant.

Pour chaque annonce, extrais depuis la description les informations suivantes :
- courroie_changee : true si la courroie de distribution a été changée ou remplacée, false si explicitement non changée, null si non mentionné
- embrayage_change : true si l'embrayage est neuf ou a été remplacé, false si explicitement non changé, null si non mentionné
- travaux_recents : liste des travaux ou réparations récentes mentionnés dans la description (ex: 'freins refaits', 'pneus neufs', 'vidange faite'). Liste vide si aucun.
- negociabilite : négociable si le vendeur indique être ouvert aux offres, ferme si le prix est indiqué ferme, null si non mentionné
- contexte_vente : contexte notable de la vente s'il est mentionné (ex: 'urgent', 'déménagement', 'décès', 'achat neuf'). null si rien de notable
- nb_proprietaires : nombre de propriétaires du véhicule si mentionné (ex: 1 pour '1ère main', 2 pour '2ème main'). null si non mentionné
- options_description : liste des équipements et options cités dans la description (ex: 'GPS', 'Caméra recul', 'Clim auto', 'Toit ouvrant'). Liste vide si aucun.
- accidente : true si le véhicule a subi un accident, un choc, une collision, des airbags déclenchés ou une carrosserie endommagée mentionné explicitement. false si le vendeur indique explicitement non accidenté ou sans accident. null si non mentionné.

Règles :
- Extrais UNIQUEMENT ce qui est explicitement dans la description
- Ne déduis pas, n'invente pas
- Pour les champs de type liste, retourne une liste vide si rien n'est mentionné
- Conserve le list_id exact tel que fourni
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2026-04-20 14:42:00 [INFO] [c4] [STATS] ━━━ LLM DESC INPUT batch 1/1 (1 annonces) ━━━
3143608821: "Citroën c4 spacetourer 1.2 130 ch Shine Pack 7 Places /Suivi Citroën/Sièges massants/Caméra/Carplay monospace, blanc, 7 cv, 5 portes, première mise en circulation le 11/06/2019, garantie 6 mois.  À ne pas manquer : Caméra de recul, GPS Cartographique, Sièges arrière coulissants, Sièges avant massants  -NOS SERVICES ET PRESTATIONS-  Prix hors honoraires acheteur de 399 € et coût de la Carte Grise.  Découvrez le véhicule sous tous les angles sur le site Biwiz Garantie panne mécanique de 6 mois incluse, extension possible jusqu'à 60 mois Reprise de votre ancien véhicule Paiement sécurisé Service Carte Grise Solution de financement Livraison possible sur toute la France  Les informations délivrées dans cette annonce sont non contractuelles et données à titre indicatif  Services optionnels disponibles  🔹Pack Standard – 239 € TTC œ plein de carburant | Nettoyage First | Configuration véhicule  🔹Pack Premium – 439 € TTC(¹) Plein de carburant | Nettoyage Premium | Garantie 12 mois | Configuration véhicule  🔹Label fiable ou rembourser selon éligibilité des véhicules, rapprochez-vous de votre conseiller pour en savoir plus.  ___________________________________________________________________ (¹) Tarif pour les véhicules deux roues motrices dont la valeur de vente est inférieure à 60 000 € TTC et hors véhicules d'exception ainsi que Jaguar et Land Rover.  7 places  OPTIONS ET ÉQUIPEMENTS : Audio - Télécommunications :   -  Appel d'Urgence Localisé   -  Radio   -  Services connectés   - ..."
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2026-04-20 14:42:12 [INFO] [c4] [STATS] HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"
2026-04-20 14:42:12 [INFO] [c4] [STATS] ━━━ LLM DESC OUTPUT batch 1/1 (1 résultats, modèle=gpt-5-nano) ━━━
[
  {
    "list_id": "3143608821",
    "courroie_changee": null,
    "embrayage_change": null,
    "travaux_recents": [],
    "negociabilite": null,
    "contexte_vente": null,
    "nb_proprietaires": null,
    "options_description": [
      "Caméra de recul",
      "GPS Cartographique",
      "Sièges arrière coulissants",
      "Sièges avant massants",
      "Caméra",
      "Carplay",
      "Appel d'Urgence Localisé",
      "Radio",
      "Services connectés"
    ],
    "accidente": null
  }
]
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2026-04-20 14:42:12 [INFO] [c4] [STATS] Batch persisté : 1 évaluation(s) sauvegardée(s)
2026-04-20 14:42:12 [INFO] [c4] [STATS] Évaluations insérées : 1
2026-04-20 14:42:12 [INFO] [c4] [STATS] ANALYSE TERMINEE en 16.9s — 495 annonces (run #695) — Modele: c4
2026-04-20 14:42:13 [INFO] [c4] [LLM] $ /home/ubuntu/app/.venv/bin/python -m stats.m05_llm_title_analysis --model c4
2026-04-20 14:42:13 [INFO] [c4] [LLM] M05 — Extraction LLM des titres (GPT-5 Nano)
2026-04-20 14:42:13 [INFO] [c4] [LLM] Annonces sans evaluation LLM : 0
2026-04-20 14:42:13 [INFO] [c4] [LLM] Toutes les annonces ont deja ete analysees.
2026-04-20 14:42:13 [INFO] [c4] [LLM DESC] $ /home/ubuntu/app/.venv/bin/python -m stats.m06_llm_description_analysis --model c4
2026-04-20 14:42:14 [INFO] [c4] [LLM DESC] M06 — Extraction LLM des descriptions (GPT-5 Nano)
2026-04-20 14:42:14 [INFO] [c4] [LLM DESC] Schéma initialisé dans /home/ubuntu/app/db/lbc.sqlite
2026-04-20 14:42:14 [INFO] [c4] [LLM DESC] Champs actifs : 8
2026-04-20 14:42:14 [INFO] [c4] [LLM DESC] Annonces Excellente/Bonne affaire sans analyse description : 0
2026-04-20 14:42:14 [INFO] [c4] [LLM DESC] Toutes les annonces éligibles ont déjà été analysées.