Administration

← Retour

Log : 20260422_080000

OK
Durée : 1073s 8 OK 5379 annonces
clio_4 i20 berlingo c4 scenic 5008 fiesta nv200
2026-04-22 08:06:55 [INFO] [berlingo] [LLM DESC] [3/8] BERLINGO (brand=citroen, pages=auto)
2026-04-22 08:06:55 [INFO] [berlingo] [LLM DESC] URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=C...
2026-04-22 08:06:55 [INFO] [berlingo] [SEARCH] $ /home/ubuntu/app/.venv/bin/python /home/ubuntu/app/crawler/leboncoin_search_export.py --output-file /home/ubuntu/app/leboncoin_ads.csv --model berlingo
2026-04-22 08:06:55 [INFO] [berlingo] [SEARCH] Recuperation de la page 1 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=1
2026-04-22 08:06:58 [INFO] [berlingo] [SEARCH] 35 annonces recuperees (total: 35)
2026-04-22 08:06:58 [INFO] [berlingo] [SEARCH] Recuperation de la page 2 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=2
2026-04-22 08:07:01 [INFO] [berlingo] [SEARCH] 35 annonces recuperees (total: 70)
2026-04-22 08:07:01 [INFO] [berlingo] [SEARCH] Recuperation de la page 3 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=3
2026-04-22 08:07:03 [INFO] [berlingo] [SEARCH] 35 annonces recuperees (total: 105)
2026-04-22 08:07:03 [INFO] [berlingo] [SEARCH] Recuperation de la page 4 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=4
2026-04-22 08:07:06 [INFO] [berlingo] [SEARCH] 35 annonces recuperees (total: 140)
2026-04-22 08:07:06 [INFO] [berlingo] [SEARCH] Recuperation de la page 5 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=5
2026-04-22 08:07:10 [INFO] [berlingo] [SEARCH] 35 annonces recuperees (total: 175)
2026-04-22 08:07:10 [INFO] [berlingo] [SEARCH] Recuperation de la page 6 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=6
2026-04-22 08:07:15 [INFO] [berlingo] [SEARCH] 35 annonces recuperees (total: 210)
2026-04-22 08:07:15 [INFO] [berlingo] [SEARCH] Recuperation de la page 7 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=7
2026-04-22 08:07:18 [INFO] [berlingo] [SEARCH] 35 annonces recuperees (total: 245)
2026-04-22 08:07:18 [INFO] [berlingo] [SEARCH] Recuperation de la page 8 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=8
2026-04-22 08:07:22 [INFO] [berlingo] [SEARCH] 35 annonces recuperees (total: 280)
2026-04-22 08:07:22 [INFO] [berlingo] [SEARCH] Recuperation de la page 9 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=9
2026-04-22 08:07:29 [INFO] [berlingo] [SEARCH] 35 annonces recuperees (total: 315)
2026-04-22 08:07:29 [INFO] [berlingo] [SEARCH] Recuperation de la page 10 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=10
2026-04-22 08:07:33 [INFO] [berlingo] [SEARCH] 35 annonces recuperees (total: 350)
2026-04-22 08:07:33 [INFO] [berlingo] [SEARCH] Recuperation de la page 11 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=11
2026-04-22 08:07:38 [INFO] [berlingo] [SEARCH] 24 annonces recuperees (total: 374)
2026-04-22 08:07:38 [INFO] [berlingo] [SEARCH] Recuperation de la page 12 avec l'URL: https://www.leboncoin.fr/recherche?category=5&text=berlingo+xl&u_utility_brand=CITROEN&u_utility_model=CITROEN_Berlingo&page=12
2026-04-22 08:07:39 [INFO] [berlingo] [SEARCH] Page 12 : aucune annonce, arret de la pagination.
2026-04-22 08:07:39 [INFO] [berlingo] [SEARCH] Termine : 374 annonces au total dans /home/ubuntu/app/leboncoin_ads_berlingo_20260422_080655.csv
2026-04-22 08:07:40 [INFO] [berlingo] [SEARCH] CSV : leboncoin_ads_berlingo_20260422_080655.csv
2026-04-22 08:07:40 [INFO] [berlingo] [IMPORT] $ /home/ubuntu/app/.venv/bin/python -m db.migrate_csv --input /home/ubuntu/app/leboncoin_ads_berlingo_20260422_080655.csv --db /home/ubuntu/app/db/lbc.sqlite --model berlingo
2026-04-22 08:07:40 [INFO] [berlingo] [IMPORT] Model override : berlingo
2026-04-22 08:07:40 [INFO] [berlingo] [IMPORT] MIGRATION CSV -> SQLite unifie
2026-04-22 08:07:40 [INFO] [berlingo] [IMPORT] Fichier: leboncoin_ads_berlingo_20260422_080655.csv
2026-04-22 08:07:40 [INFO] [berlingo] [IMPORT] Schéma initialisé dans /home/ubuntu/app/db/lbc.sqlite
2026-04-22 08:07:40 [INFO] [berlingo] [IMPORT] 374 lus, 374 inseres, 0 ignores, 0 erreurs
2026-04-22 08:07:40 [INFO] [berlingo] [IMPORT] TOTAL : 374 lus, 374 inseres — Base : /home/ubuntu/app/db/lbc.sqlite
2026-04-22 08:07:40 [INFO] [berlingo] [IMPORT] 13972 annonces en base
2026-04-22 08:07:40 [INFO] [berlingo] [AVAILABILITY] $ /home/ubuntu/app/.venv/bin/python /home/ubuntu/app/scripts/check_availability.py --csv /home/ubuntu/app/leboncoin_ads_berlingo_20260422_080655.csv --brand citroen --model berlingo --db /home/ubuntu/app/db/lbc.sqlite
2026-04-22 08:07:40 [INFO] [berlingo] [AVAILABILITY] CHECK DISPONIBILITE — CSV: leboncoin_ads_berlingo_20260422_080655.csv, Brand: citroen, Model: berlingo
2026-04-22 08:07:40 [INFO] [berlingo] [AVAILABILITY] 372 list_id lus dans le CSV.
2026-04-22 08:07:40 [INFO] [berlingo] [AVAILABILITY] 380 annonces actives en base pour citroen berlingo.
2026-04-22 08:07:41 [INFO] [berlingo] [AVAILABILITY] 8 annonce(s) marquées indisponibles.
2026-04-22 08:07:41 [INFO] [berlingo] [AVAILABILITY] CSV: 372, Actives DB: 380, Absentes: 8
2026-04-22 08:07:41 [INFO] [berlingo] [AVAILABILITY] Marquees indisponibles: 8
2026-04-22 08:07:41 [INFO] [berlingo] [DETAIL] $ /home/ubuntu/app/.venv/bin/python -m crawler.leboncoin_ad_detail --model berlingo --delay 0.5 --limit 200
2026-04-22 08:07:41 [INFO] [berlingo] [DETAIL] ENRICHISSEMENT AD DETAIL — Modele: berlingo — Limite: 200
2026-04-22 08:07:41 [INFO] [berlingo] [DETAIL] Schéma initialisé dans /home/ubuntu/app/db/lbc.sqlite
2026-04-22 08:07:41 [INFO] [berlingo] [DETAIL] 5 annonce(s) à enrichir (modèle: berlingo)
2026-04-22 08:07:49 [INFO] [berlingo] [DETAIL] RESULTAT : 5 traitee(s), 5 enrichies, 0 introuvables, 0 erreurs
2026-04-22 08:07:49 [INFO] [berlingo] [STATS] $ /home/ubuntu/app/.venv/bin/python -m stats.main --model berlingo --skip-plots
2026-04-22 08:07:50 [INFO] [berlingo] [STATS] ANALYSEUR LEBONCOIN — Base: /home/ubuntu/app/db/lbc.sqlite, Figures: /home/ubuntu/app/stats/berlingo/figures, Modele: berlingo, Graphiques: Non
2026-04-22 08:07:53 [INFO] [berlingo] [STATS] Using categorical units to plot a list of strings that are all parsable as floats or dates. If these strings should be plotted as numbers, cast to the appropriate data type before plotting.
2026-04-22 08:07:53 [INFO] [berlingo] [STATS] Using categorical units to plot a list of strings that are all parsable as floats or dates. If these strings should be plotted as numbers, cast to the appropriate data type before plotting.
2026-04-22 08:07:54 [INFO] [berlingo] [STATS] M05 — Extraction LLM des titres (GPT-5 Nano)
2026-04-22 08:07:54 [INFO] [berlingo] [STATS] Annonces sans evaluation LLM : 5
2026-04-22 08:08:28 [INFO] [berlingo] [STATS] HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"
2026-04-22 08:08:28 [INFO] [berlingo] [STATS] LLM OUTPUT batch 1/1: 5 resultats extraits (modele=gpt-5-nano)
2026-04-22 08:08:28 [INFO] [berlingo] [STATS] Resultats extraits : 5
2026-04-22 08:08:29 [INFO] [berlingo] [STATS] Evaluations inserees : 5
2026-04-22 08:08:29 [INFO] [berlingo] [STATS]   stats_descriptives : 5 lignes insérées
2026-04-22 08:08:29 [INFO] [berlingo] [STATS]   modele_regression : 2 lignes insérées
2026-04-22 08:08:29 [INFO] [berlingo] [STATS]   referentiel_prix : 67 segments insérés
2026-04-22 08:08:29 [INFO] [berlingo] [STATS]   ads.deal_columns : 788 annonces mises à jour
2026-04-22 08:08:29 [INFO] [berlingo] [STATS] M06 — Extraction LLM des descriptions (GPT-5 Nano)
2026-04-22 08:08:29 [INFO] [berlingo] [STATS] Schéma initialisé dans /home/ubuntu/app/db/lbc.sqlite
2026-04-22 08:08:29 [INFO] [berlingo] [STATS] Champs actifs : 8
2026-04-22 08:08:29 [INFO] [berlingo] [STATS] Annonces Excellente/Bonne affaire sans analyse description : 1
2026-04-22 08:08:29 [INFO] [berlingo] [STATS] ━━━ LLM DESC SYSTEM PROMPT ━━━
Tu es un expert automobile français. On te donne des descriptions d'annonces de véhicules d'occasion avec leur identifiant.

Pour chaque annonce, extrais depuis la description les informations suivantes :
- courroie_changee : true si la courroie de distribution a été changée ou remplacée, false si explicitement non changée, null si non mentionné
- embrayage_change : true si l'embrayage est neuf ou a été remplacé, false si explicitement non changé, null si non mentionné
- travaux_recents : liste des travaux ou réparations récentes mentionnés dans la description (ex: 'freins refaits', 'pneus neufs', 'vidange faite'). Liste vide si aucun.
- negociabilite : négociable si le vendeur indique être ouvert aux offres, ferme si le prix est indiqué ferme, null si non mentionné
- contexte_vente : contexte notable de la vente s'il est mentionné (ex: 'urgent', 'déménagement', 'décès', 'achat neuf'). null si rien de notable
- nb_proprietaires : nombre de propriétaires du véhicule si mentionné (ex: 1 pour '1ère main', 2 pour '2ème main'). null si non mentionné
- options_description : liste des équipements et options cités dans la description (ex: 'GPS', 'Caméra recul', 'Clim auto', 'Toit ouvrant'). Liste vide si aucun.
- accidente : true si le véhicule a subi un accident, un choc, une collision, des airbags déclenchés ou une carrosserie endommagée mentionné explicitement. false si le vendeur indique explicitement non accidenté ou sans accident. null si non mentionné.

Règles :
- Extrais UNIQUEMENT ce qui est explicitement dans la description
- Ne déduis pas, n'invente pas
- Pour les champs de type liste, retourne une liste vide si rien n'est mentionné
- Conserve le list_id exact tel que fourni
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2026-04-22 08:08:29 [INFO] [berlingo] [STATS] ━━━ LLM DESC INPUT batch 1/1 (1 annonces) ━━━
3142116979: "Citroen BERLINGO VAN XL 950KG BLUEHDI 100CH PACK PREMIUM CONNECT 2 PLACES RARE, (Fourgonnette), BLANC, 5cv, 4 portes, mise en circulation le 18-12-2023, garantie 3 mois (3 MOIS OU 5000 KM).  2 places, longueur : 4,75 mètres, boîte de vitesse : manuelle  OPTIONS ET EQUIPEMENTS :  Autres équipements et informations : - Le prix affiché est TTC et la TVA est récupérable Nombreux modèles en stock: kangoo partner proace connect doblo caddy nv combo... Pose d'une galerie ou d'un attelage sur demande Pour voir l'ensemble de nos véhicules cliquez sur le logo  Kilométrage garanti.  Référence annonce : 3122"
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2026-04-22 08:08:44 [INFO] [berlingo] [STATS] HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"
2026-04-22 08:08:44 [INFO] [berlingo] [STATS] ━━━ LLM DESC OUTPUT batch 1/1 (1 résultats, modèle=gpt-5-nano) ━━━
[
  {
    "list_id": "3142116979",
    "courroie_changee": null,
    "embrayage_change": null,
    "travaux_recents": [],
    "negociabilite": null,
    "contexte_vente": null,
    "nb_proprietaires": null,
    "options_description": [
      "PACK PREMIUM CONNECT",
      "galerie",
      "attelage"
    ],
    "accidente": null
  }
]
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2026-04-22 08:08:44 [INFO] [berlingo] [STATS] Batch persisté : 1 évaluation(s) sauvegardée(s)
2026-04-22 08:08:44 [INFO] [berlingo] [STATS] Évaluations insérées : 1
2026-04-22 08:08:44 [INFO] [berlingo] [STATS] ANALYSE TERMINEE en 39.2s — 788 annonces (run #734) — Modele: berlingo
2026-04-22 08:08:45 [INFO] [berlingo] [LLM] $ /home/ubuntu/app/.venv/bin/python -m stats.m05_llm_title_analysis --model berlingo
2026-04-22 08:08:45 [INFO] [berlingo] [LLM] M05 — Extraction LLM des titres (GPT-5 Nano)
2026-04-22 08:08:45 [INFO] [berlingo] [LLM] Annonces sans evaluation LLM : 0
2026-04-22 08:08:45 [INFO] [berlingo] [LLM] Toutes les annonces ont deja ete analysees.
2026-04-22 08:08:45 [INFO] [berlingo] [LLM DESC] $ /home/ubuntu/app/.venv/bin/python -m stats.m06_llm_description_analysis --model berlingo
2026-04-22 08:08:46 [INFO] [berlingo] [LLM DESC] M06 — Extraction LLM des descriptions (GPT-5 Nano)
2026-04-22 08:08:46 [INFO] [berlingo] [LLM DESC] Schéma initialisé dans /home/ubuntu/app/db/lbc.sqlite
2026-04-22 08:08:46 [INFO] [berlingo] [LLM DESC] Champs actifs : 8
2026-04-22 08:08:46 [INFO] [berlingo] [LLM DESC] Annonces Excellente/Bonne affaire sans analyse description : 0
2026-04-22 08:08:46 [INFO] [berlingo] [LLM DESC] Toutes les annonces éligibles ont déjà été analysées.