Index
Analyse et géolocalisation des arrêtés de périls sur le territoire de la métropole Aix-Marseille Provence.
Installation
Veuillez suivre les instructions du guide d'installation.
Utilisation
Lancement du script
Dans le terminal WSL (ou l'invite de commande Ubuntu):
Les dossier d'entrées et de sorties sont configurables dans le fichier scripts/process.sh
.
conda activate geo-arretes
scripts/process.sh
Plusieurs scripts sont définis pour faciliter certaines actions : scripts.
Planification de tâches
Le script runner.bat est un exemple de script permettant de lancer le script process.sh
(présent dans le WSL) depuis le Task Scheduler de Windows.
Logs
Deux types de logs sont disponibles :
batch-logs
: dans le dossierbatch-logs
sont stockés un court état des lieux de chaque lancé de script.logs
: dans le dossierlogs
sont stockés les logs détaillés de chaque traitement dans le pipeline du scriptprocess.sh
.
Documentation
La documentation générée à partir du code source est disponible à l'adresse suivante : https://geo-arretes.github.io/geo-arretes/.
Elle utilise mkdocs et mkdocstrings pour automatiquement générer la documentation à partir des docstrings des fonctions et des classes du code source.
pip install mkdocs==1.5.3 mkdocstrings==0.23.0 mkdocs-material==9.5.10
Pour prévisualiser la documentation localement, il suffit d'utiliser la commande suivante :
mkdocs serve
La documentation est alors accessible par défaut à l'adresse suivante : http://127.0.0.1:8000/
Pour déployer la documentation sur une branche, il suffit d'utiliser la commande suivante :
mkdocs gh-deploy
Cela déploiera la documentation sur la branche gh-pages
du dépôt, qui est automatiquement servie par GitHub Pages.
Project layout
data/ # Datasets
raw/ # The original, immutable data dump.
processed/ # The final, canonical data sets for modeling.
interim/ # Intermediate data that has been transformed.
external/ # Data from third party sources.
docs/ # Documentation
index.md # The documentation homepage.
... # Other markdown pages, images and other files .
... # that follow the same structure as the project.
notebooks/ # Jupyter notebooks to explore the data and the code.
explore_actes.ipynb
test_pds_image.ipynb
src/ # Source code of this project.
domain_knowledge/ # Regex pattern and dictionaries used for data extraction.
preprocess/ # Functions for preprocessing PDF files.
process/ # Functions for processing PDF files.
quality/ # Functions for quality control.
utils/ # Utility functions.
.gitignore # Specifies intentionally untracked files to ignore.
environment-prod.yml # Conda environment file for production.
environment.yml # Conda environment file for development.
LICENSE # MIT Licence.
README.md # The top level README for developers using this project.
setup.py # Make this project pip installable with `pip install -e`