Guide d'installation
Prérequis
- Environnement Linux ou Windows Subsystem for Linux (WSL).
L'outil a été testé sur Ubuntu 20.04 et Windows Subsystem for Linux (WSL) avec Ubuntu 20.04.
Installation commune: Ubuntu (natif ou Windows Subsystem for Linux)
Dans le terminal WSL (ou l'invite de commande Ubuntu):
-
Installer le modèle de Tesseract pour le français
sudo apt update
sudo apt install tesseract-ocr-fra
-
curl -L -O "https://github.com/conda-forge/miniforge/releases/latest/download/Mambaforge-$(uname)-$(uname -m).sh"
bash Mambaforge-$(uname)-$(uname -m).sh
-
Créer un environnement virtuel conda à partir du fichier de spécifications
environment-prod.yml
sh mamba env create --file environment-prod.yml
-
Installer ocrmypdf (maintenant que ses dépendances ont été installées à la création de l'environnement).
conda activate geo-arretes
# installer ocrmypdf qui ne pouvait pas être installé en même temps que ses dépendances...
mamba install ocrmypdf
# depuis le dossier où se trouve le code source du projet
pip install -e .
# désactiver et réactiver l'environnement virtuel car tesseract, installé par ocrmypdf,
# a déposé ses fichiers de langage dans un sous-dossier
# `$HOME/mambaforge/envs/geo-arretes/share/tessdata`
# (sinon ils ne seront visibles...)
conda deactivate
Résolution de problèmes
WSL sur Windows Server 2019
Sur des serveurs Windows 2019 ou plus anciens, il peut être nécessaire d'installer le WSL via une procédure manuelle décrite ici.
En résumé il faut :
- Activer la fonctionnalité Windows "Windows Subsystem for Linux" via la commande
Enable-WindowsOptionalFeature -Online -FeatureName Microsoft-Windows-Subsystem-Linux
. Un redémarrage du système est nécessaire. - Télécharger la distribution Ubuntu 20.04
- Renommer le fichier
.AppxBundle
téléchargé en.zip
:Rename-Item .\CanonicalGroupLimited.UbunutuonWindows_2004.2021.825.0.AppxBundle .\ubuntu.zip
- Extraire le fichier zip dans un dossier
ubuntu
:Expand-Archive .\ubuntu.zip .\ubuntu
- Se déplacer dans le dossier
ubuntu
:cd .\ubuntu
- Lancer l'archive correspondant à votre architecture (par exemple, x64) :
Expand-Archive .\Ubuntu_2004.2021.825.0_x64.zip .\ubuntu
- Ajouter le dossier
Ubuntu
à la variable d'environnementPATH
:$userenv = [System.Environment]::GetEnvironmentVariable("Path", "User")
puis[System.Environment]::SetEnvironmentVariable("PATH", $userenv + ";D:\Logiciels\Ubuntu\Ubuntu", "User")
- Redémarrer le terminal PowerShell, l'ouvrir en tant qu'administrateur
- Lancer le fichier
ubuntu.exe
contenu dans le dossierUbuntu
:.\ubuntu\ubuntu\ubuntu.exe
Erreur lors de l'installation de paquets
A la création de l'environnement conda, si l'installation d'un paquet échoue avec une erreur étrange, eg. le paquet vs2015_runtime
, suivre la procédure dans https://stackoverflow.com/a/65728405