Intelligence des documents
Êtes-vous un organisme ou gouvernement avec des données que vous croyiez structurées, mais qui ne le sont finalement pas tant que ça?

consultation, rédaction, recherche et développement | technologies sobres | intelligence naturelle
Êtes-vous un organisme ou gouvernement avec des données que vous croyiez structurées, mais qui ne le sont finalement pas tant que ça?

Êtes-vous une collectivité qui veut rendre vos données géomatiques et réglementaires accessibles, compréhensibles et utiles au public ou même simplement à vous-même?

Êtes-vous une communauté linguistique minoritaire? Avez-vous besoin de modèles et d’outils pour documenter, enseigner, et faire vivre votre langue à l’ère numérique?

25 févr. 2026
Si vous voulez fouiller dans un PDF pour en extraire des metadonnées, des images, et même du texte, j’ai des superbes logiciels libres pour vous: PLAYA-PDF et PAVÉS. Et si vous avez besoin d’un consultant pour vos besoins d’intelligence documentaire je suis disponible pour des contrats! [lire la suite]
14 janv. 2025
Nous allons voir ici comment utiliser des modèles de vision computationelle pour faire de l’analyse de mise en page d’un PDF et en extraire les titres de sections, alinéas, listes, et tableaux. Pour ce faire, on fera appel à la logithèque libre Transformers et les modèles de vision docling-ibm-models. [lire la suite]
14 janv. 2025
Comme mentionné dorénavant, le format PDF est un format de présentation, à la différence du HTML par exemple, qui sépare dans la mésure du possible la structure sémantique du texte et sa mise en page. [lire la suite]
Formé d‘abord en linguistique, je cumule plus que 25 ans d’expérience professionnelle en traitement automatique du langage naturel et compréhension de la parole. En cours de route, j’ai développé des compétences diversifiées en informatique, surtout dans le domaine du logiciel libre, en tant que chargé d’entretien et collaborateur sur divers projets.