Le XVIIe siècle est crucial pour la langue française, car il voit la création d’une norme orthographique stricte qui perdure en grande partie jusqu’à nos jours. Malgré son importance, l’histoire des systèmes orthographiques reste toutefois une zone négligée en linguistique pour deux raisons. D’une part, l’orthographe est constituée de microchangements qui nécessitent une approche quantitative, et d’autre part, aucun corpus n’est disponible en raison des interventions des éditeurs dans presque tous les textes déjà accessibles. Dans cet article, nous proposons donc un nouveau corpus permettant une telle étude, ainsi que les outils d’extraction et d’analyse nécessaires à notre recherche. En comparant le texte extrait par OCR avec une version alignée automatiquement sur l’orthographe contemporaine du français, nous extrayons les zones de variantes, nous catégorisons ces variantes et nous étudions leur fréquence afin d’analyser le changement (ortho)graphique au cours du XVIIe siècle.