Projects with this topic
-
DocuMind es un sistema de organización automática de documentos para Linux desktop, impulsado por IA local (Ollama/Llama3 o HuggingFace). Procesa PDFs, imágenes, vídeos, audio y código: extrae texto/OCR, transcribe, analiza contenido y clasifica/archiva según ISO 15489 (facturas, legal, trabajo, personal, multimedia). Detecta duplicados, registra auditoría en SQLite y prioriza privacidad offline.
Desarrollada en Python 3.10+ con PyMuPDF, Tesseract, Vosk/Whisper, multiprocessing y optimizaciones (xxHash, caching, GPU), demuestra expertise en integración LLM locales/multimodales, procesamiento paralelo, arquitectura modular escalable y evolución hacia GUI PyQt6 con drag-and-drop, búsqueda full-text y empaquetado RPM/Flatpak. (612 caracteres)
Updated -
-
Jochre3 OCR engine with default implementation for Yiddish - completely new version of https://github.com/urieli/jochre
Updated -
-
Packaging n improving Linux tools for preprocessing images and helping the scanning and digitizing AI ...
2023 AI-Languages updates for Sino-Korean and Tibetan (following 2020-21 works on Ukraine reports, and Arabic texts)
Updated -
A microservice that renders templates the way you want. Scans/OCRs documents of many standard file types. Converts documents easily and creates thumbnails the way you want it.
Updated -