Una aplicación innovadora que permite realizar consultas en lenguaje natural sobre una base de datos de imágenes MongoDB, utilizando modelos de lenguaje avanzados para convertir texto plano en consultas de base de datos optimizadas.
Pregunta en español o inglés sobre tus imágenes usando frases naturales como "¿Cuántas fotos tengo tomadas en 2024?"
El sistema identifica automáticamente si deseas contar elementos, listar resultados o buscar información específica.
Función avanzada que corrige automáticamente errores comunes en el JSON generado por IA.
Interfaz intuitiva desarrollada en PyQt6 con funciones avanzadas de gestión de texto.
Las respuestas se adaptan al contexto: conteos concisos, listas organizadas, búsquedas detalladas.
Todas las consultas se guardan automáticamente en archivos de texto organizados por fecha.
El sistema trabaja con una base de datos MongoDB llamada "album_2" con una colección "imagenes" que contiene información detallada sobre cada imagen:
nombre_archivo: Nombre del archivo de la imagenruta_completa: Ubicación completa del archivoancho/alto: Dimensiones de la imagen en píxelesfecha_creacion_*: Información temporal de creación (día, mes, año, hora, minuto)objetos_detectados: Array de objetos identificados por IA con porcentaje de confianzadescripcion: Descripción textual generada por IAvisto/descrito: Marcadores booleanos para gestión de estadohash_sha512: Hash para verificación de integridadDescargue e instale Ollama desde ollama.ai
⚠️ Asegúrese de que el modelo esté configurado con una ventana de contexto de 40,000 tokens.
Inicie el servicio MongoDB localmente en el puerto 27017 y asegúrese de tener la base de datos "album_2" con la colección "imagenes" poblada con datos de imágenes procesadas.
Área de entrada de texto donde puedes escribir tus preguntas en lenguaje natural.
Ejecuta la consulta actual y muestra los resultados formateados.
Activa/desactiva el guardado automático de consultas y respuestas en archivos.
Muestra los últimos archivos guardados y su ubicación en el sistema.
Menú avanzado para limpiar resultados, mantener encabezados, o eliminar consultas específicas.
Click derecho en el área de resultados para copiar, filtrar solo consultas/resultados, etc.
Ctrl+L: Limpiar el área de resultadosCtrl+H: Mostrar historial de consultasCtrl+S: Activar/desactivar auto-guardadoCtrl+Q: Salir de la aplicaciónTodas las consultas se guardan automáticamente en la carpeta consultas_imagenes/ con el siguiente formato:
consulta_YYYYMMDD_HHMMSS.txt: Consultas individuales con pipeline MongoDBsesion_completa_YYYYMMDD_HHMMSS.txt: Resumen completo de todas las consultas en una sesión© 2025 - Sistema desarrollado en Python como herramienta experimental de investigación en procesamiento de lenguaje natural aplicado a consultas de base de datos de imágenes. Versión beta con funcionalidades avanzadas en evolución constante.
ollama pull gemma3:4b para actualizar el modeloVisualiza el funcionamiento de la aplicación a través de estas capturas de pantalla que muestran diferentes aspectos del sistema de consulta semántica.
Interfaz principal de consulta
Resultado de búsqueda de imágenes
Procesamiento de consultas complejas
Resultado de consulta
Resultado de consulta
Menú de opciones