LangMentor

Un Bot que Aprende de Mis Errores y se Convierte en Tutor Eficaz

El Problema

No puedo permitirme clases regulares con tutores, y no tengo tiempo para escuelas de idiomas. Además, su formato no siempre es efectivo. Por eso construí un sistema para mí mismo que aprende de mis errores y fortalezas, me entrena con repetición espaciada, rastrea mi progreso automáticamente y elige temas diarios para mí.

Antes / Después

Antes: Un tutor dos veces por semana → $240/mes → avanzamos página por página en el libro de texto → sin seguimiento de qué se me complica exactamente. Se toman notas, pero el objetivo es terminar el libro.

Después: Práctica diaria en Telegram → $4/mes → la IA nota que confundo "el subjuntivo después de expresiones de emoción" → gradualmente genera 20 ejercicios más dirigidos exactamente a eso → finalmente lo domino.

Base del bot: 4 libros de texto digitalizados (A1–B2 para Español/Inglés), 2300+ ejercicios. 95% de precisión detectando mis puntos débiles. Práctica en cualquier lugar, en cualquier momento. Principalmente para obtener teoría verificada y cubrir todo el rango de A1 a B2.

Cómo Funciona

Paso 1: El bot de Telegram envía un ejercicio de un libro de texto digitalizado. "Completa: Espero que tú ___ (venir) mañana."

Paso 2: Respondes. La IA verifica al instante. Si hay un error, lo guarda con contexto (qué regla, qué tipo de error).

Paso 3: Después de 10 errores con el subjuntivo, la IA ve un patrón y da MÁS práctica exactamente sobre ese tema. Espacía los ejercicios en el tiempo (olvidas → repasas → recuerdas mejor).

Resultado: Práctica ilimitada precisamente en lo que es difícil para ti personalmente. No son "lecciones talla única." Cuando se acaban las tareas del libro, la IA genera nuevas de diferentes tipos, adaptadas a tus puntos débiles.

Arquitectura Técnica

1. Pipeline de Digitalización de Contenido:

  • OCR + corrección manual de 4 libros de texto completos
  • Extracción por IA de teoría, glosarios, reglas gramaticales y ejercicios
  • Estructura YAML: cada lección tiene metadatos, objetivos, secciones de contenido, tipos de ejercicios. 500+ unidades
  • Sistema de triple verificación: si Claude y GPT coinciden, la respuesta es inequívocamente correcta; si difieren, se llama a Opus 4.1 para re-verificación. Todas las variantes se almacenan y muestran al usuario. De 2300+ sub-ejercicios, solo 73 requirieron triple verificación
  • Control de calidad: comparación del contenido extraído con la fuente

2. Almacenamiento y Entrega de Lecciones:

  • PostgreSQL almacena el contenido de las lecciones, mi progreso y tareas completadas
  • Los archivos YAML de lecciones se analizan dinámicamente al solicitar un tema
  • Interfaz de Telegram para aprendizaje fluido desde el móvil
  • Soporte para notificaciones push (recordatorios diarios) y modo pull (sesiones autoiniciadas)

3. Seguimiento de Errores y Memoria Vectorial:

  • Cada respuesta se guarda con metadatos: tipo de pregunta, tema, concepto gramatical, vocabulario
  • Los errores se incrustan con OpenAI embeddings y se almacenan en Qdrant
  • La búsqueda por similitud identifica errores relacionados: "problemas con el subjuntivo en tiempos pasados"
  • El sistema construye un perfil detallado de mis errores a lo largo del tiempo

4. Motor de Aprendizaje Adaptativo:

  • Analiza patrones de errores: qué reglas, qué temas léxicos, qué tipos de ejercicios
  • Calcula confianza por tema (0–100%) basándose en resultados recientes
  • Asigna más práctica a temas de baja confianza (repetición espaciada)
  • Reduce frecuencia para conceptos dominados (>90% de precisión en varias sesiones)

5. Generación de Ejercicios con IA:

  • Cuando se agotan las tareas del libro para un tema, la IA crea ejercicios análogos
  • Claude para generación compleja (traducciones, ensayos)
  • GPT-4o-mini para ejercicios simples (rellenar espacios, conjugaciones)
  • Control de calidad: alineación con el nivel de dificultad del libro

6. Optimización de Costos con Múltiples Modelos:

  • Verificación de Ejercicios: GPT-4o-mini (económico y rápido) para respuestas objetivas (rellenar espacios, opción múltiple)
  • Verificación de Traducciones: GPT-4 para evaluación matizada
  • Explicaciones Gramaticales: Claude 3.5 Sonnet para explicaciones detalladas, estilo profesor
  • Generación de Ejercicios: GPT-4o-mini para simples, Claude para tareas complejas
  • Costo actual: ~$4/mes (dependiendo del uso)

Por Qué Funciona

La IA rastrea errores que no notas conscientemente. El sistema descubrió que estaba fallando en "el subjuntivo después de expresiones de emoción" — yo pensaba que simplemente "era malo con el subjuntivo en general." La práctica dirigida resolvió el problema real.

Cifras Reales

Rendimiento:

  • 4 libros de texto digitalizados, 2300+ sub-ejercicios
  • $4/mes versus $240/mes por un tutor
  • Retroalimentación instantánea en lugar de esperar la próxima clase
  • 95%+ de precisión detectando temas débiles

Lo Que Realmente Cambió:

  • Antes: 1–2 clases por semana, caro, programa lineal
  • Después: práctica diaria adaptada a MIS errores, tareas ilimitadas
  • El sistema detecta patrones de los que no era consciente
  • Puedo estudiar vía Telegram en cualquier lugar, sin horarios

Valor y Escala

Resuelve el problema para: 1 persona (yo) aprendiendo Español/Inglés con presupuesto ajustado

Mercado potencial: 1.5 mil millones de estudiantes de idiomas, 50M en Duolingo (demasiado superficial), millones no pueden pagar tutores a $50/hora

Economía unitaria: $4/mes vs. $240/mes con un humano. Contenido educativo profesional (no "gamificación por gamificar"). La IA encuentra patrones de errores que no notas.

Qué cambió: El sistema expuso "el subjuntivo después de expresiones de emoción" — un patrón del que no tenía idea. Ahora estudio en cualquier lugar vía Telegram, sin horarios.

Stack Tecnológico

Tecnologías: Python, aiogram (Telegram), Claude 3.5 Sonnet, GPT-4, GPT-4o-mini, Qdrant, OpenAI Embeddings, PostgreSQL, YAML

Contenido: 4 libros de texto digitalizados, 2300+ sub-ejercicios estructurados

Complejidad: 8/10 (extracción de contenido, algoritmos adaptativos, enrutamiento multi-modelo)