VoiceFlow

Automatización Personal de Voz a Notion (Construido para Mí Mismo)

10 horas/semana ahorradas • Captura ideas sin escribir

Las ideas vienen mientras camino. Escribir en el teléfono mata el impulso. Construí VoiceFlow: habla al bot de Telegram → IA transcribe, determina si es tarea/idea/nota, lo pone en la base de datos correcta de Notion con etiquetas. 15 segundos total. Uso 10-15 veces al día. Ahorré 10 horas/semana (sin organización manual).

Antes/Después

Antes: Idea mientras camino → grabar nota de voz → olvidar transcribir → se queda en el teléfono para siempre → idea perdida

Después: Digo "Necesito terminar los docs de HealthRAG para el viernes" → 15 segundos → aparece en el Gestor de Tareas de Notion con etiqueta #healthrag y fecha límite del viernes → realmente se hace

Impacto: 10-15 capturas/día. 95% precisión de transcripción. 90% precisión de enrutamiento (base de datos correcta). 10 horas/semana ahorradas. Cero organización manual.

Cómo Funciona

Paso 1: Caminando, llega una idea. Abro Telegram, mantengo presionado el botón de grabar, hablo: "Construir app de meditación para ansiedad por el teléfono"

Paso 2: La IA transcribe tu voz. Otra IA lo lee, piensa: "¿Es esto una tarea por hacer? ¿O solo una idea para quizás hacer algún día?" Decide que es una idea. Extrae temas clave: meditación, ansiedad por el teléfono.

Paso 3: Crea una página en la base de datos de "Ideas" de Notion. Añade etiquetas #meditación #ansiedad. Añade la transcripción completa. Todo en 15 segundos.

Resultado: Volcado mental → entrada organizada, buscable y etiquetada en Notion. Cero escritura. Funciona mientras caminas, conduces, donde sea.

Arquitectura Técnica

1. Pipeline de Procesamiento de Voz:

  • El bot de Telegram recibe mensaje de voz (cualquier duración, cualquier calidad)
  • Audio reenviado a OpenAI Whisper API para transcripción
  • Devuelve transcripción de texto con marcadores de tiempo
  • Maneja múltiples idiomas, acentos, ruido de fondo

2. Clasificación de Intención con IA (Claude):

  • Claude analiza la transcripción para significado semántico e intención
  • Clasifica en tipos de contenido: Tarea, Proyecto, Idea, Reflexión, Nota
  • Extrae entidades: personas mencionadas, proyectos referenciados, fechas límite establecidas
  • Genera etiquetas relevantes automáticamente desde los temas del contenido
  • Determina urgencia/prioridad para tareas

3. Lógica de Enrutamiento Inteligente:

  • Árbol de decisión basado en la clasificación de Claude
  • Mapea tipos de contenido a bases de datos específicas de Notion
  • Maneja casos ambiguos: "Esto podría ser tanto tarea como idea" → crea entradas en ambas
  • Respeta señales explícitas del usuario: "Añadir a proyectos:" fuerza enrutamiento a proyecto

4. Integración con Notion API:

  • Crea página en la base de datos apropiada con propiedades estructuradas
  • Establece título (extraído de la transcripción o resumen generado por IA)
  • Puebla campos de metadatos: etiquetas, fechas, categorías, prioridades
  • Añade transcripción completa en el cuerpo de la página para contexto
  • Vincula a páginas relacionadas si se identifican conexiones

5. Enriquecimiento de Metadatos:

  • Etiquetado Automático: La IA extrae temas (ej., "sistemas RAG," "productividad," "salud")
  • Contexto de Marca de Tiempo: Captura cuándo ocurrió el pensamiento
  • Vinculación de Proyectos: Si menciona proyecto existente, crea relación en Notion
  • Detección de Prioridad: "Esto es urgente" → bandera de alta prioridad
  • Inferencia de Categoría: Coloca en estructura de categoría relevante

Qué lo Hace Especial

No solo transcribe — entiende la intención. "Quizás llamar a John la próxima semana" se convierte en una tarea con fecha límite inferida, no solo texto. Maneja habla casual ("eh", "como que", "ya sabes") y aún así lo estructura apropiadamente.

Cifras Reales

Rendimiento:

  • 10-15 mensajes de voz diarios
  • ~10 horas/semana ahorradas (sin transcripción manual ni organización)
  • 95%+ precisión de transcripción (Whisper)
  • 90%+ precisión de enrutamiento (base de datos correcta de Notion)
  • 10-15 segundos por mensaje (voz → entrada organizada en Notion)

Lo Que Realmente Cambió:

  • Antes: Olvidaba la mayoría de las ideas porque escribir en el teléfono era demasiada fricción
  • Ahora: Todo se captura — ideas mientras camino, tareas durante el viaje, pensamientos aleatorios
  • Todas las ideas son buscables en Notion con etiquetas y categorías apropiadas
  • Libertad mental: sé que el sistema organizará todo, así que simplemente hablo

Flujo de Trabajo:

  • Antes: Idea → quizás nota de voz → olvidar → perdida
  • Después: Idea → hablar al bot → auto-organizado en Notion → realmente usarlo después

Valor y Escala

Resuelto para: 1 persona (yo mismo) que piensa mientras camina

Mercado potencial: Cualquiera usando Notion/herramientas de productividad (100M+ usuarios). Cualquiera que tenga ideas lejos del escritorio. Trabajadores del conocimiento, creadores, emprendedores.

Tiempo ahorrado: 10 horas/semana organizando notas = 520 horas/año. A valor de $50/hora = $26,000/año de tiempo recuperado.

Insight clave: La mayoría de las ideas mueren no porque sean malas, sino porque la fricción para capturarlas es demasiado alta. La voz elimina la fricción completamente.

Habilidades Demostradas

  • Integración de IA de Voz (Whisper API)
  • NLP y Clasificación de Intención (Claude)
  • Automatización de Flujo de Trabajo y Enrutamiento Inteligente
  • Integración con Notion API y Gestión de Bases de Datos
  • Extracción de Metadatos y Auto-Etiquetado
  • Diseño de Producto para Captura Sin Fricción
  • Arquitectura de Sistema de Gestión del Conocimiento
  • Pipelines de Procesamiento en Tiempo Real

Stack Técnico

Tecnologías: Python, aiogram (Telegram), OpenAI Whisper, Claude 3.5 Sonnet, Notion API, n8n (lógica de enrutamiento)

Procesamiento: Voz → Texto → Clasificación → Enrutamiento → Entrada Estructurada en Notion (10-15 segundos de extremo a extremo)

Complejidad: 7/10 (integración multi-API, NLP, lógica de enrutamiento, extracción de metadatos)