Visión
Analiza fotos con IA
Incluido
Mandas una foto y tu MONO la analiza. Identifica productos, lee texto, describe escenas, extrae datos.
Sobre esta skill
Visión usa modelos multimodales para entender imágenes. Puede leer recibos, identificar productos para buscar precios, extraer texto de documentos fotografiados, describir escenas, y más.
Qué incluye
OCR — extrae texto de fotos
Identifica productos y busca precios
Lee recibos y tickets
Describe escenas e imágenes
Así se ve en acción
Cómo funciona en 3 pasos
- 1 Le escribes a tu MONO por WhatsApp — por texto, voz o foto.
- 2 MONO usa esta skill y ejecuta la tarea por ti.
- 3 Te responde en segundos con el resultado.
Preguntas frecuentes
¿Cómo funciona Visión en MONO?
Visión usa modelos multimodales para entender imágenes. Puede leer recibos, identificar productos para buscar precios, extraer texto de documentos fotografiados, describir escenas, y más.
¿Cuánto cuesta Visión?
Visión está incluido gratis en todos los planes de MONO.
¿Visión funciona en WhatsApp?
Sí. Visión funciona directamente desde WhatsApp, Telegram y Discord. Solo mandas un mensaje a tu MONO y él se encarga.